Soutenance d’HDR de Nicolas Ragot
Le 15/06/17 à 14h en salle Lovelace (Département informatique de Polytech Tours).
Titre : Contributions à la reconnaissance de formes et applications à l’analyse de l’écrit et des documents
Résumé de la soutenance :
Lors de cette soutenance d’Habilitation à Diriger des Recherches je présenterai une synthèse des travaux de recherche en reconnaissance de formes que j’ai pu effectuer jusqu’à présent. La problématique principalement abordée porte sur la robustesse des systèmes de reconnaissance, en particulier face à la variabilité des données, que celle-ci soit intrinsèque au problème ou bien liée à l’évolution du contexte de leur production ou de leur analyse. Pour répondre à cette problématique, j’aborde l’étude des systèmes de reconnaissance de formes en adoptant un point de vue systémique, c’est à dire en considérant la structure des systèmes, les interactions entre composants, ainsi que celles avec l’environnement dans lequel ils sont amenés à être intégrés. Cette approche permet à la fois d’obtenir des propriétés spécifiques, nécessaires à leur exploitation dans des cadres réels d’utilisation, tout en facilitant leur évolution au cours du temps et de leur usage, d’une part grâce à leur aspect modulaire et d’autre part grâce à la mise en place de méthodes d’adaptation ou d’apprentissage continu. Ces notions seront illustrées au cours de la présentation par des applications relatives à l’analyse de l’écrit et des images de document. Aussi, les thématiques traitant de l’adaptation au scripteur en reconnaissance d’écriture manuscrite et à la police en reconnaissance de textes imprimés, ainsi que les problématiques liées à la numérisation massive (qualité des transcriptions, indexation par repérage de mots dans les images – i.e. word spotting –, classification dans des flux de documents), seront-elles plus largement abordées.
Mots-clés : reconnaissance de formes, apprentissage incrémental, apprentissage continu, adaptation, approche systémique, classification mono-classe, reconnaissance d’écriture, analyse de documents, OCR, qualité de la numérisation, repérage de mots (word spotting)