Thèse soutenue

Reconnaissance de formes et symboles graphiques complexes dans les images de documents

FR  |  
EN
Auteur / Autrice : Rashid Jalal Qureshi
Direction : Hubert CardotJean-Yves Ramel
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 04/03/2008
Etablissement(s) : Tours
Ecole(s) doctorale(s) : Ecole doctorale Santé, sciences, technologies (Tours)
Partenaire(s) de recherche : Equipe de recherche : Laboratoire d'Informatique Fondamentale et Appliquée de Tours (2012-...)
Laboratoire : École polytechnique universitaire (Tours)
Jury : Président / Présidente : Jean-Marc Ogier
Examinateurs / Examinatrices : Pierre Heroux, Josep Llados
Rapporteurs / Rapporteuses : Karl Tombre

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Ce travail de thèse se situe à la croisée de trois thématiques de recherche : la mise en place de représentations structurelles pour décrire le contenu d’images de documents, la reconnaissance structurelle des formes et graphiques complexes et la localisation des symboles dans les images de documents. Pour répondre aux problématiques de l’analyse d’images de documents, nous avons choisi d’utiliser les graphes comme outils de représentation des contenus des images. La nouvelle représentation obtenue exploite un graphe multi-primitive et multi-attribut améliorant à la fois la tâche de localisation mais aussi la tâche de reconnaissance de formes graphiques contenues dans les documents. Une nouvelle approche générique et automatique est également présentée pour la localisation des symboles graphiques dans les images de documents. Notre approche de localisation des symboles nécessite un minimum de connaissances a priori sur les domaines ou sur le type de symboles présents dans les images. Concernant l’étape de reconnaissance, nous présentons trois stratégies originales pour la mise en correspondance de graphes, combinant les approches structurelle et statistique. Elles aident à la résolution du problème de complexité et évitent un temps de calcul exponentiel intolérable. Les nouvelles techniques d’appariement de graphes que nous proposons sont basées sur des fonctions de similarité qui tilisent aussi bien des valeurs numériques que symboliques pour produire un score. Ces mesures de similarité ont de nombreuses propriétés intéressantes comme un fort pouvoir discriminant, une invariance aux transformations affines et une faible sensibilité au bruit.