Reconnaissance de formes et symboles graphiques complexes dans les images de documents
Auteur / Autrice : | Rashid Jalal Qureshi |
Direction : | Hubert Cardot, Jean-Yves Ramel |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 04/03/2008 |
Etablissement(s) : | Tours |
Ecole(s) doctorale(s) : | Ecole doctorale Santé, sciences, technologies (Tours) |
Partenaire(s) de recherche : | Equipe de recherche : Laboratoire d'Informatique Fondamentale et Appliquée de Tours (2012-...) |
Laboratoire : École polytechnique universitaire (Tours) | |
Jury : | Président / Présidente : Jean-Marc Ogier |
Examinateurs / Examinatrices : Pierre Heroux, Josep Llados | |
Rapporteurs / Rapporteuses : Karl Tombre |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Ce travail de thèse se situe à la croisée de trois thématiques de recherche : la mise en place de représentations structurelles pour décrire le contenu d’images de documents, la reconnaissance structurelle des formes et graphiques complexes et la localisation des symboles dans les images de documents. Pour répondre aux problématiques de l’analyse d’images de documents, nous avons choisi d’utiliser les graphes comme outils de représentation des contenus des images. La nouvelle représentation obtenue exploite un graphe multi-primitive et multi-attribut améliorant à la fois la tâche de localisation mais aussi la tâche de reconnaissance de formes graphiques contenues dans les documents. Une nouvelle approche générique et automatique est également présentée pour la localisation des symboles graphiques dans les images de documents. Notre approche de localisation des symboles nécessite un minimum de connaissances a priori sur les domaines ou sur le type de symboles présents dans les images. Concernant l’étape de reconnaissance, nous présentons trois stratégies originales pour la mise en correspondance de graphes, combinant les approches structurelle et statistique. Elles aident à la résolution du problème de complexité et évitent un temps de calcul exponentiel intolérable. Les nouvelles techniques d’appariement de graphes que nous proposons sont basées sur des fonctions de similarité qui tilisent aussi bien des valeurs numériques que symboliques pour produire un score. Ces mesures de similarité ont de nombreuses propriétés intéressantes comme un fort pouvoir discriminant, une invariance aux transformations affines et une faible sensibilité au bruit.