Fouille et classification de graphes. Application à la reconnaissance de symboles dans les documents techniques

par Eugen Barbu

Thèse de doctorat en Informatique

Sous la direction de Eric Trupin.

Soutenue en 2007

à Rouen .


  • Résumé

    Cette thèse apporte une contribution à la définition d’un système générique, adaptatif et non supervisé pour l’interprétation d’images de document en utilisant des techniques de fouille et de classification de graphes. La première partie traite de l’extraction de représentations structurelles d’images de document. La seconde partie propose la recherche de sous-graphes fréquents associés à des symboles graphiques lesquels sont à la base d’une représentation des documents par sac de symboles. La pertinence de cette représentation est évaluée sur des tâches de classification et d’indexation. La troisième partie propose d’adresser le problème de la complexité de la classification de graphes par l’usage de mesures de dissimilarité approximant la distance d’édition et par la réduction de bases d’apprentissage par génération de graphes prototypes par algorithmes génétiques. Les évaluations portent sur des bases synthétiques ainsi que sur des problèmes de reconnaissance de symboles graphiques.

  • Titre traduit

    Graph mining and classification : Application to symbol recognition in technical documents


  • Résumé

    This thesis brings a contribution to the design of a generic, adadtive and unsupervised system for document image understanding using graph mining and classification. The first part deals with the extraction of structural represesantations of document images. The second part proposes the searche of frequent subgraphs associated to graphic symbols. These are exploited to describe document images with a bag of symbol formalism. This representation is evaluated faced to classification and indexing tasks. The third part proposes to tackle the complexity problem of graph classification by using a dissimilarity measure which approximates the reference edit distance and by reducing the training set thanks to a prototype generation process based genetic algorithm. Evaluation have been performed on synthetic data and on graphic symbol recognition problems.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 180p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. 123 réf

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Rouen. Service commun de la documentation. Section sciences site Madrillet.
  • Disponible pour le PEB
  • Cote : 07/ROUE/S021(a)
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.