Approche mixte pour la reconnaissance des documents imprimes
Auteur / Autrice : | Frank Lebourgeois |
Direction : | Hubert Emptoz |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique et Automatique Appliquées |
Date : | Soutenance en 1991 |
Etablissement(s) : | Lyon, INSA |
Partenaire(s) de recherche : | Laboratoire : RFD - Equipe de Reconnaissance de Forme et Diagnostique (Lyon, INSA1991-1994) |
Mots clés
Résumé
L'étude présente un système de reconnaissance multifonte pour documents imprimés, utilisant des informations contextuelles concernant la typographie, la structure du document et la syntaxe. Tout d'abord une méthode ascendante rapide a été réalisée pour séparer le texte des images et reconnaître la structure logique du document. Une approche mixte est utilisée pour reconnaître les caractères isolés. Le premier étage réalise une préclassification automatique des formes identiques de caractères à l' a. Ide d'une construction dynamique d'une bibliothèque de formes. La forte redondance des images des caractères imprimés justifie cette approche. Le second étage reconnaît structurellement les modèles de caractères construits précédemment. Un étage à la fois syntaxique et statistique permet un taux de reconnaissance élevé.