Thèse soutenue

Approche mixte pour la reconnaissance des documents imprimes

FR  |  
EN
Auteur / Autrice : Frank Lebourgeois
Direction : Hubert Emptoz
Type : Thèse de doctorat
Discipline(s) : Informatique et Automatique Appliquées
Date : Soutenance en 1991
Etablissement(s) : Lyon, INSA
Partenaire(s) de recherche : Laboratoire : RFD - Equipe de Reconnaissance de Forme et Diagnostique (Lyon, INSA)

Résumé

FR  |  
EN

L'étude présente un système de reconnaissance multifonte pour documents imprimés, utilisant des informations contextuelles concernant la typographie, la structure du document et la syntaxe. Tout d'abord une méthode ascendante rapide a été réalisée pour séparer le texte des images et reconnaître la structure logique du document. Une approche mixte est utilisée pour reconnaître les caractères isolés. Le premier étage réalise une préclassification automatique des formes identiques de caractères à l' a. Ide d'une construction dynamique d'une bibliothèque de formes. La forte redondance des images des caractères imprimés justifie cette approche. Le second étage reconnaît structurellement les modèles de caractères construits précédemment. Un étage à la fois syntaxique et statistique permet un taux de reconnaissance élevé.