Thèse soutenue

Reconnaissance et contexte : une approche coopérative pour la lecture de textes imprimés

FR  |  
EN
Auteur / Autrice : Jean-Luc Henry
Direction : Hubert Emptoz
Type : Thèse de doctorat
Discipline(s) : Ingénierie Informatique
Date : Soutenance en 1996
Etablissement(s) : Lyon, INSA
Ecole(s) doctorale(s) : Ecole doctorale Informatique et Information Pour La Societe. 1992-2009 (Lyon ; 1992-2009)
Partenaire(s) de recherche : Laboratoire : RFV - Laboratoire de Reconnaissance de Formes et Vision (Lyon, INSA1995-2003)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

La lecture optique de textes imprimés ne se base pas sur la seule reconnaissance de la forme graphique des caractères isolés ; elle repose aussi sur des informations statistiques, typographiques et contextuelles ; l'utilisation d'un étage d'analyse contextuelle, indépendant de l'étage de reconnaissance n'est pas satisfaisante. Ce travail a pour objet d'établir une coopération entre l'étage de reconnaissance et l'étage de correction contextuelle. L'étage d'analyse contextuelle qui est ensuite créé fournit à l'étage de reconnaissance les informations nécessaires afin que ce dernier puisse corriger en permanence ses critères de décision. L'objectif est d'augmenter les performances globales du système, au fur et à mesure des lectures successives. La première partie traite de la reconnaissance des caractères sans l'aide du contexte. Elle débute par une présentation des principales méthodes d'extraction et de traitement de l'information. Dans un premier temps, nous comparons les caractères de façon à isoler toutes les formes identiques du texte, qui seront appelées prototypes. Dans un deuxième temps, nous identifions ces prototypes grâce à une approche originale de reconnaissance, fondée sur une classification par voisinages adaptatifs. La deuxième partie est consacrée au traitement contextuel et aux liens entre les deux parties. L'étage d'analyse contextuelle corrige les erreurs à partir des redondances dans le texte des prototypes de caractères, des informations issues de l'étage de reconnaissance et de l'exploitation d'un dictionnaire. Le système réorganise les classes de l'espace de représentation en modifiant les paramètres qui interviennent dans le processus de reconnaissance. Le taux de reconnaissance globale doit atteindre un optimum qui ne dépend plus de la base d'apprentissage de départ, mais des choix des attributs et de la méthode de reconnaissance utilisée.