Reconnaissance de l'écriture manuscrite : analyse de la forme globale des mots et utilisation de la morpho-syntaxe
Auteur / Autrice : | Christophe Parisse |
Direction : | Joseph Mariani |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 1989 |
Etablissement(s) : | Paris 11 |
Résumé
La reconnaissance de l'écriture par un ordinateur et par un être humain (la lecture) présentent beaucoup de points communs. C'est pourquoi l'observation de la lecture a permis d'aborder d'une manière nouvelle le problème non résolu de la reconnaissance d 'une écriture manuscrite quelconque. Un système dont le but est une reconnaissance mono-scripteur sur un lexique de 10000 mots a été réalisé et testé. S'inspirant des recherches sur la lecture, ce système fait coopérer une analyse globale de la forme du mot, des traitements syntaxiques et un calcul de proximités lexico sémantiques. La reconnaissance morphologique utilise des transformations d'images de mots digitalisées permettant d’effectuer des comparaisons de forme globales. Ces transformations traduisent la forme globale de l'objet constitué par le mot indépendamment de sa structure interne (enchevêtrement des formes élémentaires qui le constitue). Ceci permet d'effectuer des comparaisons de forme à l'intérieur d’une écriture donnée quelle que soit celle-ci. Un analyseur syntaxique basé sur un modèle markovien à apprentissage permet d 'évaluer la grammaticalité des phrases proposées à l'issue de la reconnaissance morphologique. Les phrases grammaticalement correctes sont sémantiquement pondérées à l'aide d 'un calcul de cooccurrences lexicales effectué sur des bases textuelles thématiques.