Thèse soutenue

Modélisation du langage naturel appliquée à la reconnaissance de l'écriture manuscrite en-ligne

FR
Auteur / Autrice : Freddy Perraud
Direction : Béatrice DailleChristian Viard-GaudinEmmanuel Morin
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2005
Etablissement(s) : Nantes
Ecole(s) doctorale(s) : École doctorale sciences et technologies de l'information et des matériaux (Nantes)

Mots clés

FR

Mots clés contrôlés

Résumé

FR

L'évolution de la société de l'Information avec les concepts d'ubiquité, de nomadisme, d'accès à l'information sans discontinuer, en tous lieux et en tous temps, et si possible avec le minimum d'efforts pour l'utilisateur impose de repenser les interfaces de communication. En effet, dans ces situations, la plupart du temps, le clavier n'apporte pas les solutions de confort attendu. L'utilisation de commandes gestuelles, et en particulier de l'écriture manuscrite, se révèle être aujourd'hui une alternative crédible pour ces nouveaux systèmes communicants (assistant numérique, ardoise électronique, etc. ). Les performances des systèmes de reconnaissance actuels sont encore bien inférieures à celles de l'humain notamment dans la prise en compte d'informations contextuelles d'ordre linguistique. Les travaux que nous présentons dans ce manuscrit s'inscrivent dans un cadre industriel (CIFRE) et visent à améliorer le système de reconnaissance de l'écriture manuscrite nommé MyScript Builder, développé par la société Vision Objects. Dans un tel système, la prise en compte des propriétés du langage constitue un élément clé. C'est l'objectif central de ce travail pour lequel encore peu de contributions sont disponibles. Nous avons cherché à concevoir, développer et tester des modèles de langage les plus efficaces possibles pour un système de reconnaissance de l'écriture manuscrite en-ligne. Plusieurs types de contraintes étaient à satisfaire. En articulier, il fallait veiller au compromis taille/performance, mais aussi envisager la portabilité de la méthode afin de pouvoir la généraliser à différentes langues. Ainsi, nous avons privilégié une approche probabiliste basée sur des n-classes pour traiter les langues naturelles. Nous avons expérimenté de nombreuses techniques de classification basées sur différentes méthodes d'exploration de l'espace de recherche et se basant sur un critère de nature contextuelle ou syntaxique. Par ailleurs, des modèles structurels appelés lexiques d'expressions, ont été étudiés pour traiter des entités linguistiques spécifiques. Ces modèles ont fait l'objet d'expérimentations poussées pour évaluer les améliorations apportées au système de reconnaissance MyScript Builder. Sur des phrases appartenant à 13 langues différentes, le taux d'erreur a été diminué de 30 %en moyenne à l'aide de modèles n-classes par rapport à une version ne comportant qu'un simple lexique. Les lexiques d'expressions s'avèrent particulièrement performants puisque le nombre d'erreurs de reconnaissance est réduit de moitié.