Thèse soutenue

Stratégies de résolution en reconnaissance de l'écriture semi-cursive : application aux mots manuscrits arabes

FR
Auteur / Autrice : Houssem Miled
Direction : Christian Olivier
Type : Thèse de doctorat
Discipline(s) : Sciences et techniques
Date : Soutenance en 1998
Etablissement(s) : Rouen

Résumé

FR

Cette thèse développe une stratégie de reconnaissance de l'écriture hors-ligne semi-cursive, et appliquée à des mots composes arabes décrivant un lexique de 232 noms de villes tunisiennes. Cette stratégie repose sur 3 niveaux perceptifs inspirés des caractéristiques de ce type d'écriture. Le mémoire de cette thèse est composé de 5 chapitres. Un premier chapitre introductif traite des caractéristiques calligraphiques de l'écriture arabe, des phases de prétraitement et de segmentation des images ainsi que des modèles de Markov cachées (MMC), qui sont à la base des différentes modélisations abordées dans cette thèse, les aspects plus théoriques de ces modèles sont renvoyés en annexe. Le deuxième chapitre est consacré à l'aspect visuel global de l'écriture arabe. Il définit un ensemble d'indices visuels appropriés à ce type d'écriture et propose une étude de pertinence de ces indices par critère d'information (IC). Ces indices décrivent les formes à reconnaître par des séquences d'observations permettant d'estimer un modèle global par mot. Le troisième chapitre traite d'une approche analytique. A ce niveau perceptif, le modèle de mot est une fusion de modèles élémentaires consacrés aux caractères et aux transitions inter et intra-pseudo-mots. Afin d'optimiser la description de mots, le choix du jeu d'observations est explicite. Parmi les alphabets d'observations étudiés, on introduit un alphabet entropique sélectionné par critère d'information de type bayésien (BIC). Le quatrième chapitre dégage un troisième niveau perceptif fondé sur la notion de pseudo-mots. Entre autre, il introduit une modélisation de mots par concaténation de modèles de pseudo-mots et évoque ses limites. Après avoir introduit les méthodes de combinaison de classifieurs et les approches de fusion de données, le cinquième et dernier chapitre expose une stratégie de reconnaissance reposant sur une coopération hiérarchique des classifieurs, associés aux 3 niveaux perceptifs des chapitres précédents et une fusion des résultats de leurs expertises. Finalement, ce chapitre introduit des modèles multiplicatifs de type IC et propose une application de ces critères pour l'optimisation d'un problème de combinaison de classifieurs.