Thèse soutenue

Une méthode de la reconnaissance de l'écriture manuscrite arabe

FR  |  
EN
Auteur / Autrice : Abderrahim Ameur
Direction : Yves Lecourtier
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1992
Etablissement(s) : Rouen

Résumé

FR

Dans ce document nous décrivons une méthode structurelle de reconnaissance de l'écriture manuscrite arabe. La lecture du texte de plusieurs lignes est faite par une caméra CCD. Le problème majeur de la lecture automatique de caractères manuscrits cursifs étant la segmentation d'un tracé en éléments constituants, dans ce cadre, nous avons effectué la segmentation de notre texte à l'aide des trois phases suivantes: dans la première phase, nous segmentons le texte en lignes par application de projections horizontales. Dans le cas où les lignes du texte sont inclinées, la projection de la ligne est faite en plusieurs portions horizontales. La deuxième phase s'occupe de la segmentation des lignes en mots. Nous comparons les distances inter-lettres et inter-mots. Les distances sont calculées par la projection verticale de chaque ligne. La dernière phase traite la segmentation des mots en caractères. Elle est fondée sur les propriétés contextuelles propres à l'écriture arabe. Nous nous servons aussi de la méthode de suivi de contours pour pallier aux problèmes de chevauchement des caractères. Ensuite, nous procédons à l'extraction des limites du dernier caractère. Les caractères à la droite de celui-ci sont segmentés par le découpage des traits de liaison entre les caractères. L'étape de la reconnaissance est étroitement liée à celle de la segmentation car elle utilise les données déjà calculées pendant la segmentation, pour une classification grossière. Cette dernière est déterminée par les occlusions et les liaisons entre les caractères. Nous affinons la description des caractères dans un groupe plus petit par l'analyse hétérarchique qui permet le retour sur la forme pour enlever certaines ambigüités. Nous cherchons des ouvertures dans plusieurs endroits du caractère, les occlusions, l'analyse du contour externe et les dimensions. Le taux de reconnaissance atteint est de 90%