Thèse soutenue

Une méthode de reconnaissance de l'écriture manuscrite arabe cursive : instrumentation et commande : automatique et informatique industrielle

FR  |  
EN
Auteur / Autrice : Abderrazak Zahour
Direction : Alain Faure
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1990
Etablissement(s) : Le Havre

Mots clés

FR

Mots clés contrôlés

Résumé

FR

La reconnaissance de l'écriture manuscrite courante est un problème complexe car la segmentation d'un mot en caractères est une tâche difficile. De plus, il faut tenir compte dans la procédure d'identification des déformations et des singularités du trace du chaque scripteur. Dans le cadre de cette étude, nous nous sommes intéresses a la reconnaissance de mots arabes isolés à l'aide d'une methode structurelle. La lecture du texte est faite par l'intermediaire d'une camera c. C. D. , dans les conditions d'eclairage ambiant. L'image acquise fait l'objet de pretraitements usuels tel que la binarisation, le lissage et la squelettisation. Deux classes de primitives sont extraites : les branches et les boucles. Dans cette representation les boucles sont caracterisees par leur classe et les branches par leur courbure signee, leur sens de parcours et leurs interrelations. Cette description du mot s'est avérée suffisante pour l'identification de la première catégorie de caractères que nous notons CABR et qui ne dépendent que des propriétés topologiques des primitives. Pour l'identification des autres classes de caractères, la description actuelle est complétée, d'une part en définissant des attributs géométriques sur les primitives, et d'autre part en combinant ces primitives en des formes de base permettant ainsi une description concise. Chaque caractère est alors décrit par une séquence de formes de base. Le dictionnaire arborescent des caractères modelés est subdivise en plusieurs niveaux selon la nature de la première forme de base de la séquence décrivant le caractère. En partant de la première forme de base de la matrice de description du mot à reconnaitre, l'identification d'un caractère se fait en cheminant dans les différents niveaux du dictionnaire arborescent. Les résultats expérimentaux présentés et commentes montrent un taux de reconnaissance de l'ordre de 98% pour les caractères CABR