Thèse soutenue

Contributions à la reconnaissance de l'écriture arabe manuscrite

FR  |  
EN
Auteur / Autrice : Farès Menasri
Direction : Nicole Vincent
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2008
Etablissement(s) : Paris 5

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Ces travaux s'inscrivent dans le cadre de la reconnaissance manuscrite hors-ligne. Celle-ci consiste à déchiffrer des mots manuscrits présents dans une image. Nous proposons un système de reconnaissance de mots manuscrits arabes isolés, appartenant à un lexique. Ce reconnaisseur s'appuie sur un System hybride à base de Réseaux de Neurones (RN) et de Modèles de Markov Cachés (MMC) et une segmentation en graphèmes. L'originalité de notre approche tient à la stratégie d'utilisation des signes diacritiques (points et autres signes secondaires associés aux lettres). Nou: avons proposé un nouvel alphabet de corps de lettres qui permet de mieux exploiter les redondances des formes des lettres arabes. Nous avons ains montré que sur l'application considérée (reconnaissance de noms de villes tunisiennes à l'aide de la base publique IFN/ENIT), les signes diacritique n'étaient pas indispensables pour effectuer la tâche de classification. Bien qu'ils ne soient pas indispensables, les signes diacritiques apportent néanmoins une information supplémentaire. Nous avons donc également proposé une technique de reconnaissance des signes diacritiques, ainsi qu'une stratégie de combinaison entre reconnaissance sans diacritiques et reconnaissance avec diacritiques. Cette combinaison permet de réduire signitïcativemenl le taux d'erreur. Les performances obtenues par le systèir proposé sont les meilleures rapportées dans la littérature, selon le protocole expérimental défini par les auteurs de la base de données. Dans les pistes d'améliorations de ce système de reconnaissance en langue arabe, nous avons proposé une stratégie qui repose sur l'utilisation d'automates à états finis pondérés ( WFSM pour Weighted Finite State Machines). Nous avons utilisé ce formalisme avec succès sur une tâche plus simple de reconnaissance de noms de familles français écrits en lettres capitales. Nous avons ainsi pu vérifier que ce formalisme permettait d'inlég facilement des contraintes propres à la langue ou à l'application considérée. L'utilisation de WFSM pour la reconnaissance de l'écriture arabe semr. Prometteuse, et fera l'objet de travaux ultérieurs.