Reconnaissance de l'écriture manuscrite cursive Bengali pour l'automatisation de la Poste Indienne
Auteur / Autrice : | Szilárd Vajda |
Direction : | Abdelwaheb Belaïd |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 12/11/2008 |
Etablissement(s) : | Nancy 1 |
Ecole(s) doctorale(s) : | IAEM Lorraine |
Partenaire(s) de recherche : | Laboratoire : LORIA |
Jury : | Président / Présidente : Thierry Paquet |
Examinateurs / Examinatrices : Thierry Paquet, Jean-Marc Ogier, Laurence Likforman-Sulem, René Schott, Abdel Belaïd, Christophe Choisy | |
Rapporteurs / Rapporteuses : Jean-Marc Ogier, Laurence Likforman-Sulem |
Mots clés
Résumé
Les grandes variations de style de l'écriture et les difficultés de segmenter les mots cursifs sont les raisons principales pour laquelle la reconnaissance de mots cursive manuscrite pour être une tâche si difficile. Un système de lecture des documents postaux indien basé sur le modèle stochastique basé d'un contexte sans segmentation est présenté. L'originalité du travail réside sur une combinaison de caractéristiques conceptuelles à haut niveau avec les renseignements de pixel à basse altitude considérés par ancien modèle et une stratégie d' arrêt dans l'algorithme Viterbi. Pendant que l'information de bas niveau peut être facilement extraite de la forme analysée, le pouvoir discriminatoire de telle information a des limites, car il décrit la forme avec moins de précision. Pour cette raison, nous avons considéré dans le cadre d'une approche analytique, utilisant une segmentation implicite, d'implanter de la haute information an le réduisant à un niveau plus bas. Cet enrichissement peut être perçu comme un poids au niveau de pixel, donnant une importance à chaque pixel analysé fondé sur leurs propriétés conceptuelles. Le défi est de combiner les types différents des caractéristiques considérant une certaine dépendance entre eux. Pour réduire le temps de décodage dans la recherche de Viterbi, un mécanisme de seuil cumulatif est proposé dans une représentation de vocabulaire plate. Au lieu de l'utilisation d'une représentation de trie où les parties de préfixe communes sont partagées nous proposons un mécanisme de seuil dans le vocabulaire plat où basé juste sur une analyse de Viterbi partielle, nous pouvons élaguer un modèle et arrêtons le traitant plus. Les seuils cumulatifs sont fondés sur les scores correspondants prémédités à chaque niveau de lettre, permettant une certaine dynamique et élasticité au modèle. Comme nous sommes intéressés dans un système de reconnaissance d'adresses postaux complet, nous avons convergé aussi notre attention sur la reconnaissance des chiffres, proposant différent solutions neuronaux et stochastiques. Pour augmenter la précision et la robustesse des classifieur, un stratégie de combinaison est aussi proposé. Les résultats obtenu sur des bases différent écrit en latin et bengali ont montré l'intérêt de la méthode. Le module de reconnaissance développé sera intégré dans un système générique pour l'automation de trie postale indienne.