Cursive Bengali Script Recognition for Indian Postal Automation

Szilárd Vajda

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Reconnaissance de l'écriture manuscrite cursive Bengali pour l'automatisation de la Poste Indienne

FR |

EN

Auteur / Autrice :	Szilárd Vajda
Direction :	Abdelwaheb Belaïd
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 12/11/2008
Etablissement(s) :	Nancy 1
Ecole(s) doctorale(s) :	IAEM Lorraine
Partenaire(s) de recherche :	Laboratoire : LORIA
Jury :	Président / Présidente : Thierry Paquet
	Examinateurs / Examinatrices : Thierry Paquet, Jean-Marc Ogier, Laurence Likforman-Sulem, René Schott, Abdel Belaïd, Christophe Choisy
	Rapporteurs / Rapporteuses : Jean-Marc Ogier, Laurence Likforman-Sulem

Mots clés

FR

Mots clés contrôlés

Réseaux neuronaux (informatique)

Bengali (langue)

Reconnaissance optique des caractères

Mots clés libres

réduction du lexique

reconnaissance des adresses postales

Résumé

FR |

EN

Les grandes variations de style de l'écriture et les difficultés de segmenter les mots cursifs sont les raisons principales pour laquelle la reconnaissance de mots cursive manuscrite pour être une tâche si difficile. Un système de lecture des documents postaux indien basé sur le modèle stochastique basé d'un contexte sans segmentation est présenté. L'originalité du travail réside sur une combinaison de caractéristiques conceptuelles à haut niveau avec les renseignements de pixel à basse altitude considérés par ancien modèle et une stratégie d' arrêt dans l'algorithme Viterbi. Pendant que l'information de bas niveau peut être facilement extraite de la forme analysée, le pouvoir discriminatoire de telle information a des limites, car il décrit la forme avec moins de précision. Pour cette raison, nous avons considéré dans le cadre d'une approche analytique, utilisant une segmentation implicite, d'implanter de la haute information an le réduisant à un niveau plus bas. Cet enrichissement peut être perçu comme un poids au niveau de pixel, donnant une importance à chaque pixel analysé fondé sur leurs propriétés conceptuelles. Le défi est de combiner les types différents des caractéristiques considérant une certaine dépendance entre eux. Pour réduire le temps de décodage dans la recherche de Viterbi, un mécanisme de seuil cumulatif est proposé dans une représentation de vocabulaire plate. Au lieu de l'utilisation d'une représentation de trie où les parties de préfixe communes sont partagées nous proposons un mécanisme de seuil dans le vocabulaire plat où basé juste sur une analyse de Viterbi partielle, nous pouvons élaguer un modèle et arrêtons le traitant plus. Les seuils cumulatifs sont fondés sur les scores correspondants prémédités à chaque niveau de lettre, permettant une certaine dynamique et élasticité au modèle. Comme nous sommes intéressés dans un système de reconnaissance d'adresses postaux complet, nous avons convergé aussi notre attention sur la reconnaissance des chiffres, proposant différent solutions neuronaux et stochastiques. Pour augmenter la précision et la robustesse des classifieur, un stratégie de combinaison est aussi proposé. Les résultats obtenu sur des bases différent écrit en latin et bengali ont montré l'intérêt de la méthode. Le module de reconnaissance développé sera intégré dans un système générique pour l'automation de trie postale indienne.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Reconnaissance de l'écriture manuscrite cursive Bengali pour l'automatisation de la Poste Indienne

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Reconnaissance de l'écriture manuscrite cursive Bengali pour l'automatisation de la Poste Indienne

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses