Thèse soutenue

Techniques d'adaptation de modèles markoviens. Application à la reconnaissance de documents anciens

FR  |  
EN
Auteur / Autrice : Kamel Ait-Mohand
Direction : Thierry Paquet
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2011
Etablissement(s) : Rouen
Ecole(s) doctorale(s) : École doctorale sciences physiques mathématiques et de l'information pour l'ingénieur (Saint-Etienne-du-Rouvray, Seine-Maritime....-2016)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique, de traitement de l'information et des systèmes (Saint-Etienne du Rouvray, Seine-Maritime ; 2006-...)

Résumé

FR  |  
EN

Ce travail s'intéresse à la reconnaissance de caractères dans les documents imprimés. Le but est de créer un OCR suffisamment robuste pour être performant sur les documents anciens dont les particularités les rendent difficiles à traiter par les OCRs. Nous avons créé un système de reconnaissance polyfonte basé sur des modèles de Markov cachés (MMC) et nous l'avons intégré dans une chaîne de traitement OCR complète en utilisant des outils logiciels libres. Afin d'améliorer les performances de ce système sur de nouvelles données, nous avons créé des algorithmes d'adaptation qui modifient conjointement la structure et les probabilités d'émission des MMC. Nous avons évalué le système de reconnaissance polyfonte ainsi que les algorithmes d'adaptation sur des bases d'images réelles et synthétiques. Les résultats obtenus montrent que le système de reconnaissance polyfonte est compétitif comparé aux systèmes d'OCR industriels et que nos algorithmes d'adaptation de la structure devancent nettement les algorithmes d'adaptation de l'état de l'art.