Modèle de représentation des écritures pour la recherche de mots par similarité dans les documents manuscrits du patrimoine
Auteur / Autrice : | Peng Wang |
Direction : | Christine Largeron |
Type : | Thèse de doctorat |
Discipline(s) : | Image, vision, signal |
Date : | Soutenance le 18/11/2014 |
Etablissement(s) : | Saint-Etienne |
Ecole(s) doctorale(s) : | École doctorale Sciences Ingénierie Santé (Saint-Etienne) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Hubert Curien (Saint-Etienne ; 1995-....) |
Jury : | Président / Présidente : Alain Trémeau |
Examinateurs / Examinatrices : Antony McKenna, Véronique Eglin, Christophe Garcia, Rolf Ingold, Josep Llados i Canet, Laurent Wendling |
Mots clés
Résumé
L’objectif du travail de thèse est de proposer un modèle de représentation des écritures dans les images de documents du patrimoine sans recourir à une transcription des textes. Ce modèle, issu d’une étude très complète des méthodes actuelles de caractérisation des écritures, est à la base d’une proposition de scénario de recherche par similarité de mots, indépendante du scripteur et ne nécessitant pas d’apprentissage. La recherche par similarité proposée repose sur une structure de graphes intégrant des informations sur la topologie, la morphologie locale des mots et sur le contexte extrait du voisinage de chaque point d’intérêt. Un graphe est construit à partir du squelette décrit en chaque point sommet par le contexte de formes, descripteur riche et compact. L’extraction de mots est assurée par une première étape de localisation grossière de régions candidates, décrites par une séquence déduite d’une représentation par graphes liée à des critères topologiques de voisinage. L’appariement entre mots repose ensuite sur une distance dynamique et un usage adapté du coût d’édition approximé entre graphes rendant compte de la nature bi-dimensionnelle de l’écriture. L’approche a été conçue pour être robuste aux distorsions de l’écriture et aux changements de scripteurs. Les expérimentations sont réalisées sur des bases de documents manuscrits patrimoniaux exploitées dans les compétitions de word-spotting. Les performances illustrent la pertinence de la proposition et ouvrent des voies nouvelles d’investigation dans des domaines d’applications autour de la reconnaissance de symboles et d’écritures iconographiques