Wordspotting from multilingual and stylistic documents | Theses.fr

Arundhati Tarafdar

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Repérage de mots dans les images de documents multilingues et graphiques

FR |

EN

Auteur / Autrice :	Arundhati Tarafdar
Direction :	Jean-Yves Ramel, Umapada Pal
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 12/07/2017
Etablissement(s) :	Tours
Ecole(s) doctorale(s) :	École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire)
Partenaire(s) de recherche :	Equipe de recherche : Laboratoire d'Informatique Fondamentale et Appliquée de Tours (2012-...)
	Laboratoire : École polytechnique universitaire (Tours)
Jury :	Président / Présidente : Nicole Vincent
	Examinateurs / Examinatrices : Nicolas Ragot
	Rapporteurs / Rapporteuses : Véronique Eglin, Jean-Christophe Burie

Mots clés

FR |

EN

Mots clés contrôlés

Filtres (informatique)

Recherche documentaire automatisée

Bengali (langue)

Vedettes-matière

Thésaurus multilingues

Traitement d'images -- Techniques numériques

Reconnaissance optique des formes (informatique)

Recherche d'information multilingue

Mots clés libres

Analyse d’images de documents

Repérage de mots (word spotting)

Documents graphiques

Recherche d’information

Séparation texte-graphique

Filtrage

Cartes de probabilité

Points d’intérêts (SIFT)

Bengla

Résumé

FR |

EN

Les outils et méthodes d’analyse d’images de documents (DIA) donnent aujourd’hui la possibilité de faire des recherches par mots-clés dans des bases d’images de documents alors même qu’aucune transcription n’est disponible. Dans ce contexte, beaucoup de travaux ont déjà été réalisés sur les OCR ainsi que sur des systèmes de repérage de mots (spotting) dédiés à des documents textuels avec une mise en page simple. En revanche, très peu d’approches ont été étudiées pour faire de la recherche dans des documents contenant du texte multi-orienté et multi-échelle, comme dans les documents graphiques. Par exemple, les images de cartes géographiques peuvent contenir des symboles, des graphiques et du texte ayant des orientations et des tailles différentes. Dans ces documents, les caractères peuvent aussi être connectés entre eux ou bien à des éléments graphiques. Par conséquent, le repérage de mots dans ces documents se révèle être une tâche difficile. Dans cette thèse nous proposons un ensemble d’outils et méthodes dédiés au repérage de mots écrits en caractères bengali ou anglais (script Roman) dans des images de documents géographiques. L’approche proposée repose sur plusieurs originalités.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Repérage de mots dans les images de documents multilingues et graphiques

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Repérage de mots dans les images de documents multilingues et graphiques

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses