Segmentation et classification dans les images de documents numérisés

Asma Ouji

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

FR |

EN

Auteur / Autrice :	Asma Ouji
Direction :	Atilla Baskurt, Frank Lebourgeois
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 01/06/2012
Etablissement(s) :	Lyon, INSA
Ecole(s) doctorale(s) :	École doctorale en Informatique et Mathématiques de Lyon (2009-....)
Partenaire(s) de recherche :	Laboratoire : LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Rhône ; 2003-....)
Jury :	Président / Présidente : Patrick Lambert
	Examinateurs / Examinatrices : Atilla Baskurt, Frank Lebourgeois, Patrick Lambert, Jean-Marc Ogier, Catherine Viard-Gaudin, Pierre-François Besson
	Rapporteurs / Rapporteuses : Jean-Marc Ogier, Catherine Viard-Gaudin

Mots clés

FR |

EN

Mots clés contrôlés

Traitement d'images -- Techniques numériques

Reconnaissance des formes (informatique)

Mots clés libres

Informatique

Reconnaissance d'images

Images scannées

Segmentation physique

Analyse colorimétrique

Classification

Classement

Résumé

FR |

EN

Les travaux de cette thèse ont été effectués dans le cadre de l'analyse et du traitement d'images de documents imprimés afin d'automatiser la création de revues de presse. Les images en sortie du scanner sont traitées sans aucune information a priori ou intervention humaine. Ainsi, pour les caractériser, nous présentons un système d'analyse de documents composites couleur qui réalise une segmentation en zones colorimétriquement homogènes et qui adapte les algorithmes d'extraction de textes aux caractéristiques locales de chaque zone. Les informations colorimétriques et textuelles fournies par ce système alimentent une méthode de segmentation physique des pages de presse numérisée. Les blocs issus de cette décomposition font l'objet d'une classification permettant, entre autres, de détecter les zones publicitaires. Dans la continuité et l'expansion des travaux de classification effectués dans la première partie, nous présentons un nouveau moteur de classification et de classement générique, rapide et facile à utiliser. Cette approche se distingue de la grande majorité des méthodes existantes qui reposent sur des connaissances a priori sur les données et dépendent de paramètres abstraits et difficiles à déterminer par l'utilisateur. De la caractérisation colorimétrique au suivi des articles en passant par la détection des publicités, l'ensemble des approches présentées ont été combinées afin de mettre au point une application permettant la classification des documents de presse numérisée par le contenu.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Segmentation et classification dans les images de documents numérisés

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Segmentation et classification dans les images de documents numérisés

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses