Thèse soutenue

Vers une description efficace du contenu visuel pour l'annotation automatique d'images

FR  |  
EN
Auteur / Autrice : Nicolas Hervé
Direction : Nozha Ben Hajel-Boujemaa
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2009
Etablissement(s) : Paris 11
Partenaire(s) de recherche : Autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Résumé

FR  |  
EN

Les progrès technologiques récents en matière d’acquisition de données multimédia ont conduit à une croissance exponentielle du nombre de contenus numériques disponibles. Pour l’utilisateur de bases d’images généralistes (agences photo, collections personnelles), l’annotation manuelle présente aujourd’hui un coût prohibitif. Nous présentons une approche générique de l’annotation automatique permettant de générer de nouvelles métadonnées. Elle est basée sur une stratégie d’apprentissage statistique utilisant des SVM à noyau triangulaire. La description visuelle du contenu et sa représentation sont sans doute les étapes les plus importantes puisqu’elles conditionnent l’ensemble du processus. Pour la représentation globale des images, nous proposons le nouveau descripteur de formes LEOH. D’autre part, nous utilisons une représentation par sacs de mots visuels pour décrire localement des images. Nous montrons de façon originale qu’un échantillonnage dense est préférable à l’utilisation des détecteurs de points d’intérêt pour la sélection de patches visuels. De plus, nous proposons d’inclure des contraintes géométriques souples, qui sont, par nature ignorées dans les sacs de mots, en utilisant des paires de mots visuels. Dans le contexte du bouclage de pertinence, nous proposons une nouvelle stratégie permettant de mixer les descriptions visuelles globales et par sac de mots. Tous ces travaux ont été évalués sur des bases d’images réalistes. Ces expérimentations ont mis en avant la pertinence des améliorations proposées. Certaines d’entre elles ont permis à notre approche d’obtenir les meilleures performances lors de la campagne d’évaluation ImagEVAL.