Auteur / Autrice : | Amel Znaidia |
Direction : | Nikos Paragios |
Type : | Thèse de doctorat |
Discipline(s) : | Computer science |
Date : | Soutenance le 11/02/2014 |
Etablissement(s) : | Châtenay-Malabry, Ecole centrale de Paris |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'Ingénieur (Châtenay-Malabry, Hauts de Seine) |
Partenaire(s) de recherche : | Laboratoire : Centre de vision numérique / CVN |
Jury : | Président / Présidente : Henri Maître |
Examinateurs / Examinatrices : Nikos Paragios, Bernard Merialdo, Stéphane Marchand-Maillet, Patrick Lambert, Stéphane Ayache, Matthieu Cord, Céline Hudelot, Hervé Le Borgne | |
Rapporteurs / Rapporteuses : Bernard Merialdo, Stéphane Marchand-Maillet |
Mots clés
Mots clés contrôlés
Résumé
La présente thèse s’intéresse à l’annotation multimodale d’images dans le contexte des médias sociaux. Notre objectif est de combiner les modalités visuelles et textuelles (tags) afin d’améliorer les performances d’annotation d’images. Cependant, ces tags sont généralement issus d’une indexation personnelle, fournissant une information imparfaite et partiellement pertinente pour un objectif de description du contenu sémantique de l’image. En outre, en combinant les scores de prédiction de différents classifieurs appris sur les différentes modalités, l’annotation multimodale d’image fait face à leurs imperfections: l’incertitude, l’imprécision et l’incomplétude. Dans cette thèse, nous considérons que l’annotation multimodale d’image est soumise à ces imperfections à deux niveaux : niveau représentation et niveau décision. Inspiré de la théorie de fusion de l’information, nous concentrons nos efforts dans cette thèse sur la définition, l’identification et la prise en compte de ces aspects d’imperfections afin d’améliorer l’annotation d’images.