Fusion multi-niveaux par boosting pour le tagging automatique
Auteur / Autrice : | Rémi Foucard |
Direction : | Gaël Richard, Slim Essid |
Type : | Thèse de doctorat |
Discipline(s) : | Signal et images |
Date : | Soutenance le 20/12/2013 |
Etablissement(s) : | Paris, ENST |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris (1992-...) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....) |
Jury : | Président / Présidente : Laurent Daudet |
Examinateurs / Examinatrices : Mathieu Lagrange | |
Rapporteur / Rapporteuse : Liming Chen, Myriam Desainte-Catherine |
Mots clés
Mots clés contrôlés
Résumé
Les tags constituent un outil très utile pour indexer des documents multimédias. Cette thèse de doctorat s’intéresse au tagging automatique, c’est à dire l’association automatique par un algorithme d’un ensemble de tags à chaque morceau. Nous utilisons des techniques de boosting pour réaliser un apprentissage prenant mieux en compte la richesse de l’information exprimée par la musique. Un algorithme de boosting est proposé, afin d’utiliser conjointement des descriptions de morceaux associées à des extraits de différentes durées. Nous utilisons cet algorithme pour fusionner de nouvelles descriptions, appartenant à différents niveaux d’abstraction. Enfin, un nouveau cadre d’apprentissage est proposé pour le tagging automatique, qui prend mieux en compte les subtilités des associations entre les tags et les morceaux.