Thèse soutenue

Fusion multi-niveaux par boosting pour le tagging automatique

FR  |  
EN
Auteur / Autrice : Rémi Foucard
Direction : Gaël RichardSlim Essid
Type : Thèse de doctorat
Discipline(s) : Signal et images
Date : Soutenance le 20/12/2013
Etablissement(s) : Paris, ENST
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche : Laboratoire : Laboratoire Traitement et communication de l'information (Paris ; 2003-....)
Jury : Président / Présidente : Laurent Daudet
Examinateurs / Examinatrices : Mathieu Lagrange
Rapporteur / Rapporteuse : Liming Chen, Myriam Desainte-Catherine

Résumé

FR  |  
EN

Les tags constituent un outil très utile pour indexer des documents multimédias. Cette thèse de doctorat s’intéresse au tagging automatique, c’est à dire l’association automatique par un algorithme d’un ensemble de tags à chaque morceau. Nous utilisons des techniques de boosting pour réaliser un apprentissage prenant mieux en compte la richesse de l’information exprimée par la musique. Un algorithme de boosting est proposé, afin d’utiliser conjointement des descriptions de morceaux associées à des extraits de différentes durées. Nous utilisons cet algorithme pour fusionner de nouvelles descriptions, appartenant à différents niveaux d’abstraction. Enfin, un nouveau cadre d’apprentissage est proposé pour le tagging automatique, qui prend mieux en compte les subtilités des associations entre les tags et les morceaux.