Thèse soutenue

Prédiction structurée pour l’analyse de données séquentielles

FR  |  
EN
Auteur / Autrice : Rémi Lajugie
Direction : Francis BachSylvain Arlot
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 18/09/2015
Etablissement(s) : Paris, Ecole normale supérieure
Ecole(s) doctorale(s) : École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....)
Partenaire(s) de recherche : Établissement de préparation de la thèse : École normale supérieure (Paris ; 1985-....)
Laboratoire : École normale supérieure (Paris ; 1985-....). Département d'informatique
Jury : Examinateurs / Examinatrices : Francis Bach, Sylvain Arlot

Résumé

FR  |  
EN

Dans cette thèse nous nous intéressons à des problèmes d’apprentissage automatique dans le cadre de sorties structurées avec une structure séquentielle. D’une part, nous considérons le problème de l’apprentissage de mesure de similarité pour deux tâches : (i) la détection de rupture dans des signaux multivariés et (ii) le problème de déformation temporelle entre paires de signaux. Les méthodes généralement utilisées pour résoudre ces deux problèmes dépendent fortement d’une mesure de similarité. Nous apprenons une mesure de similarité à partir de données totalement étiquetées. Nous présentons des algorithmes usuels de prédiction structuré, efficaces pour effectuer l’apprentissage. Nous validons notre approche sur des données réelles venant de divers domaines. D’autre part, nous nous intéressons au problème de la faible supervision pour la tâche d’alignement d’un enregistrement audio sur la partition jouée. Nous considérons la partition comme une représentation symbolique donnant (i) une information complète sur l’ordre des symboles et (ii) une information approximative sur la forme de l’alignement attendu. Nous apprenons un classifieur pour chaque symbole avec ces informations. Nous développons une méthode d’apprentissage fondée sur l’optimisation d’une fonction convexe. Nous démontrons la validité de l’approche sur des données musicales.