Apprentissage sur l’espace des mesures : réseaux profonds invariants et régression de quantile
Auteur / Autrice : | Gwendoline De Bie |
Direction : | Gabriel Peyré, Marco Cuturi |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 30/11/2020 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....) |
Partenaire(s) de recherche : | Laboratoire : École normale supérieure (Paris ; 1985-....). Département de mathématiques et applications (1998-....) |
établissement de préparation de la thèse : École normale supérieure (Paris ; 1985-....) | |
Jury : | Président / Présidente : Jérémie Bigot |
Examinateurs / Examinatrices : Gabriel Peyré, Marco Cuturi, Jérémie Bigot, Jean-Michel Loubès, Rémi Flamary, Michèle Sebag, Guillaume Carlier | |
Rapporteurs / Rapporteuses : Jean-Michel Loubès, Yaron Lipman |
Mots clés
Mots clés contrôlés
Résumé
Cette thèse propose des contributions théoriques et numériques pour effectuer des tâches d’apprentissage et de statistiques sur l’espace des mesures. Dans une première partie, nous introduisons une nouvelle classe de réseaux neuronaux qui traite les mesures de probabilité sous leur forme lagrangienne (obtenue par échantillonnage) à la fois comme entrées et sorties, qui se caractérise par sa robustesse et ses propriétés d'approximation universelle. Nous montrons que ce cadre peut être adapté pour effectuer des tâches de régression avec invariances additionnelles, dont les entrées sont des mesures de probabilité, en préservant sa robustesse et ses capacités d'approximation. Cette méthode permet de concevoir des résumés expressifs et adaptables de bases de données appelés « meta-features », dans le contexte de l'apprentissage automatisé. Dans une seconde partie, nous montrons que le recours à l'entropie facilite le calcul des quantiles conditionnels multivariés. Nous introduisons le problème de régression de quantile vectoriel régularisé, fournissons un algorithme efficace pour calculer les quantiles multivariés et montrons qu'il bénéficie de propriétés asymptotiques souhaitables.