Sur les méthodes de gradient stochastique et le transport optimal entre espaces
Auteur / Autrice : | Othmane Sebbouh |
Direction : | Gabriel Peyré, Marco Cuturi |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques |
Date : | Inscription en doctorat le 01/09/2020 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | École doctorale Sciences mathématiques de Paris centre |
Partenaire(s) de recherche : | Laboratoire : DMA - Département de Mathématiques et Applications |
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....) |
Mots clés
Résumé
La renormalisation quantile est un outil fondamental en statistiques. Il permet de modifier des données univariées, afin que celles-ci suivent une distribution prédéterminée (i.e. gaussienne), au moyen d'une transformation monotone. Cette normalisation a plusieurs vertus pratiques, notamment celle de retirer des valeurs extrêmes et de faciliter l'entraînement des paramètres de modèles d'apprentissage s'appuyant sur ces données. Le contexte d'application de cette renormalisation est donc le plus souvent statique, au sens où la distribution vers laquelle sont transformés des données est le plus souvent choisie a priori. De récents travaux [2] ont montré qu'il était possible de rendre différentiable cette opération, et ainsi de pouvoir adapter la distribution finale au besoin afin d'améliorer, de manière intégrée, le résultat final de méthodes d'apprentissage. Le but de cette thèse est d'étudier théoriquement et numériquement des extensions multi-variées de cette approche, avec des applications possibles en génomique. La fonction de quantile peut s'interpréter comme un transport optimal univarié, et cette thèse exploitera cette correspondance dans un cadre beaucoup plus général en dimension arbitraire. Le cur de la thèse sera l'utilisation de techniques de lissage du transport optimal [1], qui permettront de développer des algorithmes de normalisation qui passent à l'échelle et dont on peut analyser théoriquement les performances. Ces avancées théoriques et méthodologiques iront de pair avec des applications dans le domaine de la génomique. Bibliographie [1] G. Peyré, M. Cuturi, Computational Optimal Transport, FnT in Machine Learning, 11(5-6), 2019. [2] M. Cuturi, O. Teboul, J. Niles-Weed, J.-P. Vert, Supervised Quantile Normalization for Low Rank Matrix Factorization, ICML 2020