Thèse en cours

Sur les méthodes de gradient stochastique et le transport optimal entre espaces

FR  |  
EN
Auteur / Autrice : Othmane Sebbouh
Direction : Gabriel PeyréMarco Cuturi
Type : Projet de thèse
Discipline(s) : Mathématiques
Date : Inscription en doctorat le 01/09/2020
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Sciences mathématiques de Paris centre
Partenaire(s) de recherche : Laboratoire : DMA - Département de Mathématiques et Applications
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....)

Résumé

FR  |  
EN

La renormalisation quantile est un outil fondamental en statistiques. Il permet de modifier des données univariées, afin que celles-ci suivent une distribution prédéterminée (i.e. gaussienne), au moyen d'une transformation monotone. Cette normalisation a plusieurs vertus pratiques, notamment celle de retirer des valeurs extrêmes et de faciliter l'entraînement des paramètres de modèles d'apprentissage s'appuyant sur ces données. Le contexte d'application de cette renormalisation est donc le plus souvent statique, au sens où la distribution vers laquelle sont transformés des données est le plus souvent choisie a priori. De récents travaux [2] ont montré qu'il était possible de rendre différentiable cette opération, et ainsi de pouvoir adapter la distribution finale au besoin afin d'améliorer, de manière intégrée, le résultat final de méthodes d'apprentissage. Le but de cette thèse est d'étudier théoriquement et numériquement des extensions multi-variées de cette approche, avec des applications possibles en génomique. La fonction de quantile peut s'interpréter comme un transport optimal univarié, et cette thèse exploitera cette correspondance dans un cadre beaucoup plus général en dimension arbitraire. Le cœur de la thèse sera l'utilisation de techniques de lissage du transport optimal [1], qui permettront de développer des algorithmes de normalisation qui passent à l'échelle et dont on peut analyser théoriquement les performances. Ces avancées théoriques et méthodologiques iront de pair avec des applications dans le domaine de la génomique. Bibliographie [1] G. Peyré, M. Cuturi, Computational Optimal Transport, FnT in Machine Learning, 11(5-6), 2019. [2] M. Cuturi, O. Teboul, J. Niles-Weed, J.-P. Vert, Supervised Quantile Normalization for Low Rank Matrix Factorization, ICML 2020