Transport Optimal généralisé, calcul numérique et applications
Auteur / Autrice : | Thibault Séjourné |
Direction : | Gabriel Peyré, François-Xavier Vialard |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques |
Date : | Inscription en doctorat le Soutenance le 16/06/2022 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....) |
Partenaire(s) de recherche : | Laboratoire : École normale supérieure (Paris ; 1985-....). Département de mathématiques et applications (1998-....) |
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....) | |
Jury : | Président / Présidente : Julie Delon |
Examinateurs / Examinatrices : Gabriel Peyre, François-Xavier Vialard, Laetitia Chapel, Axel Munk, Umut Simsekli, Alain Rakotomamonjy, Facundo Mémoli | |
Rapporteur / Rapporteuse : Facundo Mémoli |
Mots clés
Mots clés libres
Résumé
De nombreux problèmes en sciences des données (par exemple en apprentissage automatique et en imagerie) requièrent dapproximer une distribution de données à laide dun modèle. Une approche pour estimer le modèle consiste à minimiser une distance (ou plus généralement une divergence) entre les données et le modèle. Les propriétés de la distance ont un impact crucial sur le modèle issu de sa minimisation. Contrairement à dautres approches très simples telles que la divergence de Kullback-Leibler ou les normes de noyau, les distances de transport optimal (TO) permettent dobtenir de meilleurs résultats en tirant parti dune information géométrique sous-jacente dans les données. Cependant, lusage pratique des distances de transport optimal est difficile pour plusieurs raisons. Elles sont coûteuses à estimer numériquement, ce qui est restrictif pour des jeux de données de grande taille. Elles sont sensibles à la présence de bruit ou de valeurs aberrantes dans les données. Elles sont limitées à la comparaison de distributions qui ont la même masse (comme des probabilités de masse 1) et qui sont définies dans le même espace. Cela nuit à lefficacité des distances TO dans des domaines tels que la biologie cellulaire, par exemple, où de grandes populations de cellules sont comparées via lutilisation dappareils de mesure différents. Dans cet exemple, le modèle doit tenir compte dobservations bruitées (voire erronées), et la comparaison de mesures biologiques dorigines distinctes impose une représentation des distributions dans des espaces différents. Par conséquent, lutilisation directe des distances TO dans un tel cas pourrait donner des résultats non pertinents. Il est possible de résoudre chacune de ces difficultés à laide de différentes extensions du TO : la régularisation entropique (pour accélérer les calculs et combattre le fléau de la dimension), le transport non-équilibré (pour rendre le TO robuste aux variations de masse) et les distances de Gromov-Wasserstein (pour être invariant aux isométries et comparer des mesures définies dans des espaces différents). Les contributions de cette thèse fournissent des avancées théoriques et numériques afin de pouvoir fusionner ces différentes extensions dans un cadre cohérent. Un premier problème étudié est le calcul rapide des problèmes de TO non-équilibrés dans les chapitres 2 et 4. Les contributions des autres chapitres reposent sur ces algorithmes destimation du TO non-équilibré. Une combinaison du TO non-équilibré avec la régularisation entropique, appelée divergence de Sinkhorn, est étudiée au chapitre 3. Il est prouvé quelle conserve les bénéfices computationnels du TO régularisé, avec les propriétés métriques du TO non régularisé, de sorte quil est préférable en pratique de lutiliser dans les tâches destimation de modèles. Deux combinaisons du TO non-équilibré avec les distances de Gromov-Wasserstein sont présentées dans les Chapitres 5 et 6. Celle du Chapitre 5 est une divergence qui exploite la régularisation entropique pour être estimée efficacement. Celle du Chapitre 6 vérifie linégalité triangulaire et est donc une distance.