Thèse soutenue

Contributions au Transport Optimal pour l'Apprentissage Machine : Métrique de Terrain et Cadre Généralisé

FR  |  
EN
Auteur / Autrice : Tanguy Kerdoncuff
Direction : Marc Sebban
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 09/12/2021
Etablissement(s) : Lyon
Ecole(s) doctorale(s) : École doctorale Sciences Ingénierie Santé (Saint-Etienne)
Partenaire(s) de recherche : Laboratoire : Laboratoire Hubert Curien (Saint-Etienne ; 1995-....)
Jury : Président / Présidente : Élisa Fromont
Examinateurs / Examinatrices : Rémi Emonet
Rapporteur / Rapporteuse : Marianne Clausel, Nicolas Courty

Résumé

FR  |  
EN

La théorie du Transport Optimal permet non seulement de définir une notion de distance entre distributions de probabilité, mais propose aussi une correspondance entre celles-ci sous la forme d'un plan de transport. Cette théorie a été à la base de nombreux récents travaux en Apprentissage Machine. Étant donnée une métrique permettant de comparer deux points d'un espace vectoriel, le transport entre distributions est dit optimal s'il minimise le coût global pour déplacer une distribution vers une autre. La distance obtenue de Wasserstein généralise de manière intuitive les métriques usuelles entre points d'un espace vectoriel. En Apprentissage Machine, la distance Euclidienne est souvent exploitée par défaut comme métrique de base malgré la grande variété d'autres fonctions candidates possibles. Dans cette thèse, nous abordons tout d'abord l'intérêt d'apprendre des métriques plus complexes pour résoudre des problèmes d'Apprentissage Machine. La première contribution utilise des informations additionnelles d'étiquettes pour optimiser une métrique de Mahalanobis, tandis que la seconde propose de choisir la métrique la plus stable dans un ensemble de fonction candidates pour effectuer le Transport Optimal entre deux distributions. Nous proposons également un algorithme efficace pour résoudre le problème difficile de Gromov Wasserstein, une extension du Transport Optimal permettant de comparer des matrices de similarité venant d'espaces vectoriels différents. Enfin, en s'appuyant sur ce nouvel algorithme, nous présentons une nouvelle extension du problème du Transport Optimal qui définit une distance entre tenseurs de dimension quelconque.