Les modèles génératifs à base de diffusion à la lumière du transport optimal : de la théorie à la pratique.
Auteur / Autrice : | Marta Gentiloni silveri |
Direction : | Alain Durmus, Giovanni Conforti |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques appliquées |
Date : | Inscription en doctorat le 01/10/2023 |
Etablissement(s) : | Institut polytechnique de Paris |
Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard |
Partenaire(s) de recherche : | Laboratoire : CMAP - Centre de Mathématiques appliquées |
Equipe de recherche : SIMPAS : Signal IMage Probabilités numériques Apprentissage Statistique |
Mots clés
Résumé
Cette thèse traitera d'une nouvelle classe de modèles génératifs appelés modèles de diffusion. Ces modèles consistent à apprendre la fonction de score associée à une équation différentielle stochastique, qui est utilisée pour simuler le processus renversé temporel correspondant et générer ainsi un nouvel échantillon. Les modèles de diffusion sont très flexibles, faciles à entraîner et basés sur des principes simples et interprétables. En outre, ils ont produit des résultats spectaculaires dans des applications pratiques et sont aujourd'hui largement considérés comme l'architecture la plus avancée pour la génération de données. Cependant, malgré leurs performances empiriques, il existe peu de résultats théoriques fournissant des garanties a priori sur leur efficacité et il existe d'importantes lacunes conceptuelles dans leur compréhension et leur mise en uvre. Cette thèse vise à combler ces lacunes en s'appuyant sur des idées et des outils issus de la théorie du transport optimal. La première partie de ce travail consistera à analyser l'influence des hyperparamètres dans les modèles de diffusion existants et à développer une stratégie adaptative pour les ajuster automatiquement. Une deuxième partie se concentrera sur le développement de nouvelles méthodologies qui intègrent des idées issues de la théorie du transport optimal. En particulier, nous visons à développer de nouvelles implémentations pratiques de l'algorithme bien connu de Sinkhorn. Enfin, nous prévoyons d'aborder une extension prometteuse des modèles basés sur la diffusion, les flux d'appariement. Cependant, ces modèles ne sont pas entièrement satisfaisant à l'heure actuelle car, bien qu'ils soient plus faciles à entraîner et qu'ils donnent des résultats intéressants, ils ne possèdent pas les même fondements théoriques que les modèles de diffusion. Notre objectif ici est de combler les lacunes existantes en élucidant le lien entre flux d'appariement et le transport optimal (entropique). Cela devrait conduire à de nouvelles perspectives qui devraient aider au développement d'une nouvelle classe de nouveaux modèles génératifs. Chacune des contributions algorithmiques de cette thèse sera accompagnée d'une étude numérique afin de s'assurer qu'elles sont efficaces et compétitives par rapport aux méthodes de pointe.