Thèse soutenue

Nouvelles Méthodes Variationnelles pour l'inférence et l'apprentissage

FR  |  
EN
Auteur / Autrice : Achille Thin
Direction : Éric MoulinesArnaud Doucet
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 10/06/2022
Etablissement(s) : Institut polytechnique de Paris
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : École polytechnique (Palaiseau, Essonne ; 1795-....)
Laboratoire : Centre de mathématiques appliquées (Palaiseau, Essonne)
Jury : Président / Présidente : Gersende Fort
Examinateurs / Examinatrices : Éric Moulines, Arnaud Doucet, Stéphane Mallat, Matthieu Jonckheere, Marylou Gabrié
Rapporteurs / Rapporteuses : Stéphane Mallat, Matthieu Jonckheere

Résumé

FR  |  
EN

Cette thèse porte sur le problème de l'inférence en grande dimension.Nous proposons différentes méthodes pour l'estimation de constantes de normalisation et l'échantillonnage de distributions complexes.Dans une première partie, nous développons plusieurs méthodes de Monte Carlo par chaînes de Markov.D'une part, nous développons une nouvelle approche pour des noyaux non-réversibles. D'autre part, nous proposons deux méthodes massivement parallélisables combinant des propriétés locales et globales des méthodes de Monte Carlo par chaînes de Markov, en particulier en se basant sur un nouvel estimateur de constante de normalisation.Nous appliquons ces méthodes à une tâche d'inférence approchée de distribution emph{a posteriori} de réseaux de neurones bayésiens profonds, dans un cas où l'espace d'état est à très haute dimension.Dans une deuxième partie, nous proposons deux modèles génératifs, basés sur une nouvelle forme de flots normalisants combinés à des chaînes de Markov, ou à de nouvelles méthodes d'inférence variationnelle, en construisant en particulier un nouvel auto encodeur variationnel.Ces méthodes permettent en particulier de combiner inférence variationnelle et Monte Carlo par chaînes de Markov.