Estimation de densité flexible et efficace pour les distributions des données complexes
Auteur / Autrice : | Etrit Haxholli |
Direction : | Marco Lorenzi |
Type : | Thèse de doctorat |
Discipline(s) : | Automatique, traitement du signal et des images |
Date : | Soutenance le 25/10/2023 |
Etablissement(s) : | Université Côte d'Azur |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....) |
Partenaire(s) de recherche : | Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) |
Jury : | Président / Présidente : Pietro Michiardi |
Examinateurs / Examinatrices : Marco Lorenzi, Pietro Michiardi, Marc Niethammer, Bertrand Thirion | |
Rapporteurs / Rapporteuses : Marc Niethammer, Bertrand Thirion |
Mots clés
Mots clés contrôlés
Résumé
L'estimation de la densité est le processus statistique de construction d'un modèle probabiliste qui représente la distribution d'un ensemble de données. En estimant cette distribution, nous pouvons mieux comprendre les statistiques et le propriétés des données, améliorant les prédictions, la détection d'anomalies, et la génération. L'estimation de la densité est donc une étape cruciale dans nombreuses tâches d'analyse de données et d'apprentissage. Néanmoins, la tâche de modélisation de distributions à haute dimension introduit de nombreux défis. Ces défis proviennent principalement du besoin de développer des modèles qui présentent une flexibilité, permettant la capture précise de motifs complexes à haute dimension, et d'une faisabilité computationnelle qui devient particulièrement essentielle durant la phase d'entraînement. Dans ce contexte, la thèse vise à apporter de nouvelles perspectives théoriques et pratiques, spécialement conçues pour affiner la modélisation des fonctions de densité de probabilité pour des distributions de données complexes à haute dimension. De plus, nous proposons une théorie innovante pour améliorer la quantification des propriétés des distributions, comme l’ampleur de leurs queues.La première partie de cette thèse se concentre sur l’étude des approximations de réseaux de neurones profondes conçues pour représenter des fonctions de densité de probabilité, indépendamment des valeurs des paramètres. Pour cela, nous introduisons AFFJORD, comme extensions de l’état de l'art sur les "normalizing flows". Cette amélioration est rendue possible grâce à une augmentation, inspirée par notre dérivation du jacobien des transformations difféomorphiques paramétrées par des équations différentielles ordinaires (ODE). De plus, nous proposons une nouvelle méthode en s'appuyant sur les modèles de diffusion (PSM) qui améliore l'estimation de la densité tout en accélérant le processus d'entrainement, sans encourir d'inconvénients en termes de temps d'inférence ou de consommation de mémoire. Ceci est réalisé en exploitant l'indépendance inhérente à la modélisation des scores dans les modèles de diffusion. Le résultat est un "normalizing flow" continu par morceaux, flexible et rapidement optimisable.La deuxième partie de la thèse illustre que la procédure d'échantillonnage à partir de distributions marginales a un impact négatif sur la fiabilité et l'efficacité des méthodes traditionnelles d'estimation de queue dérivées de la théorie des valeurs extrêmes. Pour relever ce défi, nous développons une théorie générale innovante pour estimer les queues de distributions marginales, en particulier lorsque la variabilité est significative entre les distributions conditionnelles individuelles. Sous certaines conditions de régularité, nous démontrons que le paramètre de forme de la distribution marginale correspond au paramètre de forme de queue maximum de la famille de distributions conditionnelles.En conclusion, ce travail offre de nouvelles perspectives théoriques et pratiques, spécialement conçues pour améliorer la modélisation des fonctions de densité de probabilité pour des distributions de données complexes à haute dimension. De plus, nous proposons une théorie innovante pour affiner la quantification de l'épaisseur des queues des distributions, en vertu d'hypothèses statistiques pertinentes dans le domaine de l'apprentissage statistique. Nous concluons cette thèse en proposant trois voies potentielles pour les recherches futures dans ce domaine. Celles-ci sont ensuite suivies par nos remarques finales.