Unimodularité dans les réseaux aléatoires : Applications au graphe de Doeblin récurrent nul et à la classification hiérarchique
Auteur / Autrice : | Sayeh Khaniha |
Direction : | François Baccelli |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le Soutenance le 26/09/2023 |
Etablissement(s) : | Université Paris sciences et lettres en cotutelle avec Sharif University of Technology |
Ecole(s) doctorale(s) : | École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....) |
Partenaire(s) de recherche : | Laboratoire : DIENS - Département d'informatique de l'École normale supérieure |
Equipe de recherche : DYOGENE | |
établissement opérateur d'inscription : Ecole normale supérieure | |
Jury : | Président / Présidente : Eva Löcherbach |
Examinateurs / Examinatrices : François Baccelli, Alexandre Gaudilliere, Nicolas Curien, Hermann Thorisson, Kasra Alishahi, Javad Ebrahimi broojeni, Mir-Omid Haji-mirsadeghi | |
Rapporteurs / Rapporteuses : Nicolas Curien, Ádám Dávid Timar |
Résumé
Cette thèse explore la notion d'unimodularité dans le contexte des réseaux aléatoires et ses applications au graphe de Doeblin récurrent nul et aux modèles de classification hiérarchique. L'unimodularité caractérise les réseaux aléatoires enracinés où chaque sommet a une probabilité égale d'être la racine. La première partie de cette thèse se concentre sur les propriétés d'un graphe aléatoire spécifique appelé le graphe de Doeblin, qui est associé à l'algorithme du Coupling from the Past utilisé pour l'échantillonnage parfait de la distribution stationnaire d'une chaîne de Markov. Dans le cas irréductible, apériodique et récurrent positif, il est connu que le graphe de Doeblin Bridge, un sous-graphe du graphe de Doeblin, est un arbre infini qui peut être unimodularisé. Cet arbre infini joue un rôle crucial dans la construction d'un échantillon parfait de l'état stationnaire de la chaîne de Markov. Cette thèse étend l'étude au cas récurrent nul, où il est montré que le graphe de Doeblin Bridge est soit un arbre infini, soit une forêt composée d'une collection dénombrable d'arbres infinis. Dans le premier cas, l'arbre infini possède une seule extrémité, n'est pas généralement unimodularisable, mais présente une unimodularité locale. Ces propriétés sont utilisées pour étudier le régime stationnaire de dynamiques aléatoires à valeur de mesure sur cet arbre de Doeblin Bridge, en particulier les dynamiques aléatoires taboues et potentielles. La deuxième partie de cette thèse présente un nouveau modèle de classification hiérarchique conçu spécifiquement pour les ensembles de données comportant un nombre dénombrable de points. La classification hiérarchique est une technique largement utilisée en apprentissage non supervisé pour identifier des groupes au sein d'un ensemble de données en fonction des similarités entre ses éléments. L'algorithme proposé utilise plusieurs niveaux de classification et construit des clusters à chaque niveau en utilisant des chaînes de points ou de clusters les plus proches. Cet algorithme est appliqué au processus ponctuel de Poisson, et il est démontré que l'algorithme de classification définit une forêt phylogénétique sur le processus ponctuel de Poisson, qui est un facteur du processus ponctuel et donc unimodulaire. Diverses propriétés de cette forêt aléatoire, telles que les tailles moyennes des clusters à chaque niveau ou la taille moyenne du cluster d'un nud typique, sont examinées.