Thèse en cours

Unimodularité dans les réseaux aléatoires : Applications au graphe de Doeblin récurrent nul et à la classification hiérarchique

FR  |  
EN

Accès à la thèse

AttentionLa soutenance a eu lieu le 26/09/2023. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Sayeh Khaniha
Direction : François Baccelli
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le
Soutenance le 26/09/2023
Etablissement(s) : Université Paris sciences et lettres en cotutelle avec Sharif University of Technology
Ecole(s) doctorale(s) : École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : DIENS - Département d'informatique de l'École normale supérieure
Equipe de recherche : DYOGENE
établissement opérateur d'inscription : Ecole normale supérieure
Jury : Président / Présidente : Eva Löcherbach
Examinateurs / Examinatrices : François Baccelli, Alexandre Gaudilliere, Nicolas Curien, Hermann Thorisson, Kasra Alishahi, Javad Ebrahimi broojeni, Mir-Omid Haji-mirsadeghi
Rapporteurs / Rapporteuses : Nicolas Curien, Ádám Dávid Timar

Résumé

FR  |  
EN

Cette thèse explore la notion d'unimodularité dans le contexte des réseaux aléatoires et ses applications au graphe de Doeblin récurrent nul et aux modèles de classification hiérarchique. L'unimodularité caractérise les réseaux aléatoires enracinés où chaque sommet a une probabilité égale d'être la racine. La première partie de cette thèse se concentre sur les propriétés d'un graphe aléatoire spécifique appelé le graphe de Doeblin, qui est associé à l'algorithme du Coupling from the Past utilisé pour l'échantillonnage parfait de la distribution stationnaire d'une chaîne de Markov. Dans le cas irréductible, apériodique et récurrent positif, il est connu que le graphe de Doeblin Bridge, un sous-graphe du graphe de Doeblin, est un arbre infini qui peut être unimodularisé. Cet arbre infini joue un rôle crucial dans la construction d'un échantillon parfait de l'état stationnaire de la chaîne de Markov. Cette thèse étend l'étude au cas récurrent nul, où il est montré que le graphe de Doeblin Bridge est soit un arbre infini, soit une forêt composée d'une collection dénombrable d'arbres infinis. Dans le premier cas, l'arbre infini possède une seule extrémité, n'est pas généralement unimodularisable, mais présente une unimodularité locale. Ces propriétés sont utilisées pour étudier le régime stationnaire de dynamiques aléatoires à valeur de mesure sur cet arbre de Doeblin Bridge, en particulier les dynamiques aléatoires taboues et potentielles. La deuxième partie de cette thèse présente un nouveau modèle de classification hiérarchique conçu spécifiquement pour les ensembles de données comportant un nombre dénombrable de points. La classification hiérarchique est une technique largement utilisée en apprentissage non supervisé pour identifier des groupes au sein d'un ensemble de données en fonction des similarités entre ses éléments. L'algorithme proposé utilise plusieurs niveaux de classification et construit des clusters à chaque niveau en utilisant des chaînes de points ou de clusters les plus proches. Cet algorithme est appliqué au processus ponctuel de Poisson, et il est démontré que l'algorithme de classification définit une forêt phylogénétique sur le processus ponctuel de Poisson, qui est un facteur du processus ponctuel et donc unimodulaire. Diverses propriétés de cette forêt aléatoire, telles que les tailles moyennes des clusters à chaque niveau ou la taille moyenne du cluster d'un nœud typique, sont examinées.