Estimation par maximum de vraisemblance dans des modèles à blocs stochastiques dynamiques ou spatiaux
Auteur / Autrice : | Léa Longepierre |
Direction : | Catherine Matias |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 02/07/2020 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de probabilités, statistique et modélisation (Paris ; 2018-....) |
Jury : | Président / Présidente : Fabrice Rossi |
Examinateurs / Examinatrices : Matthieu Latapy, Nathalie Peyrard | |
Rapporteur / Rapporteuse : Christine Keribin, Nial Friel |
Mots clés
Mots clés contrôlés
Résumé
Cette thèse porte sur le maximum de vraisemblance dans des versions dynamiques et spatiales du modèle à blocs stochastiques (SBM) fondées respectivement sur des chaînes et champs de Markov cachés. D’abord, on considère une version dynamique du SBM adaptée à l’observation de réseaux à différents pas de temps. Dans ce modèle, les nœuds sont répartis dans des groupes latents et la connexion entre deux nœuds suit une loi de Bernoulli dont le paramètre dépend du groupe de ces nœuds. L’évolution temporelle des appartenances aux groupes est modélisée par une chaîne de Markov cachée. On prouve la consistance (lorsque les nombres de nœuds et pas de temps augmentent) des estimateurs du maximum de vraisemblance et variationnels des paramètres, et on obtient des bornes supérieures pour leur taux de convergence. On explore aussi le cas où le nombre de pas de temps est fixé et les probabilités de connexion varient dans le temps. On obtient également des résultats concernant l’identifiabilité des paramètres. Ensuite, on introduit une version spatiale du SBM adaptée à l’observation de réseaux à différentes localisations. Les nœuds sont répartis dans des groupes latents et la connexion entre deux nœuds suit une loi de Bernoulli dont le paramètre dépend du groupe de ces nœuds. L’évolution spatiale des appartenances aux groupes des nœuds est modélisée par des champs de Markov cachés. On montre que le paramètre est génériquement identifiable sous certaines conditions. Pour l’estimation des paramètres, on propose d’adapter à notre modèle une variante de l’algorithme Espérance-Maximisation (EM) reposant sur une approximation de type champ moyen grâce à la simulation de configurations latentes.