Thèse soutenue

Apprentissage statistique de collections de réseaux avec applications en écologie et en sociologie

FR  |  
EN
Auteur / Autrice : Saint-Clair Chabert-Liddell
Direction : Sophie DonnetPierre Barbillon
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 17/03/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Mathématiques et Informatique Appliquées (Paris)
référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Mathématiques (2020-....)
Jury : Président / Présidente : Liliane Bel
Examinateurs / Examinatrices : Pierre Latouche, Nathalie Peyrard, Stéphane Dray, Tabea Rebafka, Aleš Žiberna
Rapporteurs / Rapporteuses : Pierre Latouche, Nathalie Peyrard

Résumé

FR  |  
EN

Cette thèse porte sur le développement de méthodes statistiques pour l'analyse de collections de réseaux d'interactions à travers trois contributions originales. Les réseaux d'interactions constituent une façon naturelle de représenter sous forme de graphe les échanges ou relations existant entre un ensemble de noeuds représentant des espèces ou des individus. Considérer des collections de réseaux permet d’étudier des systèmes hétérogènes, composés de plusieurs sortes d’interactions impliquant différents types de n{oe}uds. Lorsque les différents réseaux de la collection sont liés par une relation hiérarchique, nous parlerons de réseaux multiniveaux. Le modèle à blocs stochastiques a prouvé sa pertinence pour modéliser l’hétérogénéité du comportement des noeuds dans un unique réseau. Des extensions aux collections de réseaux et aux réseaux multiniveaux sont proposées. Elles permettent d'obtenir un clustering des noeuds des réseaux en fonction de leur rôle dans l’écosystème ou le système social, et de résumer la structure du système à l’échelle mésoscopique à travers un faible nombre de paramètres. L’inférence de ces modèles est complexe et des méthodes variationnelles sont adaptées à cette fin. Des méthodes de sélection de modèles permettent également de déterminer la dépendance entre les niveaux pour les réseaux multiniveaux et la similarité entre les structures pour les collections de réseaux.Une dernière partie de cette thèse propose une nouvelle méthode pour étudier la robustesse de réseaux d’interactions écologiques. Chaque réseau est modélisé par un modèle probabiliste dont les paramètres représentent la structure du réseau. Cela permet de faire le lien entre la structure de l’écosystème et sa robustesse, mais aussi de comparer les robustesses d’une collection de réseaux et de corriger la robustesse d’un réseau dont l'échantillonage serait incomplet.Les méthodes développées sont implémentées dans des packages R et appliquées sur des données issues des sciences sociales et de l’écologie.