U-statistiques de matrices échangeables ligne-colonne : application à l'analyse de réseaux écologiques
Auteur / Autrice : | Tâm Le Minh |
Direction : | Stéphane Robin, Sophie Donnet, François Massol |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques appliquées |
Date : | Soutenance le 13/11/2023 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale de mathématiques Hadamard (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Mathématiques et Informatique Appliquées (Paris) |
Référent : Faculté des sciences d'Orsay | |
graduate school : Université Paris-Saclay. Graduate School Mathématiques (2020-….) | |
Jury : | Président / Présidente : Sylvain Arlot |
Examinateurs / Examinatrices : Gesine Reinert, Yohann de Castro, François Julien Munoz, Tabea Rebafka | |
Rapporteur / Rapporteuse : Gesine Reinert, Yohann de Castro |
Résumé
Le travail présenté dans cette thèse est essentiellement théorique, mais motivé par des applications écologiques. Les réseaux d'interactions écologiques représentent le fonctionnement d'un écosystème. L'étude de la variabilité des réseaux d'interactions permet de comprendre comment les écosystèmes sont affectés par des facteurs externes. Cette thèse propose une méthodologie d'analyse des réseaux bipartites, applicable aux réseaux écologiques mutualistes. Cette méthodologie est basée sur les U-statistiques de matrices échangeables ligne-colonne. Les matrices échangeables ligne-colonne sont des matrices aléatoires dont la distribution de probabilité jointe est invariante par permutations séparées des lignes et des colonnes. Les U-statistiques correspondent à la classe des statistiques définies comme la moyenne empirique d'une fonction d'un sous-ensemble, sur tous les sous-ensembles d'observations. Les U-statistiques des matrices sont la moyenne de la fonction d'une sous-matrice sur l'ensemble des matrices. En analyse de réseaux, les matrices échangeables ligne-colonne sont les matrices d'adjacence de réseaux bipartites à nœuds échangeables et les U-statistiques peuvent être utilisées comme estimateurs de quantités d'intérêt. Cette thèse se concentre sur le comportement asymptotique des U-statistiques des matrices échangeables ligne-colonne. Dans la première partie, les martingales inverses sont utilisées pour obtenir un théorème limite sur les U-statistiques de matrices échangeables ligne-colonne. Dans la deuxième partie, une décomposition de type Hoeffding est établie pour ces matrices, ce qui étend le théorème limite précédent. Inspiré par cette décomposition, un estimateur de la variance asymptotique est également suggéré, permettant de proposer une méthode générale pour effectuer des tâches d'inférence statistique sur des modèles de réseaux échangeables. La troisième partie de la thèse étend la méthodologie aux U-statistiques dégénérées, qui ont un taux de convergence plus rapide. Ces développements statistiques sont appliqués à l'analyse des réseaux bipartites, y compris les réseaux écologiques mutualistes. De nombreuses questions écologiques s'intéressent à la structure générale des réseaux plutôt qu'à la liste des espèces présentes. Les modèles de réseaux aléatoires à nœuds échangeables, dont les matrices d'adjacence sont échangeables ligne-colonne, sont donc bien adaptés à l'analyse de ces réseaux. Les U-statistiques sont utilisées comme estimateurs de quantités d'intérêt telles que l'hétérogénéité des degrés, les densités de motifs ou des métriques sur les graphons. Il est possible d'obtenir des garanties statistiques pour ces estimateurs, par exemple sous la forme d'intervalles de confiance, grâce aux résultats théoriques et à la méthodologie développée dans cette thèse. Quelques exemples de modèles de réseaux aléatoires échangeables et de U-statistiques sont donnés, répondant à des questions écologiques réelles. Des études de simulation sont utilisées pour valider l'utilisation de cette méthodologie sur ces exemples.