Thèse soutenue

Apprentissage bayésien des associations d'espèces

FR  |  
EN
Auteur / Autrice : Daria Bystrova
Direction : Julyan ArbelWilfried Thuiller
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 03/07/2023
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Jean Kuntzmann (Grenoble ; 2007-....)
Equipe de recherche : Equipe-projet Modelling and inference of complex and structured stochastic systems (Montbonnot, Isère, France ; 200.-2020)
Jury : Président / Présidente : François Julien Munoz
Examinateurs / Examinatrices : Pierre Gloaguen
Rapporteur / Rapporteuse : Sophie Donnet, Raffaele Argiento

Résumé

FR  |  
EN

Il est important de comprendre comment les systèmes écologiques et la biodiversité réagissent à l'évolution des conditions environnementales pour élaborer des stratégies d'atténuation et d'adaptation à l'utilisation des sols et aux changements climatiques en cours. En théorie, la répartition spatiale des espèces dépend des conditions abiotiques, mais aussi de l'interaction des espèces entre elles. Il est extrêmement difficile d'étudier les relations entre les nombreuses espèces présentes dans de multiples écosystèmes dans des conditions abiotiques variables, étant donné le large éventail d'organismes et les types d'interactions potentielles entre elles. Le premier objectif de cette thèse est d'étudier différentes approches pour apprendre la structure de dépendance entre les espèces à partir des données de cooccurrence observées. Les trois premiers chapitres examinent les modèles de distribution conjointe des espèces (JSDM), parmi lesquels le chapitre 1 passe en revue l'état de l'art des JSDM qui utilisent des facteurs latents pour la réduction des dimensions, le chapitre 2 introduit une extension d'un JSDM connu, qui permet une réduction supplémentaire des dimensions et permet d'inclure des connaissances a priori dans le regroupement de la matrice de covariance des résidus, et le chapitre 3 discute des avantages et des erreurs d'interprétation possibles des JSDM. Ensuite, le chapitre 4 présente une nouvelle distribution a priori pour les modèles graphiques bayésiens qui impose une structure bloc-diagonale à la matrice de précision. Enfin, les chapitres 5 et 6 étudient les méthodes de découverte causale pour l'apprentissage des relations causales entre les espèces.En particulier, le chapitre 5 étudie l'applicabilité des algorithmes de découverte causale basés sur les contraintes aux données d'observation ponctuelles collectées à partir de systèmes écologiques dynamiques et le chapitre 6 introduit de nouveaux algorithmes hybrides pour la découverte causale à partir de séries temporelles observationelles.Le deuxième objectif de la thèse est d'étudier les propriétés théoriques du clustering non paramétrique bayésien. En particulier, le chapitre 7 introduit une nouvelle approximation de la distribution a priori sur le nombre de clusters pour les processus de type Gibbs et l'évalue en comparaison avec d'autres approximations existantes. Le chapitre 8 étudie l'inconsistence a posteriori pour le nombre de clusters lorsque le nombre réel de clusters est fini pour les modèles de mélange non paramétriques bayésiens. Notamment, ce chapitre étend des résultats d'inconsistence pour les processus de Dirichlet et de Pitman--Yor à une classe plus large de distributions a priori: les distributions a priori de type Gibbs et certaines de leurs représentations de dimension finie.