Estimateurs de biodiversité robustes pour le métabarcoding
Auteur / Autrice : | Sylvain Moinard |
Direction : | Eric Coissac, Christelle Melo de lima |
Type : | Projet de thèse |
Discipline(s) : | Biodiversité-Ecologie-Environnement |
Date : | Inscription en doctorat le Soutenance le 13/12/2023 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale chimie et science du vivant |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'ECologie Alpine |
Jury : | Président / Présidente : François Pompanon |
Examinateurs / Examinatrices : Eric Coissac, Christelle Gonindard, Nigel Gilles Yoccoz, Guillaume Achaz, Lucie Zinger, Purificación Lopez-garcia | |
Rapporteurs / Rapporteuses : Nigel Gilles Yoccoz, Guillaume Achaz |
Mots clés
Mots clés libres
Résumé
Du fait de lactivité humaine, la biodiversité connaît un bouleversement rapide à léchelle mondiale : extinction despèces, diminution des populations, introduction despèces invasives... Pour mettre en place des mesures de conservation, il faut être capable d'évaluer létat de la biodiversité sur un site donné. De nombreux indicateurs existent mais lobservation directe des espèces pour les calculer est laborieuse. Létude de lADN environnemental par le métabarcoding permet de dépasser cette limite et fournit une source dinformation prometteuse pour améliorer la gestion des écosystèmes. Cependant, lestimation des abondances relatives des espèces est encore mal établie pour les données de métabarcoding à cause de biais introduits au cours de l'expérience et de lincertitude de l'identification des espèces présentes. Pendant ma thèse, j'ai cherché à améliorer les aspects quantitatifs du métabarcoding sur le plan expérimental et en développant de nouveaux outils théoriques danalyse. Ma thèse comporte trois chapitres. Le premier chapitre est consacré à un nouvel algorithme dinférence de paramètres pour modèles aléatoires, appelé Fixed Landscape Inference MethOd (flimo). Il est applicable à une large gamme de modèles utilisés en écologie, pour le métabarcoding mais aussi en génétique des populations ou en dynamique des populations. Il fonctionne dans le même cadre que les algorithmes dApproximate Bayesian Computation (ABC) en procédant par simulations du modèle sans considérer sa vraisemblance. Sur les exemples étudiés, les résultats de flimo sont obtenus beaucoup plus vite que pour les algorithmes utilisés en comparaison avec une précision similaire. Le deuxième chapitre présente mes travaux sur le métabarcoding quantitatif. Deux des biais du processus ont été mesurés expérimentalement et je propose un protocole simple pour les corriger. Le premier biais est lié à la variabilité inter-spécifique du nombre de copies des portions dADN ciblées par le métabarcoding et a été mesuré par digital droplet PCR. Le second biais est dû à lamplification plus ou moins efficace des différents marqueurs au cours de la PCR. Ce biais a été mesuré à la fois par qPCR Taqman et retrouvé numériquement à partir dun mélange dADN de composition connue. Ces travaux sont appuyés par le développement dun modèle mathématique de PCR qui décrit mieux le phénomène que les modèles couramment utilisé en métabarcoding. Le troisième chapitre aborde le sujet de lattribution des séquences observées dans les données de métabarcoding à des espèces réelles. Je montre des limites des algorithmes communs de traitement des séquences et propose des pistes damélioration pour un algorithme existant, obiclean, qui trie les séquences sur la base dun graphe de mutation. Les séquences sont attribuées aux espèces de manière probabiliste sur la base de la vraisemblance dun modèle derreur et en observant les co-occurrences des différents variants au sein dun jeu de données avec de multiples échantillons indépendants. Les mesures de biodiversité sont ensuite adaptées à ce contexte aléatoire. Mes travaux ont apporté plusieurs contributions à la recherche en écologie. Jai émis plusieurs idées nouvelles pour interpréter les données de métabarcoding, en affinant la compréhension des processus qui affectent leur qualité et en proposant des solutions réalistes pour les analyser. Mes travaux méthodologiques de modélisation et de développement algorithmique me semblent aussi importants pour améliorer les outils statistiques utilisés en écologie.