Thèse soutenue

Prédiction des pathologies humaines par le développement de réseaux neuronaux profonds basés sur la structure du microbiote au niveau de l'espèce

FR  |  
EN
Auteur / Autrice : Oshma Chakoory
Direction : Pierre Peyret
Type : Thèse de doctorat
Discipline(s) : Bioinformatique
Date : Soutenance le 30/11/2023
Etablissement(s) : Université Clermont Auvergne (2021-...)
Ecole(s) doctorale(s) : École doctorale des sciences de la vie, santé, agronomie, environnement (Clermont-Ferrand)
Partenaire(s) de recherche : Laboratoire : Microbiologie Environnement Digestif et Santé
Jury : Président / Présidente : Vincent Barra
Examinateurs / Examinatrices : Sophie Comtet-Marre, Fabien Magne
Rapporteur / Rapporteuse : Hélène Touzet, Thérèse Commes-Maerten

Résumé

FR  |  
EN

Depuis l'intensification des recherches sur les microbiotes associés à l'homme, de nombreuses études ont souligné leur implication dans la santé et les maladies. Néanmoins, l'identification de biomarqueurs microbiens précoces et spécifiques d'une maladie reste particulièrement difficile en raison de la complexité des microbiotes, des multiples interactions ayant lieu entre leurs membres et avec l'hôte, ainsi que du fait des variabilités inter-individuelles. Ces limites réduisent ainsi considérablement les possibilités de prédiction des maladies.Dans ce travail, nous avons implémenté une stratégie d'intelligence artificielle (IA) pour répondre à cette problématique rencontrée dans deux pathologies périnatales : l'accouchement prématuré (AP) et l'entérocolite ulcéro-nécrosante (ECUN), qui constituent des problèmes majeurs de santé pour les nouveau-nés prématurés. Des réseaux de neurones profonds (DNN), encore peu exploités en microbiologie, ont été développés pour prédire ces pathologies à partir de données de diversité de microbiotes associées à des données cliniques. Pour maximiser la performance de ces DNNs, un chainage bio-informatique RiboTaxa a été développé afin de fournir la structure précise des microbiotes. RiboTaxa s'appuie sur la reconstruction de la séquence complète du gène exprimant la petite sous-unité de l'ARN ribosomique et tire parti des bases de données de référence parmi les plus complètes pour obtenir une résolution taxonomique jusqu'au niveau de l'espèce, assortie d'une évaluation précise des abondances relatives des espèces identifiées. Les données de séquençage métagénomique direct déjà publiées provenant de plusieurs cohortes associées aux pathologies de l'AP et de l'ECUN ont été analysées avec RiboTaxa puis utilisées pour l'entrainement de DNNs. Cette stratégie contrôlée a permis d'obtenir d'excellents résultats pour la prédiction de l'AP et de l'ECUN. De manière originale, les modèles DNN optimisés ont également été testés avec de nouvelles cohortes afin d'évaluer leur généralisation à de nouvelles données. L'interprétation des modèles DNN via la technique SHAP a révélé l'implication à la fois d'espèces dominantes et peu abondantes pour la prédiction de l'AP et de l'ECUN, mettant en évidence une signature microbienne complexe de ces pathologies. Nos résultats suggèrent ainsi que la diversité microbienne globale, tenant compte de la variabilité interindividuelle, et non de la présence d'espèces particulières, constitue l'indicateur le plus pertinent de prédiction de ces pathologies.Finalement, ce travail offre la perspective aux cliniciens de prédire les pathologies de l'AP et de l'ECUN avant leur apparition, ouvrant ainsi la voie à un suivi précoce des patients et à l'identification de stratégies de prévention efficaces. En outre, ces travaux illustrent les opportunités futures pour la mise en place d'une médecine de précision permettant de proposer des thérapies médicales individualisées.