Thèse soutenue

Identification et quantification de souches microbiennes dans des échantillons métagénomiques par utilisation de graphes de variations

FR  |  
EN
Auteur / Autrice : Kévin Da Silva
Direction : Pierre Peterlongo
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 08/03/2022
Etablissement(s) : Rennes 1
Ecole(s) doctorale(s) : MATHSTIC
Partenaire(s) de recherche : Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes)
Jury : Président / Présidente : Éric Pelletier
Examinateurs / Examinatrices : Hélène Touzet, Éric Rivals‎, Nicolas Pons, Magali Berland
Rapporteurs / Rapporteuses : Hélène Touzet, Claudine Médigue

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Les études actuelles se tournent vers l'utilisation de graphes au lieu de références linéaires afin de représenter plusieurs génomes. En parallèle, calculer les abondances des souches dans des échantillons métagénomiques suscite un intérêt croissant. Cela permettrait de mettre en évidence de nouvelles associations entre souches et phénotypes ouvrant des avancées pour le diagnostique et thérapeutiques. Nous avons développé StrainFLAIR, démontrant l'utilisation de graphes de variations dans ce contexte en indexant des séquences génomiques similaires telles que retrouvées entre souches d'une même espèce, et nous proposons de nouvelles solutions algorithmiques afin d'identifier et quantifier les souches à partir d'un ensemble de génomes séquencés en requêtant le graphe. Nous avons validé notre approche sur des données simulées constituées d'un mélange de souches d'une seule espèce. Les résultats montrent que StrainFLAIR a pu identifier les souches présentes dans l'échantillon parmi les références utilisées, détecter la présence de nouvelles souches proches de ces références, et estimer les abondances de ces souches. Nous avons également validé notre approche sur un mock composé de plusieurs espèces et souches. Les résultats montrent à nouveau que StrainFLAIR a pu profiler correctement l'échantillon même dans une configuration plus complexe.