Thèse soutenue

Méthodes d'analyse comparative de la variabilité intraspécifique des pangénomes procaryotes

FR  |  
EN
Auteur / Autrice : Adelme Bazin
Direction : David Vallenet
Type : Thèse de doctorat
Discipline(s) : Microbiologie
Date : Soutenance le 09/02/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Structure et Dynamique des Systèmes Vivants
Partenaire(s) de recherche : Laboratoire : Génomique métabolique (Evry, Essonne ; 2000-....) - France génomique (Évry, Essonne ; 2014-....)
référent : Université d'Évry-Val-d'Essonne (1991-....)
graduate school : Université Paris-Saclay. Graduate School Life Sciences and Health (2020-....)
Jury : Président / Présidente : Olivier Lespinet
Examinateurs / Examinatrices : Lucie Bittner, Guillaume Fertin, Sophie Abby, Marie Touchon
Rapporteurs / Rapporteuses : Lucie Bittner, Guillaume Fertin

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Ces dernières années ont vu l’émergence de technologies de séquençage permettant l’acquisition massive de données génomiques de millions de procaryotes, majoritairement des bactéries. Loin de ralentir ou de se stabiliser, la quantité de données génomiques récupérées chaque année est toujours plus importante. Une approche clé pour la compréhension des génomes se fait au travers de leur comparaison : les différences comme les similitudes dans les phénotypes d’organismes étudiés peuvent se retrouver aussi dans leurs génomes. Néanmoins, étudier ainsi des milliers, voire des millions de génomes, est informatiquement coûteux car cela nécessite des milliards de comparaisons. Il faut donc développer de nouvelles méthodes, trouver de nouveaux paradigmes pour continuer d’analyser et de comprendre les organismes, leurs génomes et les écosystèmes dans lesquels ils sont retrouvés. Pour faire face à ce défi, des méthodes dites de pangénomiques ont récemment émergé dans le but de compiler l’ensemble de la diversité génomique d’une espèce d’intérêt. À l’origine, les pangénomesne permettaient de comparer que le contenu en gènes des génomes pour déterminer ce qui était commun et ce qui ne l’était pas. Néanmoins, l’information apportée par la présence (ou l’absence) d’un gène ne prend du sens que si elle est rapportée dans son contexte génomique, car une fonction dépend souvent d’un ensemble de gènes. Le but de cette thèse a été de développer un modèle de graphe de pangénome pour pouvoir comparer à la fois les gènes et leur organisation dans des (dizaines de) milliers de génomes procaryotes. Ce modèle a permis de développer des méthodes utilisant ce graphe pour en extraire des informations clés. Ces méthodes concernent notamment la détection d’îlots génomiques qui sont dépositaires de la majorité des acquisitions de nouvelles capacités phénotypiques chez les procaryotes. Elles incluent également l’identification de modules conservés qui sont des groupes de gènes qui fonctionnent potentiellement ensemble pour apporter une même fonction. Toutes ces méthodes ont été regroupées dans une suite logicielle appelée PPanGGOLiN, qui permet ainsi dedécrire la diversité génomique d’une espèce et d’étudier la dynamique de l’acquisition et des échanges de gènes entre ces organismes.