Méthodes d'analyse comparée des pangénomes procaryotes : explorer la diversité génomique inter-espèces pour une meilleure compréhension du métabolisme
| Auteur / Autrice : | Jérôme Arnoux |
| Direction : | David Vallenet, Alexandra Calteau |
| Type : | Thèse de doctorat |
| Discipline(s) : | Sciences de la vie et de la santé |
| Date : | Soutenance le 19/05/2025 |
| Etablissement(s) : | université Paris-Saclay |
| Ecole(s) doctorale(s) : | École doctorale Structure et Dynamique des Systèmes Vivants |
| Partenaire(s) de recherche : | Laboratoire : Génomique métabolique (Evry, Essonne ; 2000-....) |
| Référent : Université d'Évry-Val-d'Essonne (1991-....) | |
| graduate school : Université Paris-Saclay. Graduate School Life Sciences and Health (2020-....) | |
| Jury : | Président / Présidente : Stéphanie Bury-Moné |
| Examinateurs / Examinatrices : Lucie Bittner, Jean Cury | |
| Rapporteurs / Rapporteuses : Lucie Bittner, François Sabot |
Mots clés
Résumé
L'essor des projets de séquençage a généré plus d'un million de génomes procaryotes dans les bases publiques, nécessitant de nouvelles approches pour analyser cette masse de données. La suite logicielle PPanGGOLiN a été développée pour structurer ces informations sous forme de graphes de pangénome, permettant de compresser les données tout en conservant l'information de colocalisation des gènes. Elle intègre également des méthodes d'analyse de pangénome, panRGP, qui identifie les régions de plasticité génomique, et panModule, qui caractérise ces régions variables en sous-modules fonctionnels. Malgré ces avancées, aucune méthode ne permettait de comparer des pangénomes. Les travaux de cette thèse ont consisté à développer de nouvelles approches pour combler cette lacune. Tout d'abord, PPanGGOLiN a été enrichie par l'intégration de nouvelles méthodes, comme la recherche de contextes génomiques, et par une amélioration de son environnement logiciel. Ensuite, la méthode PANORAMA, qui se base sur les graphes de PPanGGOLiN, a été conçue pour annoter des systèmes macromoléculaires, en combinant des critères de présence/absence de fonctions et de colocalisation génomique, et pour comparer des pangénomes. Appliqué aux systèmes de défense bactériens contre les phages, PANORAMA a permis d'identifier des systèmes et des sites d'insertions conservés entre différentes espèces. Finalement, un premier prototype de base de données orientée graphe a été développé pour intégrer les données de plusieurs pangénomes afin d'exploiter au mieux leur information. Cette approche a permis d'analyser et de comparer des milliers de génomes bactériens et d'identifier des modules d'antibiorésistance communs à plusieurs espèces, mettant en lumière des mécanismes évolutifs partagés. Ces travaux ouvrent la voie à la pangénomique comparée, offrant un cadre inédit pour explorer le potentiel adaptatif des procaryotes et mieux comprendre leur dynamique évolutive. En facilitant la comparaison des pangénomes et l'identification de contextes génomiques conservés, ces développements contribuent à l'étude des interactions entre bactéries et à la caractérisation de systèmes biologiques d'intérêt.