Thèse soutenue

Conception et mise en oeuvre d’une approche bioinformatique dédiée à l’identification des ICE, IME et éléments composites dans les génomes de Firmicutes

FR  |  
EN
Auteur / Autrice : Julie Lao
Direction : Nathalie Leblond-BourgetHélène Chiapello
Type : Thèse de doctorat
Discipline(s) : Écotoxicologie, biodiversité, écosystèmes
Date : Soutenance le 22/02/2021
Etablissement(s) : Université de Lorraine
Ecole(s) doctorale(s) : École doctorale SIReNa - Science et ingénierie des ressources naturelles (Lorraine)
Partenaire(s) de recherche : Laboratoire : Dynamique des génomes et adaptation microbienne (Vandoeuvre-lès-Nancy)
Jury : Président / Présidente : Vincent Burrus
Examinateurs / Examinatrices : Nathalie Leblond-Bourget, Hélène Chiapello, Christine Citti, David Vallenet, Marie-Dominique Devignes
Rapporteurs / Rapporteuses : Christine Citti, David Vallenet

Résumé

FR  |  
EN

Les ICE (Éléments intégratifs conjugatifs) et les IME (Éléments intégratifs mobilisables) sont des éléments mobiles bactériens qui jouent un rôle clé dans les transferts horizontaux. Ils ont la capacité de s'intégrer et de se transférer par conjugaison d'une bactérie à une autre. Ces éléments sont très répandus dans les génomes bactériens mais sont encore mal connus. Leur identification automatique est un défi et ils ne sont en général pas annotés dans les génomes. Jusqu'à présent, seules deux approches bioinformatiques permettent la détection des ICE et la détection des IME, mais leur fiabilité reste très variable, en particulier chez les Firmicutes. De plus, aucune de ces approches ne permet de détecter avec précision les éléments composites constitués d’ICE et d’IME emboîtés ou en accrétions, qui sont fréquemment observés dans des génomes bactériens. Nous avons développé une stratégie et un outil nommé ICEscreen permettant d’identifier les ICE et IME dans les génomes des Firmicutes, y compris les éléments emboîtés ou en accrétions. Notre outil, commence par la détection de quatre protéines signatures (SP) indispensables au fonctionnement de ces éléments puis effectue la détection et le typage des éléments à partir de la colocalisation des SP et de la caractérisation de leur contenu. Notre outil utilise un algorithme dédié permettant de résoudre la structure des éléments qu'ils soient composites ou non. Pour réaliser ces étapes nous avons construit une banque de protéines signatures d’ICE et d’IME de référence à partir d’une liste de gènes connus pour être impliqués dans la dynamique de ces éléments chez les streptocoques ainsi que de profils HMM publics ou construits pour cette étude. Pour valider les résultats d’ICEscreen nous avons construit un jeu de données, FirmiData, constitué de 40 génomes de Firmicutes pour lesquels les ICE et IME ont été annotés semi-manuellement et expertisés. Nous avons ensuite comparé les résultats de ICEscreen avec ceux de deux outils de référence : CONJscan et ICEfinder. ICEscreen détecte la quasi-totalité des éléments de la référence (96 %) ce qui en fait un outil plus performant que CONJscan (58 %) et surtout ICEfinder (53 %) sur notre jeu de données. ICEscreen est ainsi un outil d’aide à l’annotation et à la découverte d’ICE et d’IME dans les génomes de Firmicutes, ce qui peut aider à mieux caractériser leur contribution aux transferts horizontaux de gènes, notamment lors de la transmission de la résistance aux antibiotiques, auxquels ils sont fréquemment associés.