Conception et mise en oeuvre d’une approche bioinformatique dédiée à l’identification des ICE, IME et éléments composites dans les génomes de Firmicutes
Auteur / Autrice : | Julie Lao |
Direction : | Nathalie Leblond-Bourget, Hélène Chiapello |
Type : | Thèse de doctorat |
Discipline(s) : | Écotoxicologie, biodiversité, écosystèmes |
Date : | Soutenance le 22/02/2021 |
Etablissement(s) : | Université de Lorraine |
Ecole(s) doctorale(s) : | École doctorale SIReNa - Science et ingénierie des ressources naturelles (Lorraine ; 2018-....) |
Partenaire(s) de recherche : | Laboratoire : Dynamique des génomes et adaptation microbienne (Vandoeuvre-lès-Nancy) |
Jury : | Président / Présidente : Vincent Burrus |
Examinateurs / Examinatrices : Nathalie Leblond-Bourget, Hélène Chiapello, Christine Citti, David Vallenet, Marie-Dominique Devignes | |
Rapporteurs / Rapporteuses : Christine Citti, David Vallenet |
Résumé
Les ICE (Éléments intégratifs conjugatifs) et les IME (Éléments intégratifs mobilisables) sont des éléments mobiles bactériens qui jouent un rôle clé dans les transferts horizontaux. Ils ont la capacité de s'intégrer et de se transférer par conjugaison d'une bactérie à une autre. Ces éléments sont très répandus dans les génomes bactériens mais sont encore mal connus. Leur identification automatique est un défi et ils ne sont en général pas annotés dans les génomes. Jusqu'à présent, seules deux approches bioinformatiques permettent la détection des ICE et la détection des IME, mais leur fiabilité reste très variable, en particulier chez les Firmicutes. De plus, aucune de ces approches ne permet de détecter avec précision les éléments composites constitués d’ICE et d’IME emboîtés ou en accrétions, qui sont fréquemment observés dans des génomes bactériens. Nous avons développé une stratégie et un outil nommé ICEscreen permettant d’identifier les ICE et IME dans les génomes des Firmicutes, y compris les éléments emboîtés ou en accrétions. Notre outil, commence par la détection de quatre protéines signatures (SP) indispensables au fonctionnement de ces éléments puis effectue la détection et le typage des éléments à partir de la colocalisation des SP et de la caractérisation de leur contenu. Notre outil utilise un algorithme dédié permettant de résoudre la structure des éléments qu'ils soient composites ou non. Pour réaliser ces étapes nous avons construit une banque de protéines signatures d’ICE et d’IME de référence à partir d’une liste de gènes connus pour être impliqués dans la dynamique de ces éléments chez les streptocoques ainsi que de profils HMM publics ou construits pour cette étude. Pour valider les résultats d’ICEscreen nous avons construit un jeu de données, FirmiData, constitué de 40 génomes de Firmicutes pour lesquels les ICE et IME ont été annotés semi-manuellement et expertisés. Nous avons ensuite comparé les résultats de ICEscreen avec ceux de deux outils de référence : CONJscan et ICEfinder. ICEscreen détecte la quasi-totalité des éléments de la référence (96 %) ce qui en fait un outil plus performant que CONJscan (58 %) et surtout ICEfinder (53 %) sur notre jeu de données. ICEscreen est ainsi un outil d’aide à l’annotation et à la découverte d’ICE et d’IME dans les génomes de Firmicutes, ce qui peut aider à mieux caractériser leur contribution aux transferts horizontaux de gènes, notamment lors de la transmission de la résistance aux antibiotiques, auxquels ils sont fréquemment associés.