Thèse soutenue

Faire des inférences sur les fonctions des gènes bactériens avec le concept de voisinage in silico
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Tingzhang Wang
Direction : Antoine DanchinClaudine Médigue
Type : Thèse de doctorat
Discipline(s) : Bioinformatique
Date : Soutenance le 15/12/2010
Etablissement(s) : Evry-Val d'Essonne
Ecole(s) doctorale(s) : Ecole doctorale des Génomes aux organismes (Versailles ; 2000-2015)
Jury : Président / Présidente : Bernard Prum
Examinateurs / Examinatrices : Eric Fourmentin, Stéphane Cruveiller
Rapporteurs / Rapporteuses : Frédérique Lisacek, Agnieszka Sekowska

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Avec l'accroissement du nombre de génomes séquencés, l'organisation de ces données brutes et des données dérivées, l'extraction de l'information et des connaissances associées défie l'imagination. La notion de voisinage a été d'abord été introduite pour l'organisation des données dans des bases de données relationnelles. Pour extraire des informations pertinentes à partir de données massives, différents types de voisinages ont été étudiés ici. Tout d'abord, avec l'analysedes correspondances (CA) et en utilisant le regroupement supervisé ("model clustering" MBC), la proximité mutuelle des éléments formant deux entités biologiques centrales, les gènes (codant les protéines) et les acides aminés a été analysée. Nous montrons par exemple que les protéines de Psychromonas ingrahamii, bactérie psychrophile extrêmes, sont regroupées en six classes, et qu'il y a une forte opposition entre le comportement de l'asparagine (N) et des acides aminés sensibles à l'oxygène, ce que nous expliquons en terms de résistance au froid. Ensuite, nous avons analysé la répartition entre les îlots génomiques (GI) et le squelette du génome de base à partir d'une nouvelle méthode combinant composition en bases et en gènes, caractéristiques GI et de briser les synténies. L'application de cette approche à E. coli et B. subtilis a révélé que cette nouvelle méthode permet d'extraire certaines régions significative, non publiées auparavant.Enfin, pour illustrer un voisinage fin, la régulation de l'expression d'un gène et son évolution, nous avons étudié la relation entre les régions en amont du gène et la zone codante du gène thrS de façon approfondie. Nous avons constaté que ces deux régions associées à un gène, se sont comportés différemment dans l'histoire évolutive. Certaines des régions en amont porteuses de la fonction non-essentielle de régulation (qui contrôle l'expression de gène) ont évoluédifféremment de la région codante.