Exploitation automatisée des contextes métabolique et génomique pour l'annotation fonctionnelle des génomes prokaryotes
Auteur / Autrice : | Adam Alexander Thil Smith |
Direction : | Claudine Médigue |
Type : | Thèse de doctorat |
Discipline(s) : | Bioinformatique |
Date : | Soutenance le 03/02/2012 |
Etablissement(s) : | Evry-Val d'Essonne |
Ecole(s) doctorale(s) : | Ecole doctorale des Génomes aux organismes (Versailles ; 2000-2015) |
Jury : | Président / Présidente : Florence D'Alché-Buc |
Examinateurs / Examinatrices : Alain Viari, Christos Ouzounis, David Vallenet | |
Rapporteurs / Rapporteuses : Antoine Danchin, Marie-France Sagot |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse porte sur le développement d'approches bioinformatiques exploitant de l'information de contextes génomiques et métaboliques afin de générer des annotations fonctionnelles de gènes prokaryotes, et comporte deux projets principaux. Le premier projet focalise sur les activités enzymatiques orphelines de séquence. Environ 27% des activités définies par le International Union of Biochemistry and Molecular Biology sont encore aujourd'hui orphelines. Pour celles-ci, les méthodes bioinformatiques traditionnelles ne peuvent proposer de gènes candidats; il est donc impératif d'utiliser des méthodes exploitant des informations contextuelles dans ces cas. La stratégie CanOE (fishingCandidate genes for Orphan Enzymes) a été développée et rajoutée à la plateforme MicroScope dans ce but, intégrant des informations génomiques et métaboliques sur des milliers d'organismes prokaryotes afin de localiser des gènes probants pour des activités orphelines. Le projet miroir au précédent est celui des protéines de fonction inconnue. Un projet collaboratif a été initié au Genoscope afin de formaliser les stratégies d'exploration des fonctions de familles protéiques prokaryotes. Une version pilote du projet a été mise en place sur la famille “DUF849” dont une fonction enzymatique avait été récemment découverte. Des stratégies de proposition d'activités enzymatiques alternatives et d'établissement de sous familles isofonctionnelles ont été mises en place dans le cadre de cette thèse, afin de guider les expérimentations de paillasse et d'analyser leurs résultats.