Thèse soutenue

De l'analyse du génome de Pyrococcus abyssi à l'étude de protéines informationnelles : Stratégies de validation et d'exploitation des données en génomique comparative

FR
Auteur / Autrice : Odile Lecompte
Direction : Olivier Poch
Type : Thèse de doctorat
Discipline(s) : Bioinformatique
Date : Soutenance en 2002
Etablissement(s) : Université Louis Pasteur (Strasbourg) (1971-2008)

Résumé

FR  |  
EN

Avec la génomique, la quantité et la diversité des séquences se sont considérablement accrues mais, parallèlement, les erreurs de prédiction et d'annotation se multiplient. Nous nous sommes attachés à développer des protocoles d'étude et de validation applicables à l'analyse de génomes ou de familles de protéines. L'annotation et l'analyse du génome de Pyrococcus abyssi, une archée hyperthermophile, a permis la définition d'un schéma général de visualisation et d'étude de données génomiques massives et le développement de la plate-forme logicielle GScope. Nous avons ainsi annoté 1765 gènes protéiques sur le génome de P. Abyssi et étudié leur phylogénie. Cette analyse montre une remarquable diversité du phylome, de nombreux gènes impliqués dans l'hétrotrophie ayant été acquis par transfert horizontal depuis des bactéries. Notre comparaison de 3 génomes complets de Pyrococcus a par ailleurs révélé des éléments responsables de la plasticité génomique des Archaea. Enfin, une méthode originale de détection des véritables orthologues a révélé l'important polymorphisme des Pyrococcus et remet en cause l'hypothèse de l'horloge moléculaire dans cette lignée. La seconde partie de notre travail a été consacrée à l'analyse de protéines informationnelles et s'est appuyée sur la puissance intégrative de l'alignement multiple. Nous avons ainsi pu démontrer le recrutement d'un nouveau domaine responsable de l'activité exonucléase de l'ADN polymérase D. L'étude des conservations différentielles au sein des familles d'aminoacyl ARNt synthétases a par ailleurs abouti à l'identification de cibles d'antibiotiques. Enfin, nous avons répertorié les protéines ribosomiques dans 66 génomes complets. La distribution phylogénétique est particulièrement intéressante chez les Archaea puisque 15% des protéines ribosomiques ont été perdues au cours de l'évolution, constituant le premier exemple d'évolution réductive à l'échelle d'un domaine du vivant.