Thèse soutenue

Representation et analyse des genomes : application au projet de sequencage du genome de bacillus subtilis

FR  |  
EN
Auteur / Autrice : Ivan Moszer
Direction : Antoine Danchin
Type : Thèse de doctorat
Discipline(s) : Sciences biologiques et fondamentales appliquées. Psychologie
Date : Soutenance en 1996
Etablissement(s) : Paris 6

Résumé

FR

La determination de la sequence de genomes entiers constitue depuis quelques annees un pan important de la genetique moderne. De nombreux projets se sont mis en place pour mener a bien ces experiences de grande envergure. En attendant les progres techniques necessaires au sequencage du genome humain, les efforts se sont concentres sur des organismes modeles, parmi lesquels la bacterie bacillus subtilis, parangon des bacteries a gram-positif. Un programme international associant 15 laboratoires europeens et 6 laboratoires japonais s'est fixe comme objectif l'obtention de la sequence complete du chromosome de b. Subtilis, long de 4 188 kb, pour le debut de l'annee 1997. Nous avons participe a la gestion et a l'analyse des donnees issues du sequencage systematique des laboratoires europeens. Dans un premier temps, nous avons construit une base de donnees consacree au genome de b. Subtilis, subtilist. Celle-ci, developpee sur micro-ordinateur macintosh avec le systeme de gestion de bases de donnees relationnel 4e dimension, contient les sequences genomiques de b. Subtilis et les caracteristiques associes, telles que la position et la description des genes et des signaux de regulation. L'outil ainsi constitue nous a permis de disposer d'un jeu de donnees sur le genome de b. Subtilis, non redondant, verifie apres consultation de la litterature scientifique, ou les differents types d'informations sont logiquement connectes. Il permet d'effectuer aisement des recherches multi-criteres ou des extractions specifiques de donnees, en vue d'analyses informatiques portant sur la biologie de cet organisme. Trois types d'applications ont ete realisees. Tout d'abord, subtilist a constitue un support essentiel a la bonne marche du projet genome, nous permettant de verifier et d'analyser les sequences determinees par les participants europeens, que notre laboratoire etait charge de centraliser. Parallelement a cette activite, nous avons mis en place des moyens efficaces de diffusion de cet ensemble d'informations, par la realisation d'une interface conviviale semi-graphique, disponible par ftp anonyme, et en developpant un serveur world wide web. Enfin, nous avons conduit les premieres analyses statistiques sur le genome de b. Subtilis, en deux volets distincts. Une etude de la composition fonctionnelle en genes de b. Subtilis nous a permis d'etablir une classification pour l'ensemble des genes de fonction connue, et de souligner la forte proportion de genes pour lesquels aucune fonction ne peut etre proposee. Cette derniere caracteristique, similaire aux resultats obtenus pour d'autres projets genomes, montre combien nous avons encore a apprendre sur le fonctionnement d'une cellule vivante. Nous avons egalement mene une etude sur l'usage du code chez b. Subtilis. A l'aide de techniques statistiques d'analyse de donnees, nous avons pu proposer l'existence probable de plusieurs phages cryptiques dans le genome de b. Subtilis, et mettre en evidence des contraintes globales sur l'usage du code, identiques chez b. Subtilis et deux autres organismes, la bacterie escherichia coli et la levure saccharomyces cerevisiae.