Thèse soutenue

Developpement d'une base de donnees de genomes microbiens, et etude des sequences chi recombinogenes

FR
Auteur / Autrice : VERONIQUE BIAUDET BRUNAUD
Direction : Stanislav Dusko Ehrlich
Type : Thèse de doctorat
Discipline(s) : Sciences biologiques fondamentales et appliquées. Sciences médicales
Date : Soutenance en 1997
Etablissement(s) : Paris 6

Résumé

FR

Le vingtieme siecle aura vu l'essor de la biologie et l'informatique qui ont evolue ensemble pour une connaissance mutuelle et plus approfondie de ces deux sciences. C'est cette approche bilaterale qui a donne naissance a notre projet. Dans un premier temps, nous avons elabore une base de donnees genomique, micado, construite dans le but de gerer et d'organiser des donnees biologiques. Puis cette these rend compte d'une travail d'analyse applique aux genomes bacteriens, qui repose sur la collaboration entre informatique, statistiques et biologie. Les objectifs du developpement de micado sont de construire une plate-forme pour l'etude des genomes bacteriens, sous l'angle de la stabilite et de la plasticite, et des approches de genomique comparee. Ces buts imposent une base de donnees qui privilegie la diversite des informations et leur accessibilite. Actuellement micado rassemble : les sequences d'adn bacterien et archeen provenant des banques generalistes ; des donnees specifiques par genome, cartes genetiques et jeux de sequences non redondantes, en priorite pour les organismes modeles b. Subtilis et e. Coli ; des donnees d'un nouveau projet europeen d'analyse fonctionnelle des genes inconnus de b. Subtilis. Une interface conviviale a ete developpee sous le systeme world wide web (http://locus. Jouy. Inra. Fr/micado) qui permet un acces direct par internet, et aussi des hyperliens avec d'autres bases de donnees, enrichissant ainsi la diversite des informations. Micado a ete elaboree pour servir d'outil puissant de consultation, et d'extraction de sequences. Elle a servi pour l'analyse de courtes sequences, nommees chi, favorisant la recombinaison chez les bacteries. Cette etude menee chez trois bacteries modeles, e. Coli, b. Subtilis et h. Influenzae, a permis de definir leur frequence, leur sur-representation et le contexte des ces sequences. Ces regles appliquees a d'autres genomes permettront peut-etre de mieux cibler les eventuelles sequences chi d'autres bacteries.