Thèse soutenue

Localisation de gènes et variants par intégration d'informations

FR  |  
EN
Auteur / Autrice : Sylvain Foissac
Direction : Thomas Schiex
Type : Thèse de doctorat
Discipline(s) : Bio-informatique
Date : Soutenance en 2004
Etablissement(s) : Toulouse 3

Résumé

FR  |  
EN

L'exploitation des données issues des projets de séquençage des génomes représente un enjeu majeur de la biologie moderne et de la bioinformatique. Une étape déterminante du processus d'annotation est la localisation dans les séquences d'ADN des gènes codant pour des protéines. Le travail réalisé dans le cadre de cette thèse se base sur un logiciel de détection de gènes (EuGène) qui intèges des informations multiples au sein d'un modèle non probabiliste représentant sous la forme d'un graphe (DAG) l'ensemble des structures géniques potentielles d'une séquence ADN. Une méthode d'estimation des paramètres du modèle basée sur une procédure d'optimisation stochastique des performances a permis la prise en compte de nouvelles informations, comme des données d'homologie inter- et intra-génomique. Le problème de la prédiction de variants d'épissage alternatif est également traité, grâce à une nouvelle méthode intégrant les approches intrinsèques et extrinsèques.