Localisation de gènes et variants par intégration d'informations

par Sylvain Foissac

Thèse de doctorat en Bio-informatique

Sous la direction de Thomas Schiex.

Soutenue en 2004

à Toulouse 3 .


  • Résumé

    L'exploitation des données issues des projets de séquençage des génomes représente un enjeu majeur de la biologie moderne et de la bioinformatique. Une étape déterminante du processus d'annotation est la localisation dans les séquences d'ADN des gènes codant pour des protéines. Le travail réalisé dans le cadre de cette thèse se base sur un logiciel de détection de gènes (EuGène) qui intèges des informations multiples au sein d'un modèle non probabiliste représentant sous la forme d'un graphe (DAG) l'ensemble des structures géniques potentielles d'une séquence ADN. Une méthode d'estimation des paramètres du modèle basée sur une procédure d'optimisation stochastique des performances a permis la prise en compte de nouvelles informations, comme des données d'homologie inter- et intra-génomique. Le problème de la prédiction de variants d'épissage alternatif est également traité, grâce à une nouvelle méthode intégrant les approches intrinsèques et extrinsèques.

  • Titre traduit

    Integrating information for gene and variants predidiction


  • Résumé

    As more genomes are sequenced, the exact localisation of protein-coding genes in genomic DNA sequences is a major challenge in bioinformatics and modern biology. This work is based on a gene finding software (EuGène) that integrates several sources of information in a non-probabilistic graph-based gene structure model (DAG). A weighting parameters estimation method based on a stochastic optimization process has been designed to allow the incorporation of new types of data, like inter- and intra-genomic homology information. The problem of predicting several alternatively spliced variants for one gene has also been adressed by including a transcript data analysis into the global gene finding process, resulting in a new extrinsic/intrinsic integrative approach.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : vi-152 p.
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliographie p.137-150. Index

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paul Sabatier. Bibliothèque universitaire de sciences.
  • Disponible pour le PEB
  • Cote : 2004TOU30207
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.