Thèse soutenue

Analyse in silico des genes d'arabidopsis thaliana : description, classification et modelisation pour aider a la prediction des genes
FR
Accès à la thèse
Auteur / Autrice : CATHERINE MATHE
Direction : François Rodolphe
Type : Thèse de doctorat
Discipline(s) : Sciences biologiques fondamentales et appliquées
Date : Soutenance en 2000
Etablissement(s) : Paris 7

Résumé

FR

Constatant l'insuffisante fiabilite des predictions de genes faites sur le genome d'arabidopsis, nous avons cherche les moyens d'y remedier en enrichissant d'abord nos connaissances sur ces genes. Une methode de classification automatique basee sur la composition en codons de sequences codantes d'arabidopsis a conduit a l'obtention de deux classes de genes : l'une reunit les genes fortement exprimes, et utilisant preferentiellement un c (ou un g) en troisieme base des codons ; l'autre contient des genes preferant un t en troisieme base, a expression faible ou moderee, ou codant pour des proteines des organelles. L'exploitation de ces deux classes a montre qu'utiliser deux modeles de genes dans les strategies de predictions ameliore celles-ci. Une autre etude des sequences codantes visait a identifier les contraintes, autres que celle de codage pour une proteine, qui influencent l'usage du code genetique. Les modeles conditionnes par la traduction etudies, parmi lesquels un modele de markov heterogene, ont confirme l'influence du voisinage proche sur le choix parmi codons synonymes. La contre-selection des dinucleotides cg et ta en positions inter-codons a aussi ete mise en evidence. Une autre conclusion est la ressemblance de composition des sequences codantes en phases non-codantes avec les introns (nuancee par la richesse en t de ceux-ci), et leurs relatives differences avec les sequences intergeniques. Enfin, l'exploitation d'un jeu de donnees propre de genes d'arabidopsis, a permis d'etablir des statistiques generales sur les longueurs et compositions des differents elements des genes ainsi que de mieux etudier certains signaux. Cette analyse exhaustive aboutit donc a une meilleure caracterisation des genes d'arabidopsis, qui devrait permettre d'ameliorer sensiblement les modeles utilises dans les predictions de genes.