Analyse statistique et évolution des séquences d'acides nucléiques
Auteur / Autrice : | Christian Gautier |
Direction : | Richard Grantham |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences |
Date : | Soutenance en 1987 |
Etablissement(s) : | Lyon 1 |
Jury : | Président / Présidente : Richard Grantham |
Mots clés
Mots clés contrôlés
Résumé
Une description statistique des regions des genomes codant pour les proteines (les ''parties codantes'') est presentee. La methodologie utilise a la fois une modelisation de l'information et des outils de description. Les schemas entite-association constituent un outil de representation des relations logiques entre des jets biologiques. La description des sequences a utilise essentiellement des methodes multivariees et des statistiques non parametriques. Ces analyses montrent l'existence de biais importants dans l'usage du code ainsi que dans certaines relations de voisinage entre bases. Ces biais peuvent s'interpreter, au moins en partie, comme resultant de contraintes liees aux differents processus moleculaires auxquels participent ces sequences. Chez e. Coli, le processus de traduction a ete clairement mis en cause. Une repercussion de ces contraintes sont la nature de la proteine codee a pu etre mise en evidence dans plusieurs cas. L'observation de biais tres differents dans des sequences homologues (en particulier mitochondrial) a permis de discuter de la stationnarite du processus evolutif