Thèse soutenue

Extension des modèles stochastiques de substitution de nucléotides et son implémentation informatique

FR  |  
EN
Auteur / Autrice : Emmanuel Benard
Direction : Christian Michel
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2011
Etablissement(s) : Strasbourg

Résumé

FR  |  
EN

Le premier modèle stochastique d'évolution de gènes a été développé par Jukes et Cantor en 1969. Ne prenant en compte qu'un paramètre de substitution par nucléotide, il a ensuite été généralisé, notamment avec les modèles à deux (Kimura 1980) et trois paramètres de substitution (Kimura 1981). Plus tard, ces modèles ont été étendus aux dinucléotides et trinucléotides (Frey et Michel 2006 ; Michel 2007). Ces derniers permettent d'étudier l'évolution des probabilités d'occurrence de motifs génétiques au cours du temps dans les deux sens d'évolution direct (passé-présent) et inverse (présent-passé), à l'aide de solutions analytiques fonctions de paramètres de substitution. Dans ce travail, nous nous sommes intéressés dans un premier temps à l'extension de ces modèles stochastiques de substitution de nucléotides, dinucléotides et trinucléotides à des motifs génétiques de taille quelconque en proposant une nouvelle approche basée sur les opérateurs de Kronecker. Nous avons également consacré une partie au développement d'un logiciel de recherche SEGM (Stochastic Evolution of Genetic Motifs) permettant le calcul de probabilités d'occurrence analytiques de motifs génétiques de taille 1 à 5 et de courbes d'évolution de ces probabilités. Nous avons réalisé une étude évolutive inverse des sites d'épissage des introns du génome humain en utilisant notamment SEGM. Dans une troisième partie, nous avons développé un modèle stochastique numérique d'évolution de trinucléotides avec blocage dynamique des substitutions, puis nous l'avons appliqué à l'évolution des codons du code circulaire universel X0 découvert dans les gènes d'eucaryotes et de procaryotes en 1996 par Arquès et Michel.