Thèse soutenue

Reconstruction phylogénétique par analyse bayésienne des séquences moléculaires

FR  |  
EN
Auteur / Autrice : Samuel Blanquart
Direction : Olivier GascuelNicolas Lartillot
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2007
Etablissement(s) : Montpellier 2

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Deux nouveaux modèles pour la reconstruction phylogénétique probabiliste ont été développés, non stationnaires et non paramétriques. Selon ces modèles, un processus stochastique continu introduit des variations des probabilités stationnaires des processus Markoviens de substitution, induisant de manière inédite une dimensionnalité libre. Le second modèle combine cette composante non stationnaire avec un modèle de mélange défini sur les positions de l'alignement de séquences homologues. Cette combinaison modélise conjointement les variations du processus d'évolution, au cours du temps, et le long des séquences, lesquelles résultent respectivement des contraintes biochimiques appliquées aux sites, ainsi que des dérives compositionnelles. Ces deux modèles ont été implémentés dans un cadre Chaînes de Markov Monte Carlo (MCMC) et mis à disposition de la communauté des phylogénéticiens. Les modèles se sont avérés robustes contre plusieurs artefacts phylogénétiques et leurs comportements respectifs suggèrent de plus une interprétation nouvelle des artéfacts d'attraction des longues branches (LBA). La thèse présente enfin une série de perspectives théoriques portant sur les améliorations encore nécessaires, tant en terme de complexité algorithmique de l'échantillonnage MCMC, que de qualité des inférences