Thèse soutenue

Réconciliations : corriger des arbres de gènes et inférer la fiabilité d'événements évolutifs

FR  |  
EN
Auteur / Autrice : Hau Nguyen Thi
Direction : Vincent RanwezVincent Berry
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 03/10/2013
Etablissement(s) : Montpellier 2
Ecole(s) doctorale(s) : Information, Structures, Systèmes (Montpellier ; École Doctorale ; 2009-2014)
Partenaire(s) de recherche : Laboratoire : Amélioration Génétique et Adaptation des Plantes méditerranéennes et tropicales
Jury : Examinateurs / Examinatrices : Alain Franc, Sylvain Glémin
Rapporteurs / Rapporteuses : Eric Tannier, Cédric Chauve

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les génomes des eucaryotes et des procaryotes évoluent de temps en temps par un processus complexe, impliquant entre autres, des événements évolutifs tels que les spéciations, les duplications, les transferts horizontaux, et les pertes de gènes. Nous étudions ici les méthodes de réconciliation, une technique bien connue pour inférer de tels événements et retrouver leur localisation dans l'histoire d'espèces. En effet, ces méthodes construisent une correspondance entre l'histoire d'une famille de gènes (l'arbre de gènes) et l'histoire des espèces contenant ces gènes (l'arbre d'espèces) pour expliquer leurs discordances sur la base d'événements évolutifs qu'elles infèrent et positionnent sur l'arbre de gènes et l'arbre d'espèces. Les méthodes de réconciliation sont appliquées dans plusieurs domaines tels que l'étude de l'évolution du génome; l'inférence des relations d'orthologies en évolution moléculaire; l'étude de la coévolution entre hôtes et parasites en écologie, ou encore l'étude des zones de population en biogéographie. Les trois principales contributions de cette thèse sont les suivantes : premièrement, un outil nommé SEAS est proposé pour simuler l'évolution des familles de gènes dans une phylogénie d'espèces donnée. Cela permet d'obtenir des arbres de gènes synthétiques dont la réconciliation est connue et qui permettent donc d'évaluer la précision des méthodes de réconciliation. Deuxièmement, une méthode heuristique, appelée MowgliNNI, est proposée pour corriger les arbres de gènes partiellement erronés au regard des réconciliations. Cette méthode itérative réarrange les branches faiblement supportées pour rechercher une nouvelle topologie de l'arbre de gènes, dont le coût de réconciliation est moindre. Troisièmement, nous proposons une approche pour estimer la fiabilité des événements évolutifs prédits par les méthodes de réconciliation. Contrairement aux approches existantes qui ne considèrent qu'une des réconciliations optimales possible entre l'arbre de gènes et l'arbre d'espèces, notre approche prend en compte un ensemble de solutions optimales voire sous-optimales. En outre, nous introduisons le concept de réconciliations médianes symétriques et asymétriques qui servent d'éléments centraux pour représenter un ensemble de réconciliations. Nous présentons un algorithme pour calculer ces réconciliations médianes qui est en temps polynomial bien que l'ensemble de toutes les réconciliations optimales est potentiellement exponentiel. Des expériences ont été réalisées pour montrer l'exactitude, la signification et l'efficacité de nos méthodes proposées.