Réconciliations : corriger des arbres de gènes et inférer la fiabilité d'événements évolutifs

par Hau Nguyen Thi

Thèse de doctorat en Informatique

Sous la direction de Vincent Ranwez et de Vincent Berry.

Le jury était composé de Alain Franc, Sylvain Glémin.

Les rapporteurs étaient Eric Tannier, Cédric Chauve.


  • Résumé

    Les génomes des eucaryotes et des procaryotes évoluent de temps en temps par un processus complexe, impliquant entre autres, des événements évolutifs tels que les spéciations, les duplications, les transferts horizontaux, et les pertes de gènes. Nous étudions ici les méthodes de réconciliation, une technique bien connue pour inférer de tels événements et retrouver leur localisation dans l'histoire d'espèces. En effet, ces méthodes construisent une correspondance entre l'histoire d'une famille de gènes (l'arbre de gènes) et l'histoire des espèces contenant ces gènes (l'arbre d'espèces) pour expliquer leurs discordances sur la base d'événements évolutifs qu'elles infèrent et positionnent sur l'arbre de gènes et l'arbre d'espèces. Les méthodes de réconciliation sont appliquées dans plusieurs domaines tels que l'étude de l'évolution du génome; l'inférence des relations d'orthologies en évolution moléculaire; l'étude de la coévolution entre hôtes et parasites en écologie, ou encore l'étude des zones de population en biogéographie. Les trois principales contributions de cette thèse sont les suivantes : premièrement, un outil nommé SEAS est proposé pour simuler l'évolution des familles de gènes dans une phylogénie d'espèces donnée. Cela permet d'obtenir des arbres de gènes synthétiques dont la réconciliation est connue et qui permettent donc d'évaluer la précision des méthodes de réconciliation. Deuxièmement, une méthode heuristique, appelée MowgliNNI, est proposée pour corriger les arbres de gènes partiellement erronés au regard des réconciliations. Cette méthode itérative réarrange les branches faiblement supportées pour rechercher une nouvelle topologie de l'arbre de gènes, dont le coût de réconciliation est moindre. Troisièmement, nous proposons une approche pour estimer la fiabilité des événements évolutifs prédits par les méthodes de réconciliation. Contrairement aux approches existantes qui ne considèrent qu'une des réconciliations optimales possible entre l'arbre de gènes et l'arbre d'espèces, notre approche prend en compte un ensemble de solutions optimales voire sous-optimales. En outre, nous introduisons le concept de réconciliations médianes symétriques et asymétriques qui servent d'éléments centraux pour représenter un ensemble de réconciliations. Nous présentons un algorithme pour calculer ces réconciliations médianes qui est en temps polynomial bien que l'ensemble de toutes les réconciliations optimales est potentiellement exponentiel. Des expériences ont été réalisées pour montrer l'exactitude, la signification et l'efficacité de nos méthodes proposées.

  • Titre traduit

    Reconciliations : correcting gene trees and inferring the reliability of evolutionary events


  • Résumé

    The genomes of eukaryotes and prokaryotes evolve over time through a complex process involving, among other things, evolutionary events such as speciations, duplications, horizontal transfers, and losses of genes. We study here reconciliation methods, a well-known technique for recovering such events as well as locating them along the species history. Indeed, reconciliation methods construct a mapping between a gene family history (a gene tree) and a species history (a species tree) to explain their incongruence thanks to the inferred evolutionary events located on both the gene and species trees. Reconciliation methods can be applied to various areas such as the study of genome evolution, the inference of orthology relationships in molecular evolution, the study of host-parasite coevolution in ecology, or the study of population areas in biogeography. The three main contributions of this thesis are as follows: First, we provide a tool, named SEAS, for simulating the evolution of gene families along a given species phylogeny. This provides synthetic gene trees along with their known reconciliations that are helpful to evaluate the accuracy of reconciliation methods. Second, we propose a heuristic method, called MowgliNNI, to correct partly erroneous gene trees based on reconciliation scores. This method iteratively rearranges the weakly supported parts of a gene tree as long as it improves the reconciliation score. Third, we propose effective solutions for estimating the reliability of the predicted evolutionary events. Unlike the currently existing approaches considering only the optimal solutions for reconciling a pair of species-gene trees, our approach additionally takes into account the nearly optimal solutions. Furthermore, we introduce the concept of symmetric and asymmetric median reconciliations, which serve as central elements to represent a set of reconciliations. We present a polynomial time algorithm computing such median reconciliations from the potentially exponential set of all optimal reconciliations for a given pair of species-gene trees. Experiments have been carried on to show the correctness, meaningfulness and effectiveness of our proposed methods.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Bibliothèque universitaire Sciences et techniques (Montpellier).
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.