Utilisation des transferts horizontaux de gènes pour dater des phylogénies

par Adrian Arellano Davin

Thèse de doctorat en Phylogénétique moléculaire

Sous la direction de Vincent Daubin et de Bastien Boussau.

Soutenue le 05-12-2017

à Lyon , dans le cadre de École Doctorale Evolution Ecosystèmes Microbiologie Modélisation , en partenariat avec Université Claude Bernard (Lyon) (établissement opérateur d'inscription) et de Laboratoire de Biométrie et Biologie Evolutive (laboratoire) .

Le président du jury était Céline Brochier-Armanet.

Les rapporteurs étaient Simonetta Gribaldo, Carolin Kosiol.


  • Résumé

    Le fait d'avoir une généalogie datée des organismes vivants est l'un des principaux objectifs de la biologie évolutive. Cette entreprise est confrontée à deux défis majeurs. Le premier est la rareté et l'incomplétude des enregistrements fossiles, pratiquement inexistants pour les microbes et essentiels pour fournir une échelle temporelle de l'histoire de la vie. Le second est la difficulté intrinsèque d'obtenir des phylogénies d'organismes dont le génome a été largement façonné par transfert latéral de gène (TLG). L'acquisition par transfert de nouveaux gènes d'origine éloignée perturbe des arbres de gènes et rend beaucoup plus complexe la reconstruction de l'histoire des espèces. Dans ce travail de thèse, je montre comment nous pouvons utiliser ces différences entre arbres de gènes et arbres d'espèces à notre avantage pour inférer les événements anciens de TLG et comment ils peuvent fournir une nouvelle échelle de temps pour l'évolution des organismes vivants. Les transferts étant particulièrement fréquents chez les espèces dont les fossiles sont rares, ils peuvent servir de nouvelle source de datation indépendante du registre géologique pour reconstruire une phylogénie datée de la vie. Dans la première partie, je réalise une analyse à l'échelle génomique pour montrer comment les méthodes de réconciliations phylogénétiques peuvent être utilisées pour détecter les lignées correspondant aux donneurs et aux receveurs des événements de TLG. En outre, ces méthodes fournissent également une vue détaillée de la façon dont les familles de gènes évoluent le long des arbres de l'espèce. En utilisant ALE, un logiciel de réconciliation probabiliste qui prend en compte l'incertitude dans les arbres de gènes, nous sommes en mesure de cartographier les événements de duplication, de perte et de transfert dans les phylogénies des cyanobactéries et des champignons. Nous montrons également comment les méthodes qui ignorent l'information contenue dans les arbres de gènes sous-estiment la fréquence réelle des TLG. Dans la deuxième partie, je présente en détail comment le TLG porte un signal temporel et comment ce signal peut être utilisé pour inférer des arbres datés. J'introduis une nouvelle méthode appelée MaxTiC qui permet de trouver un ordonnancement des noeuds dans l'arbre des espèces qui maximise la cohérence temporelle entre les transferts. Par des simulations, nous montrons la robustesse de la méthode aux erreurs présentes dans l'arbre des espèces et le nombre de familles de gènes nécessaires pour obtenir des arbres datés fiables. Enfin, pour confirmer nos résultats, je présente différentes approches permettant de comparer les temps de divergence découlant des transferts avec ceux estimés en utilisant des horloges moléculaires. Nous effectuons une analyse phylogénomique pour détecter des milliers d'événements de TLG dans quatres groupes: les cyanobactéries, les Deltaproteobactéries, les Archées et les Champignons. Nous trouvons un large accord entre les deux méthodes de datation, ce résultat étant robuste à l'utilisation de différentes prior sur les temps de divergence et différents modèles d'horloges moléculaires relâchées. Nous montrons également que certaines des dates indiquées par l'utilisation de TLG sont en désaccord avec les horloges moléculaires tout en étant soutenues par un grand nombre de TLG. Ces résultats suggèrent que l'utilisation des TLG pourrait permettre d'améliorer les méthodes de datation, notamment pour les phylogénies anciennes et ainsi conduire à d'importants changements de notre point de vue sur l'histoire de la vie

  • Titre traduit

    Towards a chronology of life using Lateral Gene Transfers


  • Résumé

    Having a dated genealogy of living organisms is one of the major goals of evolutionary biology. This enterprise faces two major challenges. The first one is the scarcity and incompleteness of the fossil record, virtually nonexistent for microbes and essential to provide a time scale of life history. The second one is the intrinsic difficulty of obtaining phylogenies in organisms whose genome has been extensively shaped by Lateral Gene Transfer (LGT). The acquisition of new genes from distant organisms creates important differences among genes trees and complicates the reconstruction of the species history. In this thesis work I show how we can use those differences to our advantage to infer ancient events of LGT and how they provide a temporal scale of evolution. Transfers can supply an important amount of information on divergence times in organisms whose fossils are very scarce, acting as a new dating source independent of the geological record and taking us a step closer to building a whole dated phylogeny of Life. In the first part, I perform genomic-scale analyses to show how phylogenetic reconciliations can be used to detect donor and recipient lineages of LGT events. Moreover, they also provide a detailed view of how gene families evolve along species trees. Using ALE, a probabilistic reconciliation software that accounts for the uncertainty in gene trees, we are able to map events of duplication, loss and transfer in phylogenies of cyanobacteria and fungi. We also show how methods that ignore the information contained in gene trees underestimate the real frequency of LGT. In the second part, I present in detail how LGT carries a temporal signal and how this signal can be used to infer dated trees. I explain a new method called MaxTiC, that finds the best dated tree by maximizing the number of transfers that are time-compatible with a phylogeny. By simulations we show how robust the method is to errors in the species tree and how many gene families are required to obtain reliable dated trees. Finally, to confirm our results I present different metrics to compare the divergence times inferred by transfers with those inferred by molecular clocks. We perform a phylogenomic analysis to detect thousands of LGT events in cyanobacteria, Deltaproteobacteria, Archaea and fungi and obtain their dated phylogenies. We find a broad agreement between both dating methods, a result robust to the use of different priors on divergence times and different models of relaxed molecular clock. We also show that some of the dates inferred by using LGT are not recovered by molecular clocks. These results altogether suggest that the use of LGT in future dating studies may have a big impact on the inferred dates of major evolutionary events and can lead to an important change of our view of the History of Life

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Claude Bernard. Service commun de la documentation. Bibliothèque numérique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.