Développement et applications d'outils d'analyse métagénomique des communautés microbiennes associées aux insectes

par Cervin Guyomar

Thèse de doctorat en Génétique, génomique et bioinformatique


  • Résumé

    Ces travaux de thèse reposent sur le double objectif de proposer des approches innovantes pour l’étude des relations entre un hôte et son microbiote, et de les appliquer à la description fine de l’holobionte du puceron du pois par des données métagénomiques. Les relations symbiotiques façonnent le fonctionnement et l’évolution de tous les organismes, mais restent décrites de manière imparfaite, notamment à cause de la difficulté à caractériser la diversité génomique des partenaires microbiens constitutifs des holobiontes. L’essor des technologies de séquençage métagénomique révolutionne l’étude de ces systèmes, mais pose également des problèmes méthodologiques pour analyser les jeux de données métagénomiques. La métagénomique est ici appliquée au puceron du pois, un modèle d’étude des relations symbiotiques qui abrite une communauté bactérienne d’une complexité modérée, idéale pour développer de nouvelles approches de caractérisation de la diversité microbienne. Cette thèse vise à mieux décrire la communauté de symbiotes qu’abrite cet holobionte, notamment en distinguant les différents niveaux de variabilité génomique en son sein. Nous présentons une démarche pour l’analyse métagénomique d’holobiontes, qui repose d’abord sur l’assignation taxonomiques des lectures par alignement à des génomes de référence ou préalablement assemblés, puis sur la recherche de variants génomiques. L’étude de génotypes complets de symbiotes permet de retracer l’histoire évolutive des relations hôte-microbiote avec une résolution élevée. Chez le puceron du pois, nous mettons en évidence des niveaux et structures de diversité génomique différents selon les symbiotes, que nous proposons d’expliquer par les modalités de transmission ou l’histoire évolutive propre à chacun des partenaires microbiens. Cette approche repose sur la disponibilité d’un génome de référence adapté, qui est souvent difficile à obtenir en métagénomique. Dans un second temps, nous présentons donc une méthode d’assemblage guidé par référence en contexte métagénomique. Cette méthode se déroule en deux temps : le recrutement et l’assemblage de lectures par alignement sur un génome de référence distant, puis l’assemblage de novo ciblé des régions manquantes, permis par des développements complémentaires apportés au logiciel MindTheGap. Comparativement à un assembleur métagénomique, cette méthode permet l’assemblage d’un seul génome en un temps réduit, et permet de détecter d’éventuels variants structuraux sur le génome ciblé. Appliqué au puceron du pois, MindTheGap a réalisé l’assemblage du symbiote obligatoire Buchnera en un seul contig, et a permis d’identifier différents variants structuraux du bactériophage APSE. Ces travaux ouvrent la voie à la fois à une caractérisation plus précise des relations hôte-microbiote chez le puceron du pois par des approches fonctionnelles et métaboliques, ainsi qu’à l’application des outils présentés à des systèmes plus complexes.

  • Titre traduit

    Development and application of bioinformatic tools for the metagenomic analysis of insect associated microbial communities


  • Résumé

    The aim of this PhD thesis is to develop innovative approaches to characterize host-microbiota relationships, and to apply them to finely explore the pea aphid microbiota using metagenomic data. Symbiotic relationships play a major role in the life and evolution of all organisms, but are imperfectly described, essentially because of the difficult characterization of the genomic diversity of the microbial partners. The rise of high throughput metagenomic sequencing is a game changer for the study of those systems, but also raises methodological issues to analyze large metagenomic datasets. Metagenomic is here applied to the pea aphid holobiont, a model system for the study of symbiotic relationships, sheltering a moderately complex microbial community. This level of complexity seems to be ideal to develop new approaches for the strain-resolved characterization of host-microbiota relationships. This thesis aims at a better description of this symbiotic community by distinguishing several scales of metagenomic diversity. In a first part, we present a framework for the metagenomic analysis of holobionts, relying first on the taxonomic assignation of reads by alignment to reference or newly assembled genomes, and then on the detection of genomic variants. Whole genome variant profiles make possible to track the evolutionary history of host-microbiota associations with a high resolution. In the case of the pea aphid, we highlight different scales and structures for the metagenomic diversity of the different symbionts, accounting for different transmission modes or evolutionary histories specific to each microbial partner. This framework is based on the availability of a suitable reference genome, that may be hard to obtain in a metagenomic context. In a second part, we therefore present a novel method for reference guided genome assembly from metagenomic data. This method is based on two steps. First, the recruitment and assembly of reads by mapping metagenomic reads on a distant reference genome, and second, the de novo assembly of the missing regions, allowed by the development of an improved version of the software MindTheGap. Compared to a standard metagenomic assembler, this methods makes possible to assemble a single genome in a reasonable time, and allows to detect eventual structural variations within the targeted genome. When applied to the pea aphid holobiont, MindTheGap yielded single contig assemblie of the obligatory symbiont Buchnera aphidicola, and helped to identify different structural variants of the bacteriophage APSE. This works paves the way to a finer characterization of host-microbiota interactions, and to the application of the presented approaches to more complex systems.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Rennes I. Service commun de la documentation. Bibliothèque de ressources en ligne.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.