Identification of Novel Viral Interacting Proteins through the Detection of Genetic INNovations (DGINN) combined with functional assays

par Léa Picard

Thèse de doctorat en Sciences de la vie et de la santé

Sous la direction de Lucie Etienne.

Soutenue le 04-09-2020

à Lyon , dans le cadre de École Doctorale de Biologie Moléculaire Intégrative et Cellulaire (Lyon) , en partenariat avec École normale supérieure de Lyon (établissement opérateur d'inscription) et de Centre international de recherche en infectiologie (laboratoire) .

  • Titre traduit

    Identification de nouvelles protéines interagissant avec les virus par la Détection d’INNovations Génétiques (DGINN) combinée à des essais fonctionnels


  • Résumé

    L'identification de protéines cellulaires qui interfèrent avec la réplication virale est un enjeu majeur en virologie. Parmi ces protéines, la découverte de celles engagés dans des interactions hôte-virus à long terme et en co-évolution est d'intérêt particulier. Chez l'hôte, la présence de pressions sélectives de ce type se traduit par l'apparition de différentes innovations génétiques, telles que la sélection positive sur sites spécifiques, la variation du nombre de copies du gène, la recombinaison, etc. Selon l'hypothèse que des innovations génétiques dans le cadre de l'immunité innée apparaîtraient plus particulièrement dans les protéines interagissant avec les protéines virales, nous avons développé un pipeline permettant de récupérer les séquences orthologues, de les aligner et de reconstruire leur phylogénie, suivi par la détection d'innovations génétiques. Cette procédure simplifiée permet pour la première fois de combiner la détection de gènes paralogues, de points de recombinaison, et de signatures de sélection positive avec plusieurs méthodes fréquemment utilisées. Nous avons validé ce pipeline évolutionnaire et prédictif sur des gènes dont les profils de sélections étaient déjà connus. Ensuite, nous avons analysés deux jeux de données de gènes candidats. Le premier comportait 56 gènes dont la diminution d'expression impactait la réponse interféron à l'infection virale. Le second était composé de 60 gènes surexprimés dans des macrophages résistants à l'infection par le VIH. Nous avons identifié plusieurs gènes présentant d'importantes marques de conflit génétique, et qui encodent donc potentiellement de nouvelles protéines interagissantes avec les protéines virals. Deux de ces candidats sont en cours de caractérisation fonctionnelle pour leur rôle dans le cycle réplicatif du VIH, et d'autres sont en attente d'être étudiés plus avant. Au final, nous avons développé un pipeline complet et extrêmement flexible, disponible au public, capable d'analyser de grands jeux de données et permettant aux chercheurs et chercheuses de classer leurs gènes candidats afin de hiérarchiser leurs expérimentations fonctionnelles.


  • Résumé

    The identification of cellular proteins that interfere with virus replication is a key challenge in virology. Amongst them, finding those engaged in long-term virus-host interaction and co-evolution is of particular interest. In the host, such selective pressures induce diverse genetic innovations, such as site-specific positive selection, gene copy number variation, recombination, etc. Under the hypothesis that genetic innovations in innate immunity may particularly occur in viral interacting proteins, we developed a pipeline for retrieving orthologous sequences, aligning them and reconstructing their phylogeny, followed by the detection of genetic innovations. This streamlined procedure uniquely allows for the detection of paralogous genes, recombination breakpoints, and signatures of positive selection with several widely-used methods. We validated this evolutionary and predictive pipeline on genes with known selection profiles. Furthermore, we screened two datasets of candidate genes. The first one was composed of 56 genes which knock-downs impact the interferon response to viral infection. The second one was composed of 60 genes upregulated in macrophages resistant to HIV infection. We found numerous genes presenting important marks of genetic conflict, thus potentially encoding for novel Viral Interacting Proteins. Two of these candidates are undergoing functional characterization for their role in the HIV replicative cycle, and others are pending further investigation. Overall, we designed a complete and highly-flexible pipeline, available to the public, that can screen large datasets and allow researchers to rank candidate genes in order to prioritize their wet-lab experiments.

Accéder en ligne

bibliorespect


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Bibliothèque Diderot . Bibliothèque électronique (Lyon).
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.