Identification de nouvelles protéines interagissant avec les virus par la Détection d’INNovations Génétiques (DGINN) combinée à des essais fonctionnels
Auteur / Autrice : | Léa Picard |
Direction : | Lucie Etienne |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences de la vie et de la santé |
Date : | Soutenance le 04/09/2020 |
Etablissement(s) : | Lyon |
Ecole(s) doctorale(s) : | École doctorale de Biologie Moléculaire Intégrative et Cellulaire (Lyon ; 1999-....) |
Partenaire(s) de recherche : | établissement opérateur d'inscription : École normale supérieure de Lyon (2010-...) |
Laboratoire : Centre International de Recherche en Infectiologie (Lyon ; 2013-....) | |
Jury : | Président / Présidente : Jean-Nicolas Volff |
Examinateurs / Examinatrices : Lucie Etienne, Jean-Nicolas Volff, Ignacio González Bravo, Manuela Sironi, Vincent Daubin, Laurent Guéguen, Florence Margottin-Goguet | |
Rapporteur / Rapporteuse : Ignacio González Bravo, Manuela Sironi |
Mots clés
Mots clés contrôlés
Résumé
L'identification de protéines cellulaires qui interfèrent avec la réplication virale est un enjeu majeur en virologie. Parmi ces protéines, la découverte de celles engagés dans des interactions hôte-virus à long terme et en co-évolution est d'intérêt particulier. Chez l'hôte, la présence de pressions sélectives de ce type se traduit par l'apparition de différentes innovations génétiques, telles que la sélection positive sur sites spécifiques, la variation du nombre de copies du gène, la recombinaison, etc. Selon l'hypothèse que des innovations génétiques dans le cadre de l'immunité innée apparaîtraient plus particulièrement dans les protéines interagissant avec les protéines virales, nous avons développé un pipeline permettant de récupérer les séquences orthologues, de les aligner et de reconstruire leur phylogénie, suivi par la détection d'innovations génétiques. Cette procédure simplifiée permet pour la première fois de combiner la détection de gènes paralogues, de points de recombinaison, et de signatures de sélection positive avec plusieurs méthodes fréquemment utilisées. Nous avons validé ce pipeline évolutionnaire et prédictif sur des gènes dont les profils de sélections étaient déjà connus. Ensuite, nous avons analysés deux jeux de données de gènes candidats. Le premier comportait 56 gènes dont la diminution d'expression impactait la réponse interféron à l'infection virale. Le second était composé de 60 gènes surexprimés dans des macrophages résistants à l'infection par le VIH. Nous avons identifié plusieurs gènes présentant d'importantes marques de conflit génétique, et qui encodent donc potentiellement de nouvelles protéines interagissantes avec les protéines virals. Deux de ces candidats sont en cours de caractérisation fonctionnelle pour leur rôle dans le cycle réplicatif du VIH, et d'autres sont en attente d'être étudiés plus avant. Au final, nous avons développé un pipeline complet et extrêmement flexible, disponible au public, capable d'analyser de grands jeux de données et permettant aux chercheurs et chercheuses de classer leurs gènes candidats afin de hiérarchiser leurs expérimentations fonctionnelles.