Thèse soutenue

Identification de nouvelles protéines interagissant avec les virus par la Détection d’INNovations Génétiques (DGINN) combinée à des essais fonctionnels

FR  |  
EN
Auteur / Autrice : Léa Picard
Direction : Lucie Etienne
Type : Thèse de doctorat
Discipline(s) : Sciences de la vie et de la santé
Date : Soutenance le 04/09/2020
Etablissement(s) : Lyon
Ecole(s) doctorale(s) : École doctorale de Biologie Moléculaire Intégrative et Cellulaire (Lyon)
Partenaire(s) de recherche : établissement opérateur d'inscription : École normale supérieure de Lyon (2010-...)
Laboratoire : Centre International de Recherche en Infectiologie (Lyon ; 2013-....)
Jury : Président / Présidente : Jean-Nicolas Volff
Examinateurs / Examinatrices : Lucie Etienne, Jean-Nicolas Volff, Ignacio González Bravo, Manuela Sironi, Vincent Daubin, Laurent Guéguen, Florence Margottin-Goguet
Rapporteurs / Rapporteuses : Ignacio González Bravo, Manuela Sironi

Résumé

FR  |  
EN

L'identification de protéines cellulaires qui interfèrent avec la réplication virale est un enjeu majeur en virologie. Parmi ces protéines, la découverte de celles engagés dans des interactions hôte-virus à long terme et en co-évolution est d'intérêt particulier. Chez l'hôte, la présence de pressions sélectives de ce type se traduit par l'apparition de différentes innovations génétiques, telles que la sélection positive sur sites spécifiques, la variation du nombre de copies du gène, la recombinaison, etc. Selon l'hypothèse que des innovations génétiques dans le cadre de l'immunité innée apparaîtraient plus particulièrement dans les protéines interagissant avec les protéines virales, nous avons développé un pipeline permettant de récupérer les séquences orthologues, de les aligner et de reconstruire leur phylogénie, suivi par la détection d'innovations génétiques. Cette procédure simplifiée permet pour la première fois de combiner la détection de gènes paralogues, de points de recombinaison, et de signatures de sélection positive avec plusieurs méthodes fréquemment utilisées. Nous avons validé ce pipeline évolutionnaire et prédictif sur des gènes dont les profils de sélections étaient déjà connus. Ensuite, nous avons analysés deux jeux de données de gènes candidats. Le premier comportait 56 gènes dont la diminution d'expression impactait la réponse interféron à l'infection virale. Le second était composé de 60 gènes surexprimés dans des macrophages résistants à l'infection par le VIH. Nous avons identifié plusieurs gènes présentant d'importantes marques de conflit génétique, et qui encodent donc potentiellement de nouvelles protéines interagissantes avec les protéines virals. Deux de ces candidats sont en cours de caractérisation fonctionnelle pour leur rôle dans le cycle réplicatif du VIH, et d'autres sont en attente d'être étudiés plus avant. Au final, nous avons développé un pipeline complet et extrêmement flexible, disponible au public, capable d'analyser de grands jeux de données et permettant aux chercheurs et chercheuses de classer leurs gènes candidats afin de hiérarchiser leurs expérimentations fonctionnelles.