Thèse en cours

Identification et production des endoRBD, nouvelles séquences endogènes humaines apparentées aux domaines de liaison des glycoprotéines d'enveloppe rétrovirales et régulateurs potentiels du métabolisme

FR  |  
EN

Accès à la thèse

Triangle exclamation pleinLa soutenance a eu lieu le 20/12/2023. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Kevin Villette
Direction : Marc SitbonValérie Courgnaud
Type : Projet de thèse
Discipline(s) : Biologie Santé
Date : Inscription en doctorat le
Soutenance le 20/12/2023
Etablissement(s) : Université de Montpellier (2022-....)
Ecole(s) doctorale(s) : Sciences Chimiques et Biologiques pour la Santé (Montpellier ; Ecole Doctorale ; 2015-....)
Partenaire(s) de recherche : Laboratoire : IGMM - Institut de Génétique Moléculaire de Montpellier
Equipe de recherche : Rétrovirus, enveloppes et marqueurs métaboliques
Jury : Président / Présidente : Alessia Ruggieri
Examinateurs / Examinatrices : Marc Sitbon, Valérie Courgnaud, Philippe Youkharibache
Rapporteurs / Rapporteuses : Philippe Youkharibache, Alessia Ruggieri

Résumé

FR  |  
EN

Les mammifères ont été soumis aux infections rétrovirales depuis des millions d’années et parmi les rétrovirus, les gammarétrovirus sont les plus présents soit en tant qu’agents infectieux exogènes, soit sous formes de séquences endogènes rétrovirales (ERV), vestiges d’anciennes infections passées dans la lignée germinale. Les premières étapes d’une infection rétrovirale dépendent de l’interaction de la glycoprotéine d'enveloppe rétrovirale (ENV) avec un récepteur cellulaire, et il existe dans le génome humain un peu plus de 8% de séquences rétrovirales endogènes (HERV). Malgré cette présence massive d’HERV, seules 16 ENV de type gamma, que nous avons pu regrouper en 13 familles d’HERV, ont été identifiées au sein du génome humain. Par ailleurs, tous les récepteurs identifiés des ENV de type gamma, ERV incluses, utilisent des transporteurs de nutriments de la famille SLC; de plus, les domaines de liaison aux récepteurs de ces ENV (RBD), produits sous forme de ligands tronqués et solubles, peuvent se lier au récepteur SLC correspondant et moduler sa fonction de transport. Dans ce contexte et du fait de leur potentiel de régulateurs métaboliques, nous avons entrepris une fouille bio-informatique du génome humain afin d’y identifier de nouveaux RBD de type gamma et que nous avons appelés « endoRBD ». A cette fin, nous avons développé un pipeline bio-informatique dédié, TIGGER - pour Tools to Identify Genomic Gammaretroviral EndoRBDs - également applicable aux génomes d’autres mammifères. Avec TIGGER nous avons identifié un total de 171 endoRBD humains, auxquels nous avons ajouté les 16 ENV de type gamma déjà connues. Sur des bases de conservation entre elles de leurs séquences nucléotidiques, nous avons pu répartir l’ensemble de ces familles en 22 groupes (clusters) et 19 singletons, dont les 2 HERV ENV envFc1 et envFc2 déjà connues et pour lesquelles TIGGER n’a pas retrouvé dans le génome humain d’autres cadre de lecture ouvert (ORF) qui répondent à nos critères d’endoRBD (notamment une séquence 5’ prédite comme peptide signal fonctionnel, un ORF codant pour au moins 100 résidus, et distincte des séquences purement transmembranaires des ENV). De plus, nous avons observé que les 187 endoRBD ainsi définis sont différentiellement exprimés dans des banques de RNAseq de tissus humains tumoraux et non tumoraux et que leur conservation phylogénique est limitée aux primates haplorrhiniens simiiformes, donc absents des tarsiers et lémuriens. Nous avons aussi observé que dans leur vaste majorité les endoRBD sont apparus, sinon maintenus dans leurs capacités codantes, chez les catarrhiniens (singes de l’Ancien Monde). Nos observations révèlent donc que les endoRBD ont été soumis à une robuste sélection positive propre aux humains et certains autres primates. Enfin, nous avons pu produire des formes solubles étiquetées de 13 des nouveaux endoRBD identifiés qui permettront de rechercher les récepteurs correspondants notamment parmi des banques d’expression des SLC. Notre identification sans précédent d'endoRBD, pouvant coder pour des ligands solubles, et pouvant lier des SLC, dévoile un nouveau réseau de régulateurs métaboliques potentiels et ouvre la voie à la caractérisation de nouveaux acteurs dans les processus physiologiques normaux et pathologiques. Les 171 nouveaux endoRBD que nous avons identifiés représentent également des nouveaux marqueurs potentiels de maladies idiopathiques et fournissent de nouvelles cibles pour des approches thérapeutiques.