Imputation HLA dans des populations d’ancestralité composite grâce à des méthodes de réduction de dimension
Auteur / Autrice : | Venceslas Douillard |
Direction : | Nicolas Vince, Pierre-Antoine Gourraud |
Type : | Thèse de doctorat |
Discipline(s) : | Biologie, Médecine, Santé |
Date : | Soutenance le 15/11/2022 |
Etablissement(s) : | Nantes Université |
Ecole(s) doctorale(s) : | École doctorale Biologie-Santé (Nantes) |
Partenaire(s) de recherche : | Laboratoire : Centre de Recherche en Transplantation et Immunologie |
Jury : | Président / Présidente : Elise Launay |
Examinateurs / Examinatrices : Slim Ismael Karkar | |
Rapporteurs / Rapporteuses : Emmanuelle Génin, David Courtin |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
La génomique humaine a rapidement évolué cette dernière décennie grâce aux avancées technologiques de génotypage et de séquençage, permettant l’essor des études d’associations en génome entier. Ces études ont mis en avant la région du Complexe Majeur d’Histocompatibilité (CMH) comme impliquée dans de nombreuses pathologies infectieuses et autoimmunes, et notamment le système HLA, molécules centrales de l’immunité. La diversité génétique de la région du CMH complexifie son étude détaillée. Ainsi des méthodes d’inférence statistique du HLA à partir de polymorphismes simples de l’ADN se sont développées. Ce travail s’articule autour du SNP-HLA Reference Consortium (SHLARC) qui vise à récolter des données génétiques diverses afin d’améliorer les méthodes d’imputation HLA qui sont actuellement optimisées pour des populations européennes. L’accès à une infrastructure de calcul dédiée est nécessaire pour créer rapidement des modèles d’imputation HLA, et leur performance dépend du nombre de polymorphismes et d’individus disponibles. De plus, en exploitant des algorithmes de réduction de dimension, comme l’UMAP, pour synthétiser les distances génétiques entre les individus, il est possible de créer des modèles d’imputation HLA spécifiques d’une population génétique qui améliorent la prédiction dans les populations d’ancestralité composite ou peu représentées. Le SHLARC ouvre ainsi la porte à l’imputation HLA pour toutes les populations génétiques. En conséquence, il facilite la conduite d’études d’association HLA. Avec d’autres pans de l’analyse HLA, il permet d’identifier les mécanismes biologiques exacts à l’origine du du lien entre le HLA et des pathologies.