Thèse soutenue

Approche science des données pour l'exploration de l'antigénicité HLA fondée sur les structures 3D et la dynamique moléculaire

FR  |  
EN
Auteur / Autrice : Diego Amaya Ramirez
Direction : Marie-Dominique DevignesJean-Luc Taupin
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 10/07/2024
Etablissement(s) : Université de Lorraine
Ecole(s) doctorale(s) : École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine (1992-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire lorrain de recherche en informatique et ses applications
Jury : Président / Présidente : Olivier Toutirais
Examinateurs / Examinatrices : Marie-Dominique Devignes, Jean-Luc Taupin, Frédéric Cazals, Juliette Martin, Manuel Dauchez, Malika Smaïl-Tabbone
Rapporteurs / Rapporteuses : Frédéric Cazals, Juliette Martin

Résumé

FR  |  
EN

Cette thèse présente une approche de science des données pour explorer l'antigénicité des molécules du complexe majeur d'histocompatibilité (HLA) en se basant sur leurs structures 3D et des simulations de dynamique moléculaire (MD). L'objectif principal est de mieux comprendre les déterminants du rejet de greffe causé par les anticorps spécifiques du donneur (DSA en anglais) et d'améliorer l'évaluation de la compatibilité donneur-receveur, qui ne prend actuellement pas en compte la structure 3D des antigènes HLA. La thèse a produit et analysé les structures 3D et les simulations MD de 207 antigènes HLA. Diverses méthodes de science des données ont été employées pour transformer les données 3D brutes en descripteurs statiques et dynamiques, permettant finalement l'entraînement d'un prédicteur d'épitopes HLA hautement performant. La thèse explore les propriétés structurales des antigènes HLA en utilisant selon divers points de vue, examinant des caractéristiques telles que l'accessibilité au solvant, les propriétés physico-chimiques et la flexibilité des chaînes latérales des acides aminés (AA). L'étude de la flexibilité des AA pendant les simulations MD a révélé que la flexibilité était plus faible pour les AA présents dans les éplets confirmés par rapport aux non-éplets, ce qui est cohérent avec des résultats récents sur les épitopes en général. De plus, la thèse introduit l'utilisation des polynômes de Zernike pour représenter la surface 3D des molécules, facilitant des tâches telles que la comparaison et la classification des structures. L'hypothèse selon laquelle l'antigénicité des HLA dépend de la similarité structurelle entre les antigènes HLA du receveur et du donneur a été étudiée en utilisant la distance de Wasserstein pour comparer des nuages de points multidimensionnels représentant les trajectoires MD. L'utilisation des polynômes de Zernike pour l'identification des conformères de peptides le long de trajectoires MD a également été explorée. Les résultats ont montré une capacité prometteuse à identifier des conformères distinctifs en fonction de leur forme. Une contribution clé de la thèse est la construction d'un prédicteur d'épitopes HLA appelé HLA-EpiCheck. En utilisant des caractéristiques structurales statiques et dynamiques extraites des simulations MD, un jeu de données composé de 18 descripteurs calculés sur près de 7000 patchs de surface 3D dérivés de 207 antigènes HLA a été construit. Le prédicteur a été entraîné en utilisant des éplets confirmés de la base de données HLA Eplet Registry, puis employé pour prédire le statut des éplets non confirmés. Les résultats de prédiction ont montré une cohérence remarquable avec des résultats expérimentaux. De plus, une analyse de l'importance des descripteurs, effectuée sur HLA-EpiCheck, a révélé l’importance notable des descripteurs associés à la flexibilité des chaînes latérales, soulignant l’intérêt d’introduire des descripteurs dynamiques dans le processus d’apprentissage quand il s’agit de structures de protéines. En outre, la thèse a impliqué le développement d'une base de données pour les structures 3D des antigènes HLA et d'une interface graphique appelée HLA-3D-Diff. Cette interface permet aux utilisateurs de superposer des structures 3D d'antigènes HLA, de visualiser leurs trajectoires dans les simulations de DM et d'identifier les différences potentielles apparaissant de manière dynamique pendant les trajectoires. Elle sert d'outil pour explorer manuellement les paires d'antigènes HLA dans des situations cliniques d'immunisation complexes ou inattendues. Le travail inclus dans cette thèse vise à permettre la prise en compte de caractéristiques dynamiques dans l’étude des différences structurales et des prédictions d'épitopes HLA lors de l'appariement donneur-receveur pour l'attribution des greffons.Les travaux futurs pourraient impliquer des études cliniques rétrospectives de la contribution de ces nouveaux éléments au maintien ou au rejet de la greffe