Molecular basis of protein protein interactions during synaptogenesis
Auteur / Autrice : | Emma Goulard Coderc de Lacam |
Direction : | Christophe Chipot |
Type : | Thèse de doctorat |
Discipline(s) : | Chimie |
Date : | Soutenance le 20/11/2023 |
Etablissement(s) : | Université de Lorraine |
Ecole(s) doctorale(s) : | École doctorale C2MP - Chimie mécanique matériaux physique (Lorraine ; 2018-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Physique et de Chimie théoriques (Nancy ; Metz) |
Jury : | Président / Présidente : Serge Antonczak |
Examinateurs / Examinatrices : Christophe Chipot, Thomas Simonson, Sophie Sacquin-Mora, Emmanuelle Bignon | |
Rapporteur / Rapporteuse : Thomas Simonson, Sophie Sacquin-Mora |
Mots clés
Résumé
La capacité à déterminer rapidement et avec certitude si la liaison protéine-protéine est suffisamment forte pour avoir une fonction biologique est d'une importance primordiale dans le contexte de la découverte de médicaments in silico et des études fonctionnelles biologiques comme la synaptogénèse. Dans ma thèse, j'ai participé à l'établissement d'un protocole clair et complet utilisant la voie alchimique et géométrique pour les calculs standard de l'énergie libre de liaison absolue, qui reste le seul critère définitif pour estimer quantitativement l'affinité de liaison. J'ai étendu ce protocole aux complexes protéines-protéines dans le contexte de la syndémie COVID-19, contribuant à élucider la stratégie choisie par les variants préoccupants pour augmenter leur contagiosité tout en analysant la base moléculaire responsable de leurs affinités diverses pour ACE2. J'ai également renforcé les bases méthodologiques des calculs standard de l'énergie libre de liaison en démontrant la nécessité de restreintes pour obtenir des estimations précises en comparant la voie géométrique aux stratégies dépourvues de restreintes. De plus, j'ai participé à une exploration systématique méthodologique de la combinaison entre répartition de la masse de l'hydrogène et un pas de temps multiple pour le calcul des forces dans le but d'accélérer les calculs des énergies libres de liaison standard en utilisant l'approche de la voie géométrique. Cette étude a révélé la nécessité d'optimiser les paramètres impliqués dans le Lagrangien étendu de l'algorithme d'échantillonnage amélioré pour garantir la précision tout en améliorant la vitesse par un facteur de trois. Enfin, j'ai appliqué la voie géométrique à des complexes de synaptogenèse, avec la famille des Defective proboscis response (Dpr) et Dpr intercating proteins (DIP). J'ai pu retrouver des affinités correspondant aux données expérimentales avec la précision chimique. Cependant, ces calculs ont révélé la nécessité d'un réglage individuel et ne peuvent pas être réalisés dans l'ensemble de l'interactome Dpr-DIP en un temps raisonnable et sans intervention humaine. J'ai donc eu recours à des approches d'apprentissage automatiques, telles que l'analyse discriminante linéaire et la forêt aléatoire, en raison de leur capacité à traiter de grandes quantités de données et de leur interprétabilité. J'ai classifié avec précision les liaisons faibles et fortes dans cet ensemble de données, ce qui peut être utile dans l'analyse à haut débit. J'ai proposé des descripteurs d'entrée spécifiques, en exploitant les propriétés séquentielles, structurelles et physico-chimiques des protéines. Ces descripteurs d'entrée sont très généraux et pourraient être utilisés pour aborder des problèmes d'interaction entre protéines.