Thèse soutenue

Développement de nouveaux modèles, basés sur les données, pour prédire les interactions entre protéines et petites molécules

FR  |  
EN
Auteur / Autrice : Maria Kadukova
Direction : Stéphane RedonVladimir ChupinSergei Grudinin
Type : Thèse de doctorat
Discipline(s) : Mathématiques et informatique
Date : Soutenance le 23/03/2021
Etablissement(s) : Université Grenoble Alpes en cotutelle avec Moscow Institute of Physics and Technology (Moscou)
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Jean Kuntzmann (Grenoble)
Jury : Président / Présidente : Dragos Horvath
Examinateurs / Examinatrices : Nathalie Reuter, Matthieu Montes, Bogdan Iorga
Rapporteurs / Rapporteuses : Ruben Abagyan, Maria Miteva

Résumé

FR  |  
EN

La découverte de médicaments est un processus très coûteux composé de plusieurs phases. Les simulations informatiques offrent la possibilité de passer à l'échelle et d'accélérer les premières phases, en effectuant le criblage initial des candidats médicaments et en modélisant leurs interactions avec les récepteurs cibles. Une telle modélisation est généralement réalisée avec des méthodes d'amarrage moléculaire (« docking »). Les modèles 3D des candidats médicaments sont superposés aux modèles de récepteurs 3D par des algorithmes spécifiques capables d'estimer le changement d'énergie libre de liaison et de détecter la meilleure configuration du complexe moléculaire. L'énergie libre de liaison peut être évaluée approximativement avec des fonctions « de score ». Cette thèse présente le développement et l'évaluation de plusieurs fonctions de score protéine-ligand, avec les protocoles d'amarrage et de criblage associés.Les recherches menées dans le cadre de cette thèse ont abouti au développement de trois nouvelles fonctions de score, à savoir Convex-PL, Convex-PL-R et KORP-PL. Convex-PL est une fonction de score dédiée aux interactions protéine-ligand, qui dépend des distances entre paires d’atomes et se base sur la connaissance (« knowledge-based »). Nous l’avons dérivée de la résolution d’un problème d'optimisation quadratique. Notre motivation était de prouver qu'une fonction de score basée sur la connaissance peut être dérivée en résolvant un problème d'optimisation convexe de classification, et également de démontrer que les « poses » non natives du ligand utiles pour la classification peuvent être obtenues avec des transformations rigides à déviation (RMSD) constante de la pose native. Convex-PL a été validée sur plusieurs benchmarks et intégrée à AutoDock Vina.Bien qu'une grande variété de fonctions de score ait été conçue au cours des années de développement du domaine, un certain nombre de défis dans la création de ces fonctions restent à relever. De nombreuses fonctions de score polyvalentes démontrent des performances moins bonnes dans les tests de criblage virtuels, relativement t à la précision avec laquelle elles sont capables de prédire les poses de liaison co-cristallisées. Après une analyse des résultats du test de criblage virtuel des benchmarks CASF, nous avons découvert que de nombreuses fonctions de score favorisent les interfaces les plus grandes. L'une des raisons de cette préférence est une prise en compte insuffisante des interactions avec le solvant et également une mauvaise utilisation des contributions entropiques. Pour résoudre ce problème, nous avons développé Convex-PL-R - une fonction de score basée sur l'apprentissage automatique (« machine learning ») qui incorpore des termes de solvatation et entropiques supplémentaires. Elle fournit de meilleures prédictions d'affinité et de meilleures performances de criblage virtuel par rapport à Convex-PL.Enfin, nous avons développé KORP-PL - la première fonction de score guidée par les données et dépendante de l'orientation des particules en résolution gros-grain. KORP-PL prouve le concept selon lequel une fonction de score basée sur une représentation gros-grain du récepteur convient pour la prédiction des interactions protéine-ligand. Nous pensons que sa nature sans chaînes latérales ouvrira la voie à de nouveaux algorithmes d'amarrage moléculaire capables de surmonter le problème de flexibilité des récepteurs. Bien qu'il s'agisse d'une fonction de score à gros grains, KORP-PL est très efficace dans les tests de prédiction de pose et également dans les criblages virtuels.D'un point de vue pratique, l'auteur de la thèse a participé à plusieurs défis d'amarrage qui ont abouti à des publications présentant l'évaluation de divers protocoles d'amarrage. Cette thèse comprend la description de la participation aux Grands Défis D3R 2, 3 et 4 et au round 41 de CAPRI.