Thèse soutenue

Docking et Deep Learning : affinement de méthodologies in silico pour le développementde stratégies thérapeutiques innovantes

FR  |  
EN
Auteur / Autrice : Kévin Crampon
Direction : Luiz Angelo SteffenelStéphanie Baud
Type : Thèse de doctorat
Discipline(s) : Info - Informatique
Date : Soutenance le 08/11/2023
Etablissement(s) : Reims
Ecole(s) doctorale(s) : École doctorale Sciences du Numérique et de l’Ingénieur (Reims ; 2018-)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique en Calcul Intensif et Image pour la Simulation (LICIIS) - UR 3690 LRC DIGIT (Reims, Marne)
Jury : Président / Présidente : Michaël Krajecki
Examinateurs / Examinatrices : Luiz Angelo Steffenel, Stéphanie Baud, Élodie Laine, Thomas Schiex, Kaoutar Sghiouer, Kévin BOUCHARD, Cédric Bourrasset
Rapporteurs / Rapporteuses : Élodie Laine, Thomas Schiex

Résumé

FR  |  
EN

La recherche de nouvelles molécules est un axe majeur de la recherche de stratégies thérapeutiques innovantes, ces molécules sont par exemple destinées à être des principes actifs de médicaments. Bien que les études in vitro et in vivo soient des étapes clés de cette recherche, l’étape de simulation informatique (in silico), qui s’effectue avant les deux autres, est tout aussi importante puisqu’elle permet d’effectuer un premier tri parmi toutes les molécules testées afin de ne conserver que les plus prometteuses pour les expérimentations suivantes qui sont bien plus coûteuses en temps et en moyens. Cette thèse se place dans le contexte des interactions ligand-protéine, où le ligand est un petit composé chimique (e.g. le principe actif) et où une protéine en est le récepteur. La simulation utilisée est celle de l’amarrage moléculaire, cette méthode utilise la structure 3D des deux molécules afin de prédire si ces dernières interagissent, forment un complexe et de quelle façon ce complexe est formé. Les travaux menés durant cette thèse de doctorat visaient à améliorer certaines parties de la simulation d’amarrage moléculaire via l’utilisation de l’apprentissage profond (deep learning). Deux axes ont été identifiés pour atteindre cet objectif, le premier concerne la fonction de score, qui évalue l’affinité de la pose d’un ligand sur une protéine. Ainsi chaque pose se voit attribuer un score, les meilleurs ligands (ceux qui se lient le plus fortement à la protéine cible) sont alors identifiés pour les étapes suivantes. Le second axe étudié est la détection de site de liaison, en effet, lors d’une simulation d’amarrage moléculaire, aucune information n’est généralement connue à propos de la région d’amarrage du ligand sur la surface de la protéine. Cela implique que l’exploration de la protéine doit être exhaustive, une méthode de détection de site vise alors à prédire les zones d’intérêts et ainsi réduire le temps nécessaire à l’exploration (et in fine le temps total de simulation). Deux méthodes, répondant aux deux axes, ont été proposées et utilisent de l’apprentissage profond et plus particulièrement des réseaux de neurones permettant la mise en place de convolutions sur des graphes (GCN). Aussi bien HGScore (fonction de score) que SGPocket (détection de site) ont apporté des résultats concluants et démontré leur efficacité.