Encodage de l'ARN par apprentissage machine pour la recherche de médicaments
Auteur / Autrice : | Wissam Karroucha |
Direction : | Véronique Stoven |
Type : | Projet de thèse |
Discipline(s) : | Bio-informatique |
Date : | Inscription en doctorat le 01/10/2024 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique |
Partenaire(s) de recherche : | Laboratoire : Centre de Bio-informatique |
établissement opérateur d'inscription : Mines Paris-PSL |
Mots clés
Résumé
La découverte de médicament est un processus long et onéreux. L'utilisation d'apprentissage machine a récemment permis d'en accélérer certaines étapes. Si les médicaments et les méthodes de découverte médicamenteuse actuels se concentrent sur les protéines, les ARN non codants (ARNnc) régulent de nombreuses fonctions cellulaires et représentent donc aussi un potentiel thérapeutique prometteur. L'objectif de cette thèse est de proposer de nouvelles méthodes computationnelles basées sur l'apprentissage pour assister la recherche de médicaments ciblant l'ARN. Elle s'organisera autour de trois étapes. Étape 1 : Développement de méthodes d'apprentissage sur la structure des ARN. Pour compenser le volume restreint de données disponibles, deux pistes sont envisagées : l'utilisation de méthodes de pré-apprentissage et celle de simulations physiques pour enrichir le jeu de données. Étape 2 : Application à la recherche médicamenteuse ciblant les ARN. Pour identifier des petites molécules capables de se lier à un ARN, des modèles d'apprentissage machine seront entraînés à prédire les sites de liaison de l'ARN, ainsi que les petites molécules correspondantes à ces sites. On pourra s'appuyer sur l'étape 1 ainsi que sur une validation expérimentale de l'approche proposée. Étape 3 : Application en cancérologie: Dans le cadre du cancer du sein ''triple négatifs'', pour lesquels il n'existe pas de thérapie ciblée, l'objectif final est d'appliquer notre approche pour identifier de potentiels médicaments parmi une chimiothèque. Des tests expérimentaux seront ensuite effectués sur des lignées cellulaires pour évaluer l'efficacité des molécules identifiées. En somme, ce projet de thèse vise à proposer des méthodes d'apprentissage adaptées à la structure de l'ARN et une approche pour associer la structure d'une cible ARN à des candidats-médicaments basée sur ces méthodes. L'objectif final est d'appliquer cette approche pour identifier des médicaments anticancéreux.