Une méthode d'échantillonnage stochastique d'ensembles de conformations pour des systèmes protéiques complexes comprenant des régions désordonnées
Auteur / Autrice : | Ilinka Clerc |
Direction : | Juan Cortes, Pau Bernadó |
Type : | Projet de thèse |
Discipline(s) : | Informatique et Télécommunications |
Date : | Inscription en doctorat le Soutenance le 25/07/2024 |
Etablissement(s) : | Université de Toulouse (2023-....) |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, informatique et télécommunications (Toulouse) |
Partenaire(s) de recherche : | Laboratoire : LAAS - Laboratoire d'Analyse et d'Architecture des Systèmes |
Equipe de recherche : RIS - Robotique et Interactions | |
établissement délivrant conjointement le doctorat : Toulouse, INSA | |
Jury : | Président / Présidente : Pierre Weiss |
Examinateurs / Examinatrices : Juan Cortes, Pau Bernado, Malene Ringkjobing Jensen, Matthieu Montes, Jessica Andreani | |
Rapporteur / Rapporteuse : Malene Ringkjobing Jensen, Matthieu Montes |
Mots clés
Résumé
A la différence des protéines globulaires, largement étudiées en biologie structurale, certaines protéines dites désordonnées (IDPs) et certaines régions désordonnées (IDRs) dans des architectures protéiques n'adoptent pas une forme bien définie en solution. Cette flexibilité leur confère des fonctionnalités complémentaires à celles des protéines structurées et leur étude ouvre de nouvelles perspectives prometteuses dans les domaines du médical, des biotechnologies et des biomatériaux. Ces systèmes désordonnés ne peuvent être représentés par une seule conformation, mais nécessitent des modèles d'ensembles comprenant plusieurs milliers de conformations possibles. Ces ensembles représentent la distribution d'états que la protéine peut adopter en solution. L'obtention de ces ensembles par des méthodes expérimentales seules (RMN, SAXS...) est insuffisante et doit être couplée à des approches computationnelles. Ce couplage de méthodes demeure un défi et un enjeu majeur dans ce domaine de recherche. Dans cette thèse, nous présentons MoMA-FReSa (Molecular Motion Algorithms - Flexible Region Sampler), une nouvelle méthode d'échantillonnage stochastique qui s'attaque à cette problématique. MoMA-FReSa est une méthode computationnelle polyvalente et adaptable à une large gamme de systèmes contenant des régions désordonnées, y compris les plus complexes. Grâce à l'alliance d'une méthode de décomposition hiérarchique du système, d'une stratégie d'ordonnancement sophistiquée et d'un processus d'échantillonnage stochastique, ce programme permet de générer de vastes ensembles de conformations dans des temps très courts. La thèse s'articule en quatre chapitres. La première partie présente un panorama exhaustif des méthodes d'échantillonnage de régions et protéines désordonnées existantes, et positionne MoMA-FReSa comme une approche innovante et prometteuse dans ce contexte. Le chapitre 2 explicite la méthodologie employée dans MoMA-FReSa et établit ses capacités sur un ensemble de référence illustrant la diversité des systèmes pouvant être rencontrés. Le chapitre 3 poursuit ensuite en présentant divers cas pratiques et collaborations mettant en uvre MoMA-FReSa, démontrant ainsi le potentiel de ce programme sur des applications plus innovantes. Enfin, le chapitre 4 explore des perspectives d'amélioration de la méthode en utilisant de l'apprentissage par renforcement. Une interface utilisateur est en cours de développement pour rendre cette méthode accessible à la communauté scientifique sous forme d'applications dans la suite MoMA.