Prédiction structurale des assemblages protéiques par apprentissage profond
Auteur / Autrice : | Hélène Bret |
Direction : | Raphaël Guerois, Jessica Andreani |
Type : | Thèse de doctorat |
Discipline(s) : | Biologie structurale |
Date : | Soutenance le 27/03/2023 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Innovation thérapeutique : du fondamental à l'appliqué |
Partenaire(s) de recherche : | Laboratoire : Institut de biologie intégrative de la cellule (Gif-Sur-Yvette, Essonne ; 2015-....) |
référent : Université Paris-Saclay. Faculté de pharmacie (Orsay, Essonne ; 2020-....) | |
graduate school : Université Paris-Saclay. Graduate School Santé et médicament (2020-....) | |
Jury : | Président / Présidente : Herman Van Tilbeurgh |
Examinateurs / Examinatrices : Isabelle Callebaut, Élodie Laine, Jean-Christophe Gelly | |
Rapporteurs / Rapporteuses : Isabelle Callebaut, Élodie Laine |
Mots clés
Résumé
Les interactions protéine-protéine jouent un rôle majeur dans la plupart des processus cellulaires et les étudier permet de comprendre les réseaux de protéines et de concevoir des mutants. Mon projet de thèse portait sur quatre points en lien avec la prédiction des interactions protéine-protéine. Premièrement, j'ai contribué à intégrer des contraintes prédites par des méthodes d'apprentissage profond basées sur la covariation pour faciliter le docking dans le serveur InterEvDock3.Le deuxième aspect fait suite à l'arrivée d'AlphaFold2, très performant pour prédire les interactions entre domaines globulaires. J'ai construit un jeu de données permettant d'évaluer AlphaFold2 sur la prédiction d'interactions médiées par des régions désordonnées. AlphaFold2 réussit dans 90% des cas à prédire une bonne solution lorsqu'on combine plusieurs stratégies de construction des alignements de séquences.Pour étudier les cas non prédits par les méthodes actuelles (les anticorps par exemple) et en vue de développer d'autres approches, j'ai exploré plusieurs façons de représenter les structures protéiques et plusieurs modèles d'apprentissage pour prédire l'adéquation entre un résidu et son environnement. J'ai analysé en détail ce qui a réellement été appris par chaque modèle, fournissant une base pour des développements ultérieurs.Enfin, dans le cadre de collaborations portant sur la recombinaison homologue des cassures d'ADN, j'ai réalisé des modèles structuraux de plusieurs complexes avec AlphaFold2 et j'ai également utilisé les informations évolutives des alignements de séquences pour prédire des mutations ponctuelles qui ciblent de façon spécifique une interaction.