Thèse soutenue

Prédiction structurale des assemblages protéiques par apprentissage profond

FR  |  
EN
Auteur / Autrice : Hélène Bret
Direction : Raphaël GueroisJessica Andreani
Type : Thèse de doctorat
Discipline(s) : Biologie structurale
Date : Soutenance le 27/03/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Innovation thérapeutique : du fondamental à l'appliqué
Partenaire(s) de recherche : Laboratoire : Institut de biologie intégrative de la cellule (Gif-Sur-Yvette, Essonne ; 2015-....)
référent : Université Paris-Saclay. Faculté de pharmacie (Orsay, Essonne ; 2020-....)
graduate school : Université Paris-Saclay. Graduate School Santé et médicament (2020-....)
Jury : Président / Présidente : Herman Van Tilbeurgh
Examinateurs / Examinatrices : Isabelle Callebaut, Élodie Laine, Jean-Christophe Gelly
Rapporteurs / Rapporteuses : Isabelle Callebaut, Élodie Laine

Résumé

FR  |  
EN

Les interactions protéine-protéine jouent un rôle majeur dans la plupart des processus cellulaires et les étudier permet de comprendre les réseaux de protéines et de concevoir des mutants. Mon projet de thèse portait sur quatre points en lien avec la prédiction des interactions protéine-protéine. Premièrement, j'ai contribué à intégrer des contraintes prédites par des méthodes d'apprentissage profond basées sur la covariation pour faciliter le docking dans le serveur InterEvDock3.Le deuxième aspect fait suite à l'arrivée d'AlphaFold2, très performant pour prédire les interactions entre domaines globulaires. J'ai construit un jeu de données permettant d'évaluer AlphaFold2 sur la prédiction d'interactions médiées par des régions désordonnées. AlphaFold2 réussit dans 90% des cas à prédire une bonne solution lorsqu'on combine plusieurs stratégies de construction des alignements de séquences.Pour étudier les cas non prédits par les méthodes actuelles (les anticorps par exemple) et en vue de développer d'autres approches, j'ai exploré plusieurs façons de représenter les structures protéiques et plusieurs modèles d'apprentissage pour prédire l'adéquation entre un résidu et son environnement. J'ai analysé en détail ce qui a réellement été appris par chaque modèle, fournissant une base pour des développements ultérieurs.Enfin, dans le cadre de collaborations portant sur la recombinaison homologue des cassures d'ADN, j'ai réalisé des modèles structuraux de plusieurs complexes avec AlphaFold2 et j'ai également utilisé les informations évolutives des alignements de séquences pour prédire des mutations ponctuelles qui ciblent de façon spécifique une interaction.