Nouvelles approches computationnelles pour étudier l'effet des mutations génétiques sur la topologie des réseaux d'interaction protéine-protéine
Auteur / Autrice : | Yasser Mohseni Behbahani |
Direction : | Alessandra Carbone, Élodie Laine |
Type : | Thèse de doctorat |
Discipline(s) : | Bioinformatique |
Date : | Soutenance le 30/09/2022 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris (1992-...) |
Partenaire(s) de recherche : | Laboratoire : Biologie computationnelle et quantitative (Paris ; 2011-....) |
Jury : | Président / Présidente : Jean-Daniel Zucker |
Examinateurs / Examinatrices : Sophie Sacquin-Mora, Jessica Andreani | |
Rapporteur / Rapporteuse : Raphaël Guerois, Catherine Etchebest |
Mots clés
Résumé
Avec les progrès récents dans la prédiction de la structure des protéines, les interactions protéine-protéine (PPI) deviennent plus centrales que jamais. Prédire de manière fiable qui sont les partenaires, comment ils interagissent, ainsi que l'affectation de ces interactions par les mutations, ont d'énormes implications en médecine. Cette thèse se concentre sur deux aspects de PPI. Premièrement, la connaissance actuelle des PPI repose sur des données partielles, bruitées et hétérogènes. Nous avons développé un outil web fiable, polyvalent et interactif, appelé LEVELNET, permettant de visualiser, explorer et comparer les réseaux PPI en une interprétation biologique. Il décompose la complexité des réseaux PPI en les représentant sous forme de graphes multicouches. Deuxièmement, nous avons introduit un nouveau cadre de calcul, basé sur l'apprentissage profond géométrique, appelé Deep Local Analysis (DLA), qui représente une interface protéique comme un ensemble de cubes centrés et orientés localement sur les résidus interfaciaux les décrivant eux et leurs environnement atomiques. Elle est invariant à l'orientation globale de la structure tout en tenant pleinement compte de l'orientation relative d'un résidu interfacial par rapport à ses atomes voisins. Nous avons également construit un encodeur à usage général basé sur la structure générant des représentations informatives à partir d'environnements interfaciaux locaux qui peuvent être utilisés dans diverses tâches en aval. Nous avons testé DLA sur deux questions fondamentales concernant les PPI: (i) l'identification des conformations de complexes protéiques quasi-natifs, et (ii) la prédiction des effets des mutations sur les interactions protéiques. Au-delà d’atteindre la puissance prédictive d’état de l'art dans ses objectifs, l'utilité de DLA est présentée pour de multiples applications.