Thèse soutenue

Nouvelles approches computationnelles pour étudier l'effet des mutations génétiques sur la topologie des réseaux d'interaction protéine-protéine

FR  |  
EN
Auteur / Autrice : Yasser Mohseni Behbahani
Direction : Alessandra CarboneÉlodie Laine
Type : Thèse de doctorat
Discipline(s) : Bioinformatique
Date : Soutenance le 30/09/2022
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris (1992-...)
Partenaire(s) de recherche : Laboratoire : Biologie computationnelle et quantitative (Paris ; 2011-....)
Jury : Président / Présidente : Jean-Daniel Zucker
Examinateurs / Examinatrices : Sophie Sacquin-Mora, Jessica Andreani
Rapporteur / Rapporteuse : Raphaël Guerois, Catherine Etchebest

Résumé

FR  |  
EN

Avec les progrès récents dans la prédiction de la structure des protéines, les interactions protéine-protéine (PPI) deviennent plus centrales que jamais. Prédire de manière fiable qui sont les partenaires, comment ils interagissent, ainsi que l'affectation de ces interactions par les mutations, ont d'énormes implications en médecine. Cette thèse se concentre sur deux aspects de PPI. Premièrement, la connaissance actuelle des PPI repose sur des données partielles, bruitées et hétérogènes. Nous avons développé un outil web fiable, polyvalent et interactif, appelé LEVELNET, permettant de visualiser, explorer et comparer les réseaux PPI en une interprétation biologique. Il décompose la complexité des réseaux PPI en les représentant sous forme de graphes multicouches. Deuxièmement, nous avons introduit un nouveau cadre de calcul, basé sur l'apprentissage profond géométrique, appelé Deep Local Analysis (DLA), qui représente une interface protéique comme un ensemble de cubes centrés et orientés localement sur les résidus interfaciaux les décrivant eux et leurs environnement atomiques. Elle est invariant à l'orientation globale de la structure tout en tenant pleinement compte de l'orientation relative d'un résidu interfacial par rapport à ses atomes voisins. Nous avons également construit un encodeur à usage général basé sur la structure générant des représentations informatives à partir d'environnements interfaciaux locaux qui peuvent être utilisés dans diverses tâches en aval. Nous avons testé DLA sur deux questions fondamentales concernant les PPI: (i) l'identification des conformations de complexes protéiques quasi-natifs, et (ii) la prédiction des effets des mutations sur les interactions protéiques. Au-delà d’atteindre la puissance prédictive d’état de l'art dans ses objectifs, l'utilité de DLA est présentée pour de multiples applications.