exploration de l’utilisation d’une technologie de mutagenèse à haut débit et de l’évolution pour la prédiction structurale des complexes protéiques
Auteur / Autrice : | Aravindan Nadaradjane |
Direction : | Raphaël Guerois |
Type : | Thèse de doctorat |
Discipline(s) : | Biochimie et biologie structurale |
Date : | Soutenance le 16/01/2020 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Innovation thérapeutique : du fondamental à l'appliqué (Châtenay-Malabry, Hauts-de-Seine ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Institut de biologie intégrative de la cellule (Gif-Sur-Yvette, Essonne ; 2015-....) |
référent : Université Paris-Saclay. Faculté de pharmacie (Orsay, Essonne ; 2020-....) | |
Jury : | Président / Présidente : Sylvie Nessler |
Examinateurs / Examinatrices : Pierre Tuffery, Juliette Martin, Anne Lopes, Dirk Stratmann | |
Rapporteurs / Rapporteuses : Pierre Tuffery, Juliette Martin |
Mots clés
Mots clés contrôlés
Résumé
L’objectif de cette thèse a été de développer des stratégies computationnelles permettant d’exploiter les informations issues des technologies de mutagenèse à haut débit (deep mutational scanning, DMS) pour prédire le mode d’assemblage des protéines. Pour cela, j’ai cherché à améliorer l’accord entre les modèles simulés par les techniques d’amarrage moléculaire et les contraintes expérimentales. Deux complexes de référence dont les structures ont été résolues expérimentalement et pour lesquels les données de DMS ont été publiées ont été utilisés pour la mise au point de ces méthodes, les complexes parD3-parE3 et dockerin-cohesin. Pour chacun des nombreux mutants générés par DMS, une mesure expérimentale de score de liaison quantifiant l’affinité des partenaires en complexe a pu être extraite. Pour la modélisation, différents protocoles basés sur le logiciel Rosetta ont été explorés pour prédire l’effet des mutations sur la stabilité des interfaces. Un compromis entre efficacité et précision a été identifié, permettant d’estimer de façon satisfaisante l’effet des mutations sur les structures natives des complexes. L’accord entre prédiction et données expérimentales a été quantifié en utilisant deux métriques, la corrélation entre les scores d’affinité prédits et mesurés et l’aire sous la courbe ROC (Receiver Operating Characteristic) définissant l’efficacité du prédicteur à classer correctement les mutations ayant le plus fort impact. Appliquées sur un ensemble de 1000 modèles de complexes issus des simulations d’amarrage, ces deux métriques ont été évaluées dans leur capacité à discriminer les modèles corrects des modèles faux. Pour les deux systèmes étudiés, la deuxième métrique apparaît comme la mieux adaptée. La méthodologie a ensuite été appliquée à un cas de complexe antigène-anticorps dans le cadre d’une collaboration avec l’équipe de B. Maillère. Mon travail de thèse a également été consacré au traitement des données de DMS générées avec nos collaborateurs O. Pereira-Ramos et L. Martin dans un cas de design de peptides à haute affinité pour la protéine Asf1 et pour le criblage des surfaces d’interaction de cette protéine avec ses partenaires. Enfin, j’ai participé tout au long de mon doctorat aux différentes cibles proposées par les organisateurs du 7ème concours CAPRI, concours international pour l’évaluation des méthodes de prédiction des structures de complexes protéiques. Le manuscrit détaille l’ensemble des stratégies mises en oeuvre qui ont permis à notre équipe de se classer en tête de ce concours en générant le plus grand nombre de modèles corrects et précis.