Thèse soutenue

exploration de l’utilisation d’une technologie de mutagenèse à haut débit et de l’évolution pour la prédiction structurale des complexes protéiques

FR  |  
EN
Auteur / Autrice : Aravindan Nadaradjane
Direction : Raphaël Guerois
Type : Thèse de doctorat
Discipline(s) : Biochimie et biologie structurale
Date : Soutenance le 16/01/2020
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Innovation thérapeutique : du fondamental à l'appliqué (Châtenay-Malabry, Hauts-de-Seine ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Institut de biologie intégrative de la cellule (Gif-Sur-Yvette, Essonne ; 2015-....)
référent : Université Paris-Saclay. Faculté de pharmacie (Orsay, Essonne ; 2020-....)
Jury : Président / Présidente : Sylvie Nessler
Examinateurs / Examinatrices : Pierre Tuffery, Juliette Martin, Anne Lopes, Dirk Stratmann
Rapporteurs / Rapporteuses : Pierre Tuffery, Juliette Martin

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L’objectif de cette thèse a été de développer des stratégies computationnelles permettant d’exploiter les informations issues des technologies de mutagenèse à haut débit (deep mutational scanning, DMS) pour prédire le mode d’assemblage des protéines. Pour cela, j’ai cherché à améliorer l’accord entre les modèles simulés par les techniques d’amarrage moléculaire et les contraintes expérimentales. Deux complexes de référence dont les structures ont été résolues expérimentalement et pour lesquels les données de DMS ont été publiées ont été utilisés pour la mise au point de ces méthodes, les complexes parD3-parE3 et dockerin-cohesin. Pour chacun des nombreux mutants générés par DMS, une mesure expérimentale de score de liaison quantifiant l’affinité des partenaires en complexe a pu être extraite. Pour la modélisation, différents protocoles basés sur le logiciel Rosetta ont été explorés pour prédire l’effet des mutations sur la stabilité des interfaces. Un compromis entre efficacité et précision a été identifié, permettant d’estimer de façon satisfaisante l’effet des mutations sur les structures natives des complexes. L’accord entre prédiction et données expérimentales a été quantifié en utilisant deux métriques, la corrélation entre les scores d’affinité prédits et mesurés et l’aire sous la courbe ROC (Receiver Operating Characteristic) définissant l’efficacité du prédicteur à classer correctement les mutations ayant le plus fort impact. Appliquées sur un ensemble de 1000 modèles de complexes issus des simulations d’amarrage, ces deux métriques ont été évaluées dans leur capacité à discriminer les modèles corrects des modèles faux. Pour les deux systèmes étudiés, la deuxième métrique apparaît comme la mieux adaptée. La méthodologie a ensuite été appliquée à un cas de complexe antigène-anticorps dans le cadre d’une collaboration avec l’équipe de B. Maillère. Mon travail de thèse a également été consacré au traitement des données de DMS générées avec nos collaborateurs O. Pereira-Ramos et L. Martin dans un cas de design de peptides à haute affinité pour la protéine Asf1 et pour le criblage des surfaces d’interaction de cette protéine avec ses partenaires. Enfin, j’ai participé tout au long de mon doctorat aux différentes cibles proposées par les organisateurs du 7ème concours CAPRI, concours international pour l’évaluation des méthodes de prédiction des structures de complexes protéiques. Le manuscrit détaille l’ensemble des stratégies mises en oeuvre qui ont permis à notre équipe de se classer en tête de ce concours en générant le plus grand nombre de modèles corrects et précis.