New method for generating low to medium resolution atomic models of protein structures using a structural alphabet in absence of close structural homologues
Auteur / Autrice : | Surbhi Dhingra |
Direction : | Bernard Offmann, Frédéric Cadet, Ramanathan Sowdhamini |
Type : | Thèse de doctorat |
Discipline(s) : | Biochimie |
Date : | Soutenance le 12/06/2020 |
Etablissement(s) : | Nantes |
Ecole(s) doctorale(s) : | École doctorale Biologie-Santé (Nantes) |
Partenaire(s) de recherche : | Laboratoire : Unité en sciences biologiques et biotechnologies (Nantes) |
Jury : | Président / Présidente : Srinivasan Narayanaswamy |
Rapporteur / Rapporteuse : Juliette Martin, Anne-Claude Camproux |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
La modélisation des structures protéiques en l'absence d'homologie est appelée modélisation sans matrice, modélisation libre ou modélisation ab initio. À ce jour, ce type de modélisation reste le plus grand défi du domaine. Durant cette thèse, nous avons apporté une contribution méthodologique pour relever ce défi en explorant l'utilisation d'un alphabet structurel connu sous le nom de blocs protéiques (BP). Il est maintenant possible de prédire le squelette carbonné d’une protéine sous forme de séquence de BPs de n'importe quelle protéine en utilisant des outils comme PB-kPRED. Notre travail a consisté à trouver une méthode pour passer de la séquence de BPs prédite à la structure 3D. Nous avons donc développé une stratégie qui part d'une requête sous forme de séquences de BP prédites et recherche dans une base de données de structures non homologues des fragments de BPs similaires. Notre stratégie tente ensuite d'assembler des fragments sélectionnés pour générer des modèles 3D. Pour cela, nous avons tenté d'exploiter les propriétés inhérentes de Modeller en la contraignant à utiliser des fragments de BPs et à utiliser des prédictions de structures secondaires et de contact comme contraintes externes supplémentaires. Nous avons validé les résultats de cette stratégie sur un sous-ensemble de petites protéines cibles issues de CASP13 sur la base des scores couramment utilisés (GDT_TS et TM-score) pour les protocoles de modélisation gratuits. Nous avons pu montrer que des modèles de bonne qualité peuvent être générés pour de petites protéines en utilisant une combinaison de fragments à base de PB et de Modeller. Ce travail ouvre de nouvelles perspectives d’application des blocs protéiques pour solutionner l’épineux problème du repliement des protéines.