New method for generating low to medium resolution atomic models of protein structures using a structural alphabet in absence of close structural homologues

par Surbhi Dhingra

Thèse de doctorat en Biochimie

Soutenue le 12-06-2020

à Nantes , dans le cadre de École doctorale Biologie-Santé (Rennes) , en partenariat avec Unité de Fonctionnalité et Ingénierie des Protéines (Nantes) (laboratoire) .

Le président du jury était Srinivasan Narayanaswamy.

Les rapporteurs étaient Juliette Martin, Anne-Claude Camproux.


  • Résumé

    La modélisation des structures protéiques en l'absence d'homologie est appelée modélisation sans matrice, modélisation libre ou modélisation ab initio. À ce jour, ce type de modélisation reste le plus grand défi du domaine. Durant cette thèse, nous avons apporté une contribution méthodologique pour relever ce défi en explorant l'utilisation d'un alphabet structurel connu sous le nom de blocs protéiques (BP). Il est maintenant possible de prédire le squelette carbonné d’une protéine sous forme de séquence de BPs de n'importe quelle protéine en utilisant des outils comme PB-kPRED. Notre travail a consisté à trouver une méthode pour passer de la séquence de BPs prédite à la structure 3D. Nous avons donc développé une stratégie qui part d'une requête sous forme de séquences de BP prédites et recherche dans une base de données de structures non homologues des fragments de BPs similaires. Notre stratégie tente ensuite d'assembler des fragments sélectionnés pour générer des modèles 3D. Pour cela, nous avons tenté d'exploiter les propriétés inhérentes de Modeller en la contraignant à utiliser des fragments de BPs et à utiliser des prédictions de structures secondaires et de contact comme contraintes externes supplémentaires. Nous avons validé les résultats de cette stratégie sur un sous-ensemble de petites protéines cibles issues de CASP13 sur la base des scores couramment utilisés (GDT_TS et TM-score) pour les protocoles de modélisation gratuits. Nous avons pu montrer que des modèles de bonne qualité peuvent être générés pour de petites protéines en utilisant une combinaison de fragments à base de PB et de Modeller. Ce travail ouvre de nouvelles perspectives d’application des blocs protéiques pour solutionner l’épineux problème du repliement des protéines.

  • Titre traduit

    Nouvelles approches pour générer des modèles de moyennes résolutions à l'échelle atomique de structures de protéines à l'aide d'un alphabet structural en absence d'homologues proches


  • Résumé

    Modelling of protein structures in the absence of known homology is termed as templatefree modelling (TFM), free-modelling (FM) or ab initio modelling. To date this remains the biggest challenge in the field. In the current work, we have made a methodological contribution to address this challenge by exploring the use of a structural alphabet known as protein blocks (PBs). With the help of PBs it is now possible to predict the PB sequence of any protein sequence using tools like PB-kPRED. Our work was motivated by the need to find a method to move forward from predicted PB sequence to 3D structure. We hence developed a strategy that starts from a predicted query PB sequences and searches into a non-homologous structural database for similar PB stretches or fragments. Our strategy then tries to assemble selected fragments to generate meaningful 3D models. For that, we attempted to exploit the inherent property of Modeller by constraining it to use PB fragments along with secondary structures and contact predictions as additional restraints to predict protein models. We validated the results of our strategy on a subset of small proteins from CASP13 target list on the basis of the commonly used scores (GDT_TS and TM-score) for free modelling protocols. We were able to show that good quality models can be generated for small proteins using a combination of PB based fragments and Modeller. This work opened a new explorative path for protein blocks down the lane of solving the ever so perplexing protein folding dogma.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université de Nantes. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.