Thèse soutenue

New method for generating low to medium resolution atomic models of protein structures using a structural alphabet in absence of close structural homologues

FR  |  
EN
Auteur / Autrice : Surbhi Dhingra
Direction : Bernard OffmannFrédéric CadetRamanathan Sowdhamini
Type : Thèse de doctorat
Discipline(s) : Biochimie
Date : Soutenance le 12/06/2020
Etablissement(s) : Nantes
Ecole(s) doctorale(s) : École doctorale Biologie-Santé (Nantes)
Partenaire(s) de recherche : Laboratoire : Unité en sciences biologiques et biotechnologies (Nantes)
Jury : Président / Présidente : Srinivasan Narayanaswamy
Rapporteur / Rapporteuse : Juliette Martin, Anne-Claude Camproux

Mots clés

FR

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

La modélisation des structures protéiques en l'absence d'homologie est appelée modélisation sans matrice, modélisation libre ou modélisation ab initio. À ce jour, ce type de modélisation reste le plus grand défi du domaine. Durant cette thèse, nous avons apporté une contribution méthodologique pour relever ce défi en explorant l'utilisation d'un alphabet structurel connu sous le nom de blocs protéiques (BP). Il est maintenant possible de prédire le squelette carbonné d’une protéine sous forme de séquence de BPs de n'importe quelle protéine en utilisant des outils comme PB-kPRED. Notre travail a consisté à trouver une méthode pour passer de la séquence de BPs prédite à la structure 3D. Nous avons donc développé une stratégie qui part d'une requête sous forme de séquences de BP prédites et recherche dans une base de données de structures non homologues des fragments de BPs similaires. Notre stratégie tente ensuite d'assembler des fragments sélectionnés pour générer des modèles 3D. Pour cela, nous avons tenté d'exploiter les propriétés inhérentes de Modeller en la contraignant à utiliser des fragments de BPs et à utiliser des prédictions de structures secondaires et de contact comme contraintes externes supplémentaires. Nous avons validé les résultats de cette stratégie sur un sous-ensemble de petites protéines cibles issues de CASP13 sur la base des scores couramment utilisés (GDT_TS et TM-score) pour les protocoles de modélisation gratuits. Nous avons pu montrer que des modèles de bonne qualité peuvent être générés pour de petites protéines en utilisant une combinaison de fragments à base de PB et de Modeller. Ce travail ouvre de nouvelles perspectives d’application des blocs protéiques pour solutionner l’épineux problème du repliement des protéines.