Thèse soutenue

Applications d'un alphabet structural pour l'analyse, la prédiction et la reconnaissance des repliements des protéines

FR  |  
EN
Auteur / Autrice : Swapnil Mahajan
Direction : Bernard Offmann
Type : Thèse de doctorat
Discipline(s) : Biologie informatique
Date : Soutenance le 29/10/2013
Etablissement(s) : La Réunion
Ecole(s) doctorale(s) : École doctorale Sciences, Technologies et Santé (Saint-Denis, La Réunion)
Jury : Président / Présidente : Frédéric Cadet
Examinateurs / Examinatrices : Isabelle André, Srinivasan Narayanaswamy, Alexandre de Brevern, Christine Sinoquet
Rapporteurs / Rapporteuses : Richard Lavery

Résumé

FR  |  
EN

Les blocs protéiques (BP) constituent un alphabet structural qui permettent une bonne approximation du squelette carbonnée des protéines et la compression de l'information 3D en 1D. Leur utilisation a permis d'appréhender sous un nouvel angle la structure des protéines. Cette thèse explore de nouvelles applications des BP pour l'analyse des structures des protéines, leur prédiction et la reconnaissance de leurs repliements. Dans un premier temps, nous utilisons les BP pour une caractérisation fine des régions variables dans les alignements structuraux de protéines homologues. Ces régions peuvent néanmoins présenter des similarités importantes en terme de conformation. Leur caractérisation a permis de les distinguer des régions dont les conformations sont différentes. Nous montrons aussi que les variations intrinsèques de certaines régions comme les boucles au sein d’une protéine ne sont pas corrélées aux différences de conformation observées dans les régions équivalentes entre protéines homologues. Dans une deuxième partie, nous analysons la relation séquence-structure à l'aide de BP par le biais d'une base de données de pentapeptides issus des structures des protéines. Celle-ci a servi de base pour la mise en place d'outils pour la prédiction du squelette carbonnée des protéines (PB-kPRED) et de sa plasticité (PB-SVindex). Nous exposons comment ces prédictions permettent la reconnaissance du repliement des protéines avec un certain succès et l'identification de probables points chauds structuraux et fonctionnels. En dernière partie, nous présentons un nouvel algorithme (FoRSA) pour la reconnaissance du repliement des protéines à l'aide des BP. Cet algorithme s'appuie sur le calcul de la probabilité conditionnelle qu'une séquence adopte un repliement donné et a été testé avec succès sur des protéines tirées de CASP10. Nous montrons que FoRSA peut être utilisé pour l'annotation structurale rapide de génomes entiers.