Thèse soutenue

Algorithmes et outils informatiques pour l'étude des protéines intrinsèquement désordonnées

FR  |  
EN
Auteur / Autrice : Alejandro Estana
Direction : Juan CortésPau Bernadó
Type : Thèse de doctorat
Discipline(s) : Réseaux, Télécommunications, Systèmes et Architecture
Date : Soutenance le 27/02/2020
Etablissement(s) : Toulouse, INSA
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : LAAS - Laboratoire d'Analyse et d'Architecture des Systèmes - Laboratoire d'analyse et d'architecture des systèmes / LAAS
Jury : Président / Présidente : Thomas Schiex
Examinateurs / Examinatrices : Juan Cortés, Pau Bernadó, Ora Schueler-Furman, Michael Nilges, Loïc Salmon
Rapporteurs / Rapporteuses : Ora Schueler-Furman, Michael Nilges

Résumé

FR  |  
EN

Les protéines intrinsèquement désordonnées (IDPs) sont impliquées dans de nombreux processus biologiques. Leur plasticité facilite des tâches très spécialisées dans la régulation et la signalisation cellulaires, et leur dysfonctionnement est lié à des pathologies graves. Comprendre les rôles fonctionnels des IDPs nécessite leur caractérisation structurale, qui est extrêmement difficile, utilisant un couplage entre méthodes expérimentales et informatiques. Contrairement aux protéines globulaires, les IDPs ne peuvent pas être représentés par une seule conformation et leurs modèles doivent être basés sur des ensembles de conformations représentant une distribution des états que la protéine adopte en solution. Alors que les régions purement destructurées peuvent être bien modélisés par les outils de bioinformatique disponibles, ces outils ne parviennent pas à reproduire l'équilibre conformationnel présent dans des régions partiellement structurées.Dans cette thèse, nous proposons plusieurs méthodes bioinformatiques qui, combinées avec des données expérimentales, permettent une meilleure caractérisation structurale des IDPs. Elles peuvent être regroupées en deux catégories : les méthodes de construction de modèles d'ensembles conformationnels, et les méthodes de simulation de transitions conformationnelles.Avec le premier type de méthodes, nous proposons une nouvelle approche qui améliore les méthodes existantes afin de générer des ensembles conformationnels réalistes, en permettant de reproduire les régions partiellement structurées dans les IDPs.Cette méthode exploite les informations structurales codées dans une base de données de fragments de trois résidus (tripeptides) extraites de structures protéiques à haute résolution.Nous avons montré que les ensembles conformationnels générés par notre méthode reproduisent avec précision les descriptions structurales obtenues à partir d’expériences de RMN et SAXS pour neuf IDPs de référence. Exploitant également la base de données des tripeptides, nous avons développé un algorithme pour prédire la propension de certaines régions dans des IDPs à former des éléments de structure secondaire. Cette nouvelle méthode fournit des résultats plus précis que ceux de prédicteurs plus couramment utilisés, pour nos IDPs de référence.Avec le second type de méthodes, nous avons développé une approche originale pour modéliser le mécanisme de repliement des éléments de structure secondaire. Le calcul des transitions est formulé comme un problème de recherche de chemin discret utilisant la base de données de tripeptides. Pour évaluer l'approche, nous l'avons appliquée à deux petits polypeptides synthétiques imitant deux motifs structuraux communs. Les mécanismes de repliement extraits sont très similaires à ceux obtenus par des approches traditionnelles coûteuses en calcul. Enfin, nous avons développé une méthode plus générale pour calculer les chemins de transition entre conformations dans un ensemble d'IDPs. Elle repose sur une variante multi-arbres de l'algorithme TRRT, développé au LAAS-CNRS, et qui a donné de bons résultats pour de petites et moyennes biomolécules. Afin d'appliquer cette méthode aux IDPs, nous avons proposé une stratégie hybride pour la parallélisation de l'algorithme, permettant une exécution efficace dans des clusters.Outre les travaux méthodologiques mentionnés, j'ai participé activement à des travaux multidisciplinaires avec des biophysiciens et des biologistes, en appliquant ces méthodes à l'étude de systèmes biologiques importants, comme la protéine huntingtine impliquée dans la maladie de Huntington.En conclusion, les travaux menés au cours de ma thèse ont permis de mieux comprendre la relation séquence-structure des IDPs, ouvrant la voie à de nouvelles applications. En effet, ceci nous permettra, par exemple, d’anticiper les perturbations structurales dues aux mutations et, in fine, à la conception rationnelle d’IDPs spécifiques pour des applications biotechnologiques.