Développement d'un alphabet structural intégrant la flexibilité des structures protéiques

Ikram Sekhi

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Développement d'un alphabet structural intégrant la flexibilité des structures protéiques

FR |

EN

Auteur / Autrice :	Ikram Sekhi
Direction :	Anne-Claude Camproux, Grégory Nuel
Type :	Thèse de doctorat
Discipline(s) :	Physiologie et biologie des organismes - populations - interactions. Bioinformatique
Date :	Soutenance le 29/01/2018
Etablissement(s) :	Sorbonne Paris Cité
Ecole(s) doctorale(s) :	École doctorale Médicament, toxicologie, chimie, imageries (Paris ; 2014-....)
Partenaire(s) de recherche :	établissement de préparation : Université Paris Diderot - Paris 7 (1970-2019)
	Laboratoire : Laboratoire de probabilités, statistique et modélisation (Paris ; 2018-....)
Jury :	Président / Présidente : Alessandra Carbone
	Examinateurs / Examinatrices : Anne-Claude Camproux, Grégory Nuel, Dominique Barth, Delphine Flatters, François André
	Rapporteur / Rapporteuse : Alessandra Carbone, Dominique Barth

Mots clés

FR |

EN

Mots clés contrôlés

Bases de données de protéines

Conformation des protéines

Chaines de Markov

Bioinformatique structurale

Codage

Entropie (théorie de l'information)

Modèles de Markov cachés

Mots clés libres

Structure 3D d'une protéine

Alphabet Structural (AS)

Chaînes de Markov cachées (HMM)

Fichier au format PDB (Protein Data Bank)

Parser PDB

Encodage structural

Maximum a Posteriori (MAP)

Marginal posterior distribution (POST)

Entropie d’encodage

Effective number of structural letters (NEFF)

Résumé

FR |

EN

L’objectif de cette thèse est de proposer un Alphabet Structural (AS) permettant une caractérisation fine et précise des structures tridimensionnelles (3D) des protéines, à l’aide des chaînes de Markov cachées (HMM) qui permettent de prendre en compte la logique issue de l’enchaînement des fragments structuraux en intégrant l’augmentation des conformations 3D des structures protéiques désormais disponibles dans la banque de données de la Protein Data Bank (PDB). Nous proposons dans cette thèse un nouvel alphabet, améliorant l’alphabet structural HMM-SA27,appelé SAFlex (Structural Alphabet Flexibility), dans le but de prendre en compte l’incertitude des données (données manquantes dans les fichiers PDB) et la redondance des structures protéiques. Le nouvel alphabet structural SAFlex obtenu propose donc un nouveau modèle d’encodage rigoureux et robuste. Cet encodage permet de prendre en compte l’incertitude des données en proposant trois options d’encodages : le Maximum a posteriori (MAP), la distribution marginale a posteriori (POST)et le nombre effectif de lettres à chaque position donnée (NEFF). SAFlex fournit également un encodage consensus à partir de différentes réplications (chaînes multiples, monomères et homomères) d’une même protéine. Il permet ainsi la détection de la variabilité structurale entre celles-ci. Les avancées méthodologiques ainsi que l’obtention de l’alphabet SAFlex constituent les contributions principales de ce travail de thèse. Nous présentons aussi le nouveau parser de la PDB (SAFlex-PDB) et nous démontrons que notre parser a un intérêt aussi bien sur le plan qualitatif (détection de diverses erreurs)que quantitatif (rapidité et parallélisation) en le comparant avec deux autres parsers très connus dans le domaine (Biopython et BioJava). Nous proposons également à la communauté scientifique un site web mettant en ligne ce nouvel alphabet structural SAFlex. Ce site web représente la contribution concrète de cette thèse alors que le parser SAFlex-PDB représente une contribution importante pour le fonctionnement du site web proposé. Cette caractérisation précise des conformations 3D et la prise en compte de la redondance des informations 3D disponibles, fournies par SAFlex, a en effet un impact très important pour la modélisation de la conformation et de la variabilité des structures 3D, des boucles protéiques et des régions d’interface avec différents partenaires, impliqués dans la fonction des protéines

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Développement d'un alphabet structural intégrant la flexibilité des structures protéiques

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Développement d'un alphabet structural intégrant la flexibilité des structures protéiques

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses