Thèse soutenue

Analyse statistique des structures tridimensionnelles de protéines et validation de familles structurales à bas taux d'identité

FR
Auteur / Autrice : Mounir Errami
Direction : Gilbert Deléage
Type : Thèse de doctorat
Discipline(s) : Sciences. Bioinformatique
Date : Soutenance en 2002
Etablissement(s) : Lyon 1
Jury : Examinateurs / Examinatrices : Gilbert Deléage

Résumé

FR

Le travail présenté comporte deux parties. Dans la première partie, nous présentons une stratégie originale pour l'étude statistique exhaustive et objective des structures tridimensionnelles de protéines. Cette stratégie est basée sur une architecture logicielle bioinformatique complexe grâce à laquelle nous établissons les relations entre les alignements multiples de séquences et la conservation de caractéristiques structurales particulières au sein de protéines. Nous montrons que les acides aminés des ponts disulfures, des interactions hydrophobes ou électrostatiques sont particulièrement conservés dans les alignements multiples, suggérant l'apport potentiel des alignements multiples pour la prédiction des structures tridimensionnelles. Par ailleurs, nous montrons que les alignements les plus informatifs sont constitués de séquences apparentées faiblement similaires. Cependant, il est difficile de valider les familles structurales à faible similarité. Dans la seconde partie du travail, nous présentons une méthode qui permet à partir d'un alignement multiple de séquences, de détecter les séquences '' intruses '' n'ayant pas de parenté avec les autres séquences de l'alignement. Cette méthode s'appuie sur la prédiction des structures secondaires et l'analyse de leur compatibilité dans les alignements multiples. Cette méthode automatique fournit un moyen efficace de s'assurer de la cohérence des alignements multiples et peut être utilisée pour réaliser de manière itérative, les alignement les plus divergents possibles et donc les plus informatifs. Par ailleurs, cette méthode peut être utile dans d'autres domaines : la caractérisation et la classification des protéines, l'amélioration des alignements multiples de séquences et des outils d'alignements et la modélisation des structures de protéines. Ces champs d'étude offrent des perspectives intéressantes pour les outils développés et les travaux réalisés durant cette thèse.