Analyse mixte de protéines basée sur la séquence et la structure - applications à l'annotation fonctionnelle | Theses.fr

Romain Tetley

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Analyse mixte de protéines basée sur la séquence et la structure - applications à l'annotation fonctionnelle

FR |

EN

Auteur / Autrice :	Romain Tetley
Direction :	Frédéric Cazals
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 21/11/2018
Etablissement(s) :	Université Côte d'Azur (ComUE)
Ecole(s) doctorale(s) :	École doctorale Sciences et technologies de l'information et de la communication (Sophia Antipolis, Alpes-Maritimes)
Partenaire(s) de recherche :	établissement de préparation : Université de Nice (1965-2019)
	Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) - Algorithms, Biology, Structure
Jury :	Président / Présidente : Jean-François Gibrat
	Examinateurs / Examinatrices : Jean-François Gibrat, Juan Cortés, Félix Rey, Martin Weigt
	Rapporteurs / Rapporteuses : Jean-François Gibrat, Juan Cortés

Mots clés

FR |

EN

Mots clés contrôlés

Théorie des graphes

Modèles de Markov cachés

Topologie

Protéines -- Analyse

Mots clés libres

Biologie structurale

Alignement structural

Topologie

Persistance

Motifs structuraux

Modèles de Markov cachés

Annotation de protéine

Théorie des graphes

Clustering

Résumé

FR |

EN

Dans cette thèse, l'emphase est mise sur la réconciliation de l'analyse de structure et de séquence pour les protéines. L'analyse de séquence brille lorsqu'il s'agit de comparer des protéines présentant une forte identité de séquence (≤ 30\%) mais laisse à désirer pour identifier des homologues lointains. L'analyse de structure est une alternative intéressante. Cependant, les méthodes de résolution de structures sont coûteuses et complexes - lorsque toutefois elles produisent des résultats. Ces observations rendent évident la nécessité de développer des méthodes hybrides, exploitant l'information extraite des structures disponibles pour l'injecter dans des modèles de séquence. Cette thèse produit quatre contributions principales dans ce domaine. Premièrement, nous présentons une nouvelle distance structurale, le RMSDcomb, basée sur des patterns de conservation structurale locale, les motifs structuraux. Deuxièmement, nous avons développé une méthode pour identifier des motifs structuraux entre deux structures exploitant un bootstrap dépendant de filtrations. Notre approche n'est pas un compétiteur direct des aligneurs flexibles mais permet plutôt de produire des analyses multi-échelles de similarités structurales. Troisièmement, nous exploitons les méthodes suscitées pour construire des modèles de Markov cachés hybrides biaisés vers des régions mieux conservées structurellement. Nous utilisons un tel modèle pour caractériser les protéines de fusion virales de classe II, une tâche particulièrement ardue du fait de leur faible identité de séquence et leur conservation structurale moyenne. Ce faisant, nous parvenons à trouver un certain nombre d'homologues distants connues des protéines virales, notamment chez la Drosophile. Enfin, en formalisant un sous-problème rencontré lors de la comparaison de filtrations, nous présentons un nouveau problème théorique - le D-family matching - sur lequel nous démontrons des résultats algorithmiques variés. Nous montrons - d'une façon analogue à la comparaison de régions de deux conformations d'une protéine - comment exploiter ce modèle théorique pour comparer deux clusterings d'un même jeu de données.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Analyse mixte de protéines basée sur la séquence et la structure - applications à l'annotation fonctionnelle

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Analyse mixte de protéines basée sur la séquence et la structure - applications à l'annotation fonctionnelle

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses