Comparaison de sequences biologiques
Auteur / Autrice : | Saïd Abdeddaim |
Direction : | Jacques Sakarovitch |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences biologiques et fondamentales appliquées. Psychologie |
Date : | Soutenance en 1996 |
Etablissement(s) : | Paris 6 |
Résumé
Cette these porte sur l'alignement de sequences, et plus particulierement sur l'alignement de plus de deux sequences biologiques. Les algorithmes que nous avons developpes operent en deux etapes : dans une premiere etape des blocs (alignements d'occurences de facteurs) compatibles sont selectionnes dans les sequences, la seconde etape consiste a aligner les sequences entre les blocs. Notre strategie de selection des blocs, est une strategie gloutonne tout en etant prudente. Nous nous interessons particulierement au calculde blocs qui ne concernent pas necessairement toutes les sequences a aligner. Pour calculer efficacement ces blocs, nous definissons la structure de graphe hybride, dans lequel un chemin reliant deux occurences signifie que celles-ci ne peuvent faire partie d'un bloc compatible avec les blocs precedemment selectionnes. La prise en compte d'un nouveau bloc se traduit par l'insertion d'aretes dans le graphe hybride. Nous decrirons un nouvel algorithme incremental permettant de maintenir la fermeture transive de la relation decrite par le graphe hybride apres l'insertion d'un bloc. Sous certaines hypotheses, induites par l'observation d'alignement fait a la main, nous montrons que l'on peut efficacement aligner les sequences entre les blocs a l'aide d'un algorithme de programmation dynamique que nous avons developpe. Nous illustrons sur des donnees reelles l'efficacite (en temps de calcul et qualite des alignements) de nos algorithmes compares a deux programmes usites clustal w et treealing.