Thèse soutenue

FR
Auteur / Autrice : Afshin Fayyaz Movaghar
Direction : Louis Ferré
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance en 2007
Etablissement(s) : Toulouse 2

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Cette thèse est consacrée à l’évaluation de la signification statistique pour la comparaison de séquences biologiques. Nous nous intéressons ici à l'optimisation d’alignements locaux. Un alignement local exprime les similitudes en révélant les parties des séquences qui sont semblables. Si, les méthodes usuelles (telles que BLAST) sont appropriées aux longues séquences, dans cette thèse, nous proposons deux nouvelles p-valeurs basées sur des méthodes exactes hors du cadre asymptotique : 1. La p-valeur basée sur l’approche des h-uplets : elle combine une distribution approchée du score local sans gaps de deux séquences et une fonction de score spécifique qui permet d’introduire les gaps calculée pour un entier h donné. L'influence de h et la qualité de la p-valeur sont numériquement étudiées et comparées à la p-valeur obtenue par BLAST. Les résultats numériques soulignent que notre p-valeur approchée surpasse celle de BLAST pour des séquences courtes simulées ou réelles. 2. La nouvelle p-valeur obtenue en améliorant le « Greedy Extension model » : elle est basée sur une approximation poissonienne dont le paramètre à estimer. Dans ce travail, nous l’estimons en utilisant des méthodes exactes qui améliorent la précision de la p-valeur. Nous illustrons notre propos par des simulations.