Thèse soutenue

Le score local : un outil pour l'analyse de séquences biologiques

FR  |  
EN
Auteur / Autrice : Marie-Pierre Étienne
Direction : Pierre Vallois
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance en 2002
Etablissement(s) : Nancy 1
Partenaire(s) de recherche : autre partenaire : Université Henri Poincaré Nancy 1. Faculté des sciences et techniques

Résumé

FR  |  
EN

Les molécules biologiques que sont l'ADN, les différents ARN et les protéines sont à la base des mécanismes du vivant. On peut les considérer comme de longues séquences écrites à l'aide d'un alphabet A fini. Une des méthodes pour analyser l'information contenue dans ces séquences consiste à attribuer un poids appelé score à chaque composant élémentaire. Le score global de la séquence est alors la somme des scores élémentaires et le score local est le maximum des scores de toutes les sous séquences. Le problème statistique qui se pose est d'évaluer le niveau de significativité du score local obtenu. Pour répondre à cette question, on se place sous l'hypothèse nulle Ho qui correspond dans cette étude à considérer les scores élémentaires comme des variables i. I. D. Selon le signe de l'espérance des scores élémentaires, le comportement du score local est totalement différent. On détermine alors la loi asymptotique du score local dans le cas centré. Cette étude complète l'approche proposée par Karlin & al. Et Mercier (espérance négative). Il existe donc une zone de transition de phase lorsque l'espérance est proche de 0 et nous étudions le comportement numérique des différentes approximations dans ce cas.