Thèse soutenue

Étude statistique de séquences biologiques et convergence de martingales

FR  |  
EN
Auteur / Autrice : Peggy Cénac
Direction : Guy FayolleBernard Bercu
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance en 2006
Etablissement(s) : Toulouse 3

Résumé

FR  |  
EN

Le système dynamique Chaos Game Representation associe à une suite de lettres dans un alphabet fini, une mesure empirique sur un ensemble. Fournit-elle plus d'information que les méthodes de comptage de mots classiques ? A partir d'une caractérisation basée sur la CGR, on propose une nouvelle famille de tests donnant l'ordre d'une chaîne de Markov homogène. On définit ensuite une construction d'arbres digitaux de recherche, inspirés par la CGR, en insérant successivement les préfixes retournés d'une chaîne de Markov. On montre que les longueurs des branches critiques se comportent, au premier ordre, comme si les séquences insérées étaient indépendantes entre elles. La dernière partie est consacrée à l'étude de la convergence presque sûre des moments normalisés de tout ordre de martingales vectorielles dans le théorème de la limite centrale presque sûr. Les résultats sont appliqués aux erreurs d'estimation et de prédiction dans les régressions linéaires et les processus de branchement.