Nouvelles méthodes multi-échelles pour l'analyse non-linéaire de la parole
Auteur / Autrice : | Vahid Khanagha |
Direction : | Hussein Yahia, Khalid Daoudi |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 16/01/2013 |
Etablissement(s) : | Bordeaux 1 |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et informatique (Talence, Gironde ; 1991-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire bordelais de recherche en informatique - Laboratoire Bordelais de Recherche en Informatique / LaBRI |
Jury : | Président / Présidente : Christophe d' Alessandro |
Examinateurs / Examinatrices : Gaël Richard, Antonio Turiel, Yannis Stylianou | |
Rapporteurs / Rapporteuses : Régine André-Obrecht, Max A. Little |
Mots clés
Mots clés contrôlés
Résumé
Cette thèse présente une recherche exploratoire sur l'application du Formalisme Microcanonique Multiéchelles (FMM) à l'analyse de la parole. Dérivé de principes issus en physique statistique, le FMM permet une analyse géométrique précise de la dynamique non linéaire des signaux complexes. Il est fondé sur l'estimation des paramètres géométriques locaux (les exposants de singularité) qui quantifient le degré de prédictibilité à chaque point du signal. Si correctement définis est estimés, ils fournissent des informations précieuses sur la dynamique locale de signaux complexes. Nous démontrons le potentiel du FMM dans l'analyse de la parole en développant: un algorithme performant pour la segmentation phonétique, un nouveau codeur, un algorithme robuste pour la détection précise des instants de fermeture glottale, un algorithme rapide pour l’analyse par prédiction linéaire parcimonieuse et une solution efficace pour l’approximation multipulse du signal source d'excitation.