Systèmes de reconnaissance de la parole revisités : réseaux bayésiens dynamiques et nouveaux paradigmes
Auteur / Autrice : | Murat Deviren |
Direction : | Jean-Paul Haton |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2004 |
Etablissement(s) : | Nancy 1 |
Partenaire(s) de recherche : | autre partenaire : Université Henri Poincaré Nancy 1. Faculté des sciences et techniques |
Mots clés
Résumé
Dans cette thèse nous élaborons quatre composantes fondamentales d'un système de reconnaissance automatique de la parole : la modélisation acoustique, la modélisation du langage, la paramétrisation du signal acoustique et la compensation du bruit. Nous proposons des techniques nouvelles dans chacun de ces domaines, et nous apportons des perspectives novatrices. Nous traitons les problèmes de modélisation acoustique et modélisation du langage avec un outil statistique puissant : les modèles probabilistes graphiques. Ce formalisme généralise la plupart des techniques probabilistes utilisées dans le traitement de la parole. La reformulation des modules de modélisation dans ce formalisme, nous ouvre de nouvelles perspectives inexploitées auparavant. En plus des nouvelles approches pour la modélisation, nous proposons également de nouvelles stratégies pour l'extraction des paramètres acoustiques. Notre motivation principale dans ce domaine est de chercher des paramètres robustes qui ne sont pas liés à la modélisation par des HMMs. Nous abordons aussi le problème de robustesse au bruit par adaptation des modèles acoustiques et nous proposons une nouvelle méthode de compensation prédictive supervisée.