Extension du modèle stochastique des mélanges de trajectoires pour la reconnaissance automatique de la parole continue
FR
Auteur / Autrice : | Irina Illina |
Direction : | Jean-Paul Haton, Yifan Gong |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 1997 |
Etablissement(s) : | Nancy 1 |
Partenaire(s) de recherche : | autre partenaire : Université Henri Poincaré Nancy 1. Faculté des sciences et techniques |
Mots clés
FR
Résumé
FR
Nous nous intéressons dans cette thèse à la modélisation acoustique de la parole continue à l'aide du modèle stochastique des mélanges de trajectoires (MSTM). Ce modèle, développé au CRIN-INRIA Lorraine pour la reconnaissance automatique de la parole, est un modèle fondé sur les segments (SBM), qui se différencie donc des traditionnels modèles de Markov cachés (HMM) fondés sur les trames (FBM). MSTM donne de bons résultats de reconnaissance en mode dépendant du locuteur. En revanche, les problèmes liés à la variabilité multi-environnements, à la multiplicités des contextes phonétiques et à l'adaptation aux conditions de test sont toujours d'actualité. Dans ce cadre, notre travail propose différentes extensions du modèle MSTM. [. . . ]