Intégration de sources de connaissances pour la modélisation stochastique du langage appliquée à la parole continue dans un contexte de dialogue oral homme-machine
Auteur / Autrice : | Yannick Estève |
Direction : | Renato De Mori, Frédéric Béchet |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2002 |
Etablissement(s) : | Avignon |
Mots clés
Résumé
Les modèles de langage sont utilisés dans un système de reconnaissance de la parole pour guider le décodage acoustique. Les modèles de langage ''n-grams'' qui constituent les modèles de langage de référence en reconnaissance de la parole, modélisent des contraintes sur ''n'' mots à partir d'événements observés dans un corpus d'apprentissage. Ces modèles donnent des résultats satisfaisants car ils profitent d'une caractéristique commune à plusieurs langues qui exercent des contraintes locales fortes sur l'ordre des mots. Malheureusement, l'utilisation de ces modèles probabilistes est confrontée à plusieurs difficultés. Une faible quantité de données d'apprentissage est courante lors du développement de nouvelles applications de reconnaissance de la parole et entraîne l'estimation de modèles probabilistes peu robustes. Une autre difficulté vient de la longueur des contraintes modélisées : certaines contraintes linguistiques portent sur des distances supérieures aux capacités de modélisation des modèles ''n-grams''. Afin de pallier aux difficultés des modèles ''n-grams'', nous proposons d'utiliser plusieurs sources de connaissances ''a priori''. Nous proposons un modèle hybride qui combine un modèle de langage ''n-gram'' avec des grammaires régulières locales. Des connaissances ''a priori'' sont également exploitées pour la création de modèles de langage ''n-grams'' spécialisés et pour leur utilisation au cours d'un dialogue oral homme-machine. De même, l'analyse des caractéristiques des hypothèses issues de différents systèmes de reconnaissance utilise diverses sources de connaissances. Cette analyse permet de choisir l'hypothèse de reconnaissance la plus pertinente ou de rejeter l'ensemble des hypothèses proposées. Enfin, des connaissances ''a priori'' sont prises en compte pour élaborer des critères de consistance linguistique. Ces critères permettent de détecter certains types d'erreurs qui peuvent être corrigés à l'aide de modèles de langage très spécifiques, appelés modèles stratégiques