Thèse soutenue

La reconnaissance automatique de la parole et les modèles markoviens cachés : modèles du second ordre et distance de Viterbi à optimalité locale

FR  |  
EN
Auteur / Autrice : Abdelaziz Kriouile
Direction : Jean-Paul Haton
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1990
Etablissement(s) : Nancy 1
Partenaire(s) de recherche : autre partenaire : Université Henri Poincaré Nancy 1. Faculté des sciences et techniques

Résumé

FR

Des travaux intensifs sur la reconnaissance automatique de la parole utilisant les modèles stochastiques ont été réalisés durant les cinq dernières années. L'application des modèles markoviens cachés (HMM) du premier ordre a conduit 0 des résultats impressionnants dans le domaine de la reconnaissance de mots isolés et de la parole continue. Notre objectif était de montrer que l'apport des modèles markoviens cachés à la reconnaissance automatique de la parole est d'autant plus important qu'on mène des réflexions fondamentales sur les modèles markoviens eux-mêmes et sur la façon de les appliquer. Nous avons développé une nouvelle formulation de Baum-Welch et une extension de l'algorithme de Viterbi, qui rendent les modèles markoviens cachés du second ordre efficaces en calcul pour des applications en temps réel. Il y avait une nette amélioration du taux de reconnaissance avec le second ordre. L'extension a des HMM d'ordre plus élevé a été aussi discutée. Enfin, nous avons proposé une nouvelle stratégie d'utilisation de l'algorithme de Viterbi pour la reconnaissance de la parole continue. Elle est basée sur la comparaison d'optimums locaux dans une fenêtre de trames. Cette stratégie, par bloc, a donné de meilleurs résultats que les versions classiques de l'algorithme de Viterbi. Elle permet une interaction avec d'autres processeurs.