Thèse soutenue

Choix d'unités appropriées et introduction de connaissances dans des modèles probabilistes pour la reconnaissance automatique de la parole

FR  |  
EN
Auteur / Autrice : Marc El-Bèze
Direction : Dominique Perrin
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1990
Etablissement(s) : Paris 7

Mots clés

FR

Mots clés contrôlés

Résumé

FR

Dans le premier chapitre, sont exposés les différents critères servant à différencier la dictée automatique de la commande vocale ou de la compréhension de la parole. L'état de l'art est dressé, un grand nombre de systèmes évoqués. Dans le chapitre 2, sont données les raisons de la complexité du traitement automatique de la parole quelle que soit la langue, avant de recenser les difficultés additionnelles lorsque la dictée se fait en français. Le chapitre 3 regroupe des généralités sur la formulation du problème issue de la théorie de l'information, des rappels sur les processus markoviens, une description des systèmes de dictée PARSYFAL et TANGORA développés par IBM. Au chapitre 4, est argumenté l'intérêt de choisir la syllabe comme unité acoustique de base lors de la reconnaissance. Les syllabes phonétiques sont définies structurellement ainsi que par un algorithme de syllabification. Une statistique sur les syllabes du français est établie. Le chapitre 5 explique comment substituer à la modélisation phonétique des syllabes une modélisation par formes fénoniques (chaînes markoviennes dérivées de l'observation). Un algorithme original d'obtention de ces formes est proposé avant de rapporter des expériences de décodage comparant et combinant les deux modélisations. Le chapitre 6 décrit deux approches permettant de réduire au préalable la liste des syllabes candidates. Le chapitre 7 examine quelques points ouvrant la voie au traitement de la parole continue. Le chapitre 8 consacré aux modèles de langage montre comment améliorer la prédiction de chaque mot en enrichissant l'historique d'une dimension morphologique