Segmentation automatique d'unites acoustiques pour la synthese de la parole
Auteur / Autrice : | OLIVIER BOEFFARD DOSIERRE |
Direction : | Bernard Delyon |
Type : | Thèse de doctorat |
Discipline(s) : | Traitement du signal et télécommunications |
Date : | Soutenance en 1993 |
Etablissement(s) : | Rennes 1 |
Résumé
Pour fabriquer une voix synthetique, il faut enregistrer des unites acoustiques puis les segmenter en phonemes. La presente etude a pour objectif l'automatisation de cette tache de segmentation, en utilisant des modeles de markov. Chaque phoneme d'une unite est modelise par un hmm (hidden markov model). Deux phases essentielles sont necessaires: d'abord une phase d'initialisation des parametres pour chaque modele puis une phase de segmentation par un alignement contraint. Des algorithmes de controle de la qualite de la segmentation, utilisant essentiellement des criteres de duree, assurent la detection des erreurs grossieres d'alignement; d'autres methodes de segmentation sont ensuite appliquees pour corriger ou affiner la segmentation d'unites acoustiques delicates. L'evaluation du systeme a porte sur la segmentation de 8000 unites enregistrees dans trois langues, francais, espagnol et allemand. 85% des transitions recherchees sont considerees correctement assignees et les auditeurs n'ont pas de preference dans l'ecoute comparee de stimuli de synthese acquis automatiquement ou manuellement. Les resultats montrent egalement une grande robustesse et une qualite satisfaisante du processus complet de fabrication automatique de nouveaux repertoires d'unites acoustiques pour la synthese de la parole