Systeme de conversion de voix pour la synthese de parole
Auteur / Autrice : | Hélène Valbret |
Direction : | Jean-Pierre Tubach |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences appliquées. Signal et images |
Date : | Soutenance en 1992 |
Etablissement(s) : | Paris, ENST |
Mots clés
Mots clés contrôlés
Résumé
Nous presentons dans cet article une nouvelle technique de transformation de timbre de la voix. Cette technique s'articule autour d'un synthetiseur derive de l'approche psola (pitch-synchronous, overlap and add) et d'un module de transformation des parametres spectraux. Le synthetiseur allie decomposition source-filtre et modification prosodique du signal d'excitation par application de td-psola (time domain psola). Deux approches de transformation spectrale, derivees de techniques d'adaptation et de normalisation en reconnaissance de parole, sont comparees: la regression lineaire multiple (lmr) et l'alignement dynamique en frequence (dfw). Une etape preliminaire de quantification vectorielle permet de rendre ces transformations dependantes des realisations acoustiques des sons. Un test d'ecoute formel montre que le synthetiseur permet d'obtenir une voix transformee d'un naturel satisfaisant, dont le timbre est proche de la voix cible. Dans l'etat actuel, la lmr donne des resultats plus probants que la dfw