Thèse soutenue

Systeme de conversion de voix pour la synthese de parole

FR  |  
EN
Auteur / Autrice : Hélène Valbret
Direction : Jean-Pierre Tubach
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées. Signal et images
Date : Soutenance en 1992
Etablissement(s) : Paris, ENST

Mots clés

FR

Mots clés contrôlés

Résumé

FR

Nous presentons dans cet article une nouvelle technique de transformation de timbre de la voix. Cette technique s'articule autour d'un synthetiseur derive de l'approche psola (pitch-synchronous, overlap and add) et d'un module de transformation des parametres spectraux. Le synthetiseur allie decomposition source-filtre et modification prosodique du signal d'excitation par application de td-psola (time domain psola). Deux approches de transformation spectrale, derivees de techniques d'adaptation et de normalisation en reconnaissance de parole, sont comparees: la regression lineaire multiple (lmr) et l'alignement dynamique en frequence (dfw). Une etape preliminaire de quantification vectorielle permet de rendre ces transformations dependantes des realisations acoustiques des sons. Un test d'ecoute formel montre que le synthetiseur permet d'obtenir une voix transformee d'un naturel satisfaisant, dont le timbre est proche de la voix cible. Dans l'etat actuel, la lmr donne des resultats plus probants que la dfw