Vers un système indiquant la distance d'un locuteur par transformation de sa voix

by Thibaut Fux

Doctoral thesis in Signal, image, parole, télécoms

Under the supervision of Gang Feng and Véronique Zimpfer.

Thesis committee President: Pierre-Yves Coulon.

Thesis committee members: Olivier Rosec.

Examiners: Olivier Boëffard, Jean-Sylvain Liénard.

  • Alternative Title

    Speech transformation for distance perception


  • Abstract

    This thesis focuses on speaker voice transformation in the aim to indicate the distance of it: a spokento-whispered voice transformation to indicate a close distance and a spoken-to-shouted voicetransformation for a rather far distance. We perform at first, in-depth analysis to determine mostrelevant features in whispered voices and especially in shouted voices (much harder). The maincontribution of this part is to show the relevance of prosodic parameters in the perception of vocaleffort in a shouted voice. Then, we propose some descriptors to better characterize the prosodiccontours. For the actual transformation, we propose several new transformation rules whichimportantly control the quality of transformed voice. The results showed a very good quality oftransformed whispered voices and transformed shouted voices for relatively simple linguisticstructures (CVC, CVCV, etc.).


  • Abstract

    Cette thèse porte sur la transformation de la voix d’un locuteur dans l’objectif d’indiquer la distance de celui-ci : une transformation en voix chuchotée pour indiquer une distance proche et une transformation en voix criée pour une distance plutôt éloignée. Nous effectuons dans un premier temps des analyses approfondies pour déterminer les paramètres les plus pertinentes dans une voix chuchotée et surtout dans une voix criée (beaucoup plus difficile). La contribution principale de cette partie est de montrer la pertinence des paramètres prosodiques dans la perception de l’effort vocal dans une voix criée. Nous proposons ensuite des descripteurs permettant de mieux caractériser les contours prosodiques. Pour la transformation proprement dite, nous proposons plusieurs nouvelles règles de transformation qui contrôlent de manière primordiale la qualité des voix transformées. Les résultats ont montré une très bonne qualité des voix chuchotées transformées ainsi que pour des voix criées pour des structures linguistiques relativement simples (CVC, CVCV, etc.).


It's available in the institution of thesis defence.

Consult library

Version is available

Informations

  • Details : 1 vol. (358 p.)
  • Annexes : Références p.287-308.

Where is this thesis?

  • Library : GIPSA-lab. Bibliothèque.
  • Available for PEB
  • Odds : 2012 FUX
  • Library : Service Interétablissement de Documentation. LLSH Collections numériques.
  • Library : Université Savoie Mont Blanc (Chambéry-Annecy). Service commun de la documentation et des bibliothèques universitaires. Bibliothèque électronique.
  • Library : Service interétablissements de Documentation. STM. Collections numériques.
See the Sudoc catalog libraries of higher education and research.