Etude des désintégrations B eta-cK avec le détecteur BABAR
Auteur / Autrice : | Mélanie Langer |
Direction : | Georges London |
Type : | Thèse de doctorat |
Discipline(s) : | Physique |
Date : | Soutenance en 2003 |
Etablissement(s) : | Paris 11 |
Mots clés
Mots clés libres
Résumé
Le principe des systèmes de synthèse de la parole actuels est de sélectionner, dans une importante base de données de parole lue, des unités acoustiques de taille variable, et de les concaténer pour reconstruire un signal de parole le plus naturel possible. Cette sélection est réalisée en minimisant deux fonctions de coûts: le coût de cibles et le coût de concaténation. Le premier établi une distance entre la phrase cible (texte d'entrée) et ce qui est disponible dans la base, le second quantifie la qualité de la jonction entre deux unités étudiées. À l'aide de ces deux fonctions, toutes les combinaisons possibles sont parcourues, puis la meilleure est sélectionnée. Notre approche est de calculer chacune des fonctions selon différents critères de hauts niveaux. Le système est donc facilement adaptable à tous types de voix car peu dépendant de leurs caractéristiques physiques. Le système développé dans le cadre de cette thèse peut aussi être utilisé comme module de prédiction de la prosodie. Sans analyse syntaxique et sans règles, il est possible de calculer les valeurs de F0 et de durée à partir de la base de données. La partie segmentale de la synthèse est alors prise en charge par un synthétiseur acoustique à partir de diphones (MBROLA). Une évaluation montre que les résultats ainsi obtenus sont comparables avec la prosodie calculée à partir de règles. Pour finir, nous avons analysé les différences entre les voix de synthèse et leurs versions originales (naturelle). Cette étude a été réalisée pour 20 locuteurs (10 hommes et 10 femmes). Elle met en avant la difficulté de déterminer des paramètres mesurables permettant de prédire si une voix est appropriée à la synthèse. Ainsi, la qualité d'une voix de synthèse dépend pour beaucoup de la régularité de la prosodie et du timbre de la voix.