Estimation de fréquences fondamentales multiples en vue de la séparation de signaux de parole mélangés dans un même canal
Auteur / Autrice : | François Signol |
Direction : | Jean-Sylvain Liénard |
Type : | Thèse de doctorat |
Discipline(s) : | Physique. Traitement du signal |
Date : | Soutenance en 2009 |
Etablissement(s) : | Paris 11 |
Partenaire(s) de recherche : | Autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne) |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Ce travail de thèse propose un algorithme d’estimation de F0 multiples (AEP) pour la parole surperposée. L’algorithme est conçu pour être utilisé comme une étape bas-niveau d’un système de séparation de parole. L’algorithme proposé est purement trame-à-trame, d’approche fréquentielle et estime les F0 de manière conjointe. Aucune hypothèse n’est faite sur le nombre de sources mélangées. Il s’appuie sur deux familles de peignes spectraux nommées Peignes à Dents Négatives et Peignes à Dents Manquantes. Le produit scalaire entre un spectre d��amplitude et un peigne spectral produit une « fonction de pitch » qui quantifie la force de la structure harmonique d’une fréquence donnée. Les fonctions de pitch contiennent des pics parasites qui peuvent provoquer des erreurs d’estimation de F0. La combinaison des fonctions de pitch individuelles de chaque peigne permet d’atténuer l’amplitude des pics parasites. Cette combinaison est nommée principe de Peigne à Suppression Harmonique. Deux implémentations du principe de Peigne à Suppression Harmonique sont décrites. Elles sont efficaces de F0 monopitch et multipitch (même à l’octave). Une implémentation est évaluée de manière comparative à d’autres algorithmes existant dans les situations monopitch et bipitch. Les performances obtenues sont largement à la hauteur de l’état de l’art (10% d’erreurs grossières en bipitch). Cette évaluation a permis de mettre en évidence l’influence critique de la décision voisé/non-voisé sur les taux d’erreurs. Quatre méthodologies sont proposées dont une originale. Elle consiste à fixer pour tous les AEP évalués le même point de fonctionnement en termes de décision voisé/non-voisé.