Méthodes baysiennes variationnelles pour l'indexation de fichiers audio
Auteur / Autrice : | Fabio Valente |
Direction : | Christian Wellekens |
Type : | Thèse de doctorat |
Discipline(s) : | Automatique, traitement du signal et des images |
Date : | Soutenance en 2005 |
Etablissement(s) : | Nice |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....) |
Mots clés
Mots clés contrôlés
Résumé
Dans cette thèse, nous considérons un nouveau type de méthodes approximatives appelées Apprentissage Variationnel (connu aussi comme Apprentissage d'ensemble) qui offre une solution sous forme explicite mais approximative du problème de l'intégration des paramètres. La clé des méthodes variationnelles est le remplacement des distributions réelles mais inconnues des paramètres par des distributions approximées (distributions variationnelles) qui permettent de traiter la solution analytiquement. Evidemment l'efficacité de cette approche dépend de la qualité de ces distributions approximées. Nous étudions l'usage des techniques variationnelles dans une application d'indexation audio où la sélection des modèles est le problème principal. Le problème de l'indexation audio consiste à regrouper les parties d'un enregistrement possédant des caractéristiques semblables. En particulier, nous considérons ici le cas où les données provenant d'un même locuteur doivent être regroupées. Le problème de la sélection du modèle est central dans de telles applications car le nombre de groupes (locuteurs) n'est généralement pas connu a priori et doit être estimée à partir des données. L'approche la plus courante de ce problème utilise une approximation très grossière de l'intégrale bayesienne pour la sélection du modèle qui n'est valable qu'asymptotiquement.