Thèse soutenue

Estimation conjointe d'information de contenu musical d'un signal audio

FR  |  
EN
Auteur / Autrice : Hélène Papadopoulos
Direction : Xavier Rodet
Type : Thèse de doctorat
Discipline(s) : Informatique, télécommunications et électronique
Date : Soutenance en 2010
Etablissement(s) : Paris 6

Mots clés

FR

Mots clés contrôlés

Résumé

FR

Dans cette thèse, nous nous intéressons au problème de l'extraction automatique d'information de contenu d'un signal audio de musique. L'originalité de notre travail est que nous proposons un modèle qui permet d'estimer de manière conjointe plusieurs attributs musicaux (accords, premiers temps et tonalité). Nous examinons plusieurs représentations typiques du signal audio afin de choisir celle qui est la plus appropriée à l'analyse de son contenu harmonique. En utilisant les chromas comme observations du signal, nous proposons d’abord plusieurs méthodes basées sur les modèles de Markov cachés (hidden Markov models, HMM) pour estimer la suite des accords. Elles permettent de prendre en compte des éléments de théorie musicale, le résultat d'expériences cognitives sur la perception de la tonalité et l'effet des harmoniques des notes de musique. Nous présentons alors une nouvelle approche qui permet d'estimer de manière simultanée la progression des accords et les premiers temps. Nous proposons une topologie spécifique de HMM qui nous permet de modéliser la dépendance des accords par rapport à la structure métrique d'un morceau. Notre modèle peut être utilisé pour des structures métriques complexes. Nous nous penchons enfin sur le problème de l’estimation de la tonalité principale ainsi que celui plus complexe de l'estimation de la tonalité locale. La spécificité de notre approche est que nous considérons la dépendance de la tonalité par rapport aux structures harmonique et métrique. Nous montrons que l'estimation des divers éléments musicaux est meilleure si on tient compte de leurs dépendances mutuelles que si on les estime de manière indépendante.