Thèse soutenue

Caractérisation des documents sonores : Etude et conception d'un procédé de calcul rapide de signature audio basée sur une perception limitée du contenu

FR  |  
EN
Auteur / Autrice : Lucille Tanquerel
Direction : Anne NicolleLuigi Lancieri
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2008
Etablissement(s) : Caen
Partenaire(s) de recherche : autre partenaire : France Télécom R&D (2001-2007)

Résumé

FR  |  
EN

La description des caractéristiques sonores d'un document est un élément clé pour réaliser des traitements automatiques impliquant des données audio. L'objectif de nos travaux est de décrire une méthode permettant de générer de manière compacte et rapide une signature d'un fichier sonore par l'extraction de caractéristiques physiques réparties sur le fichier (analyse spectrale du signal). L'innovation de notre proposition porte sur l'organisation de l'extraction des échantillons et sur le mode d'analyse pour fournir très rapidement une signature représentative du contenu musical. L'organisation de l'extraction définit la manière dont les échantillons sont prélevés. Notre proposition vise à réaliser un échantillonnage statistique séquentiel minimal réparti sur le fichier sonore. Le principe de cette proposition est basé sur le postulat que la collecte d'une faible quantité d'échantillons de petite durée suffit pour avoir une information résumant de manière efficace le rythme perçu. Notre méthode de validation repose d’une part sur une mesure d’erreur de reconnaissance objective. Nous montrons que la signature permet de comparer les morceaux entre eux et d’identifier fidèlement les morceaux identiques même si ceux-ci ne sont pas complets. Nous montrons également qu'elle peut associer deux moitiés d'un même morceau avec un taux de réussite non négligeable. La validation repose d'autre part sur la comparaison de la signature rythmique avec la perception humaine mais aussi sur la distinction des documents sonores en fonction de la langue parlée. Tous les tests de validation apportent des résultats intéressants compte tenu du temps de calcul.