Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle
Auteur / Autrice : | Julien Pinquier |
Direction : | Régine André-Obrecht |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2004 |
Etablissement(s) : | Toulouse 3 |
Résumé
Le développement croissant des données numériques est confronté au manque d'outils automatiques efficaces. Dans ce cadre, plusieurs approches relatives à la structuration de la bande sonore sont proposées. Leurs buts sont de détecter les composantes primaires : la parole, la musique et les sons clés. Pour la classification parole/musique, 3 paramètres inhabituels sont extraits : la modulation de l'entropie, la durée des segments (issue d'une segmentation automatique) et le nombre de ces segments par seconde. Les informations issues de ces 3 paramètres sont fusionnées avec celle issue de la modulation de l'énergie à 4 hertz. Des expériences sur un corpus radiophonique montrent la robustesse de ces paramètres. Le système est comparé et fusionné à un système classique. Un autre partitionnement détecte des sons clés. La sélection de candidats est effectuée en comparant la '' signature '' de chacun des jingles au flux de données. Ce système est simple par sa mise en œuvre, rapide et efficace. Les applaudissements et les rires sont modélisés à l'aide de MMG dans le domaine spectral. Un corpus télévisuel valide cette étude par des résultats encourageants. La détection de mots clés est effectuée de manière classique : il ne s'agit pas ici d'améliorer les systèmes existants mais de se placer toujours dans un besoin de structuration : ces mots clés renseignent sur le type des émissions. Au travers de 2 études, une réflexion est conduite quant à l'utilisation de ces composantes afin de trouver une structure temporelle aux documents. La première étude permet une détection d'un motif récurrent dans une collection d'émissions, alors que la seconde réalise la structuration en thèmes d'un journal télévisé. Quelques pistes de réflexions sur l'apport de l'analyse vidéo sont développées.