Thèse soutenue

Approche générique appliquée à l'indexation audio par modélisation non supervisée
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Houssemeddine Khemiri
Direction : Gérard CholletDijana Petrovska-Delacrétaz
Type : Thèse de doctorat
Discipline(s) : Signal et images
Date : Soutenance le 27/09/2013
Etablissement(s) : Paris, ENST
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche : Laboratoire : Laboratoire Traitement et Communication de l'Information / LTCI
Jury : Président / Présidente : Gaël Richard
Examinateurs / Examinatrices : Gaël Richard, Laurent Besacier, Geoffroy Peeters, Xavier Anguera Miró
Rapporteurs / Rapporteuses : Geneviève Baudoin, Hermann Ney

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

La quantité de données audio disponibles, telles que les enregistrements radio, la musique, les podcasts et les publicités est en augmentation constance. Par contre, il n'y a pas beaucoup d'outils de classification et d'indexation, qui permettent aux utilisateurs de naviguer et retrouver des documents audio. Dans ces systèmes, les données audio sont traitées différemment en fonction des applications. La diversité de ces techniques d'indexation rend inadéquat le traitement simultané de flux audio où différents types de contenu audio coexistent. Dans cette thèse, nous présentons nos travaux sur l'extension de l'approche ALISP, développé initialement pour la parole, comme une méthode générique pour l'indexation et l'identification audio. La particularité des outils ALISP est qu'aucune transcription textuelle ou annotation manuelle est nécessaire lors de l'étape d'apprentissage. Le principe de cet outil est de transformer les données audio en une séquence de symboles. Ces symboles peuvent être utilisés à des fins d'indexation. La principale contribution de cette thèse est l'exploitation de l'approche ALISP comme une méthode générique pour l'indexation audio. Ce système est composé de trois modules: acquisition et modélisation des unités ALISP d'une manière non supervisée, transcription ALISP des données audio et comparaison des symboles ALISP avec la technique BLAST et la distance de Levenshtein. Les évaluations du système proposé pour les différentes applications sont effectuées avec la base de données YACAST et avec d'autres corpus disponibles publiquement pour différentes tâche de l'indexation audio.