Contribution à l'annotation interactive de graphes de connaissances multidimensionnels : une étude de cas sur les données de musique populaire
Auteur / Autrice : | Maroua Tikat |
Direction : | Michel Buffa, Marco Antonio Alba Winckler |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 18/09/2024 |
Etablissement(s) : | Université Côte d'Azur |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Informatique, signaux et systèmes (Sophia Antipolis, Alpes-Maritimes) - Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) |
Jury : | Président / Présidente : Catherine Faron |
Examinateurs / Examinatrices : Michel Buffa, Marco Antonio Alba Winckler, Catherine Faron, Célia Martinie De Almeida, George Fazekas, Kathia Marçal de Oliveira, Benjamin Matuszewski | |
Rapporteurs / Rapporteuses : Célia Martinie De Almeida, George Fazekas |
Mots clés
Résumé
Cette thèse se concentre sur l'exploration de grands ensembles de données musicales, telles que le one million song dataset ou le WASABI dataset qui offrent un riche ensemble de métadonnées concernant les chansons populaires enregistrées de 1950 à ces dernières années. Ces datasets sont représentés par des graphes de grande taille et peuvent servir à un large éventail d'applications, telles que le journalisme de données, la recherche musicologique, les systèmes de recommandation pour les services de diffusion de musique en continu et l'analyse des œuvres musicales. Toutefois, la navigation et le traitement des vastes quantités d'informations contenues dans ces graphes peuvent s'avérer complexes. Cette thèse présente une approche centrée sur l'utilisateur qui propose l'annotation interactive de graphes de connaissances, avec une application sur le graphe de connaissances musicales WASABI. La méthode présentée permet aux utilisateurs d'ajouter des annotations tout en explorant le dataset par le biais d'un site web, ainsi que par le biais de certaines techniques de visualisation. Les utilisateurs peuvent utiliser les annotations pour documenter les problèmes de qualité de données, poser des questions et commenter les données présentées. Les annotations peuvent également être utilisées pour fournir un contexte et aider à enrichir le dataset en reliant les entités présentes dans les données textuelles à des éléments externes. Cette approche a abouti au développement de quatre outils : le premier a été conçu pour annoter les pages web du site d'exploration du dataset WASABI, le second pour annoter les données du dataset présentées à l'aide de techniques de visualisation, le troisième est une extension de navigateur permettant d'annoter des sites web en dehors de WASABI, et le dernier est un outil permettant de visualiser et d'analyser les contributions/annotations des utilisateurs afin d'assurer leur interprétabilité avec différents niveaux d'analyse. Le processus de développement a été guidé par la méthodologie Action Design Research (ADR). Enfin, la thèse montre que l'approche et les outils utilisés ont été pensés pour être applicables à d'autres datasets que le dataset WASABI, grâce à leur conception générique.