Contribution à l'annotation interactive de graphes de connaissances multidimensionnels : une étude de cas sur les données de musique populaire
Auteur / Autrice : | Maroua Tikat |
Direction : | Michel Buffa, Marco Winckler |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 01/10/2020 |
Etablissement(s) : | Université Côte d'Azur |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....) |
Partenaire(s) de recherche : | Laboratoire : I3S - Informatique, Signaux et Systèmes de Sophia-Antipolis |
Mots clés
Mots clés libres
Résumé
Cette thèse concerne la modélisation et l'exploration sémantique de bases de métadonnées musicales. Ce projet de thèse s'appuie sur les résultats obtenus par l'actuel projet ANR WASABI porté par l'équipe WIMMICS commune à l'INRIA et au laboratoire CNRS I3S (UMR 7271), spécialiste du Web social sémantique, proche du W3C (l'organisme qui fait les standards du Web. Les résultats, du projet WASABI seront réutilisés pour créer de nouvelles perspectives d'explorations visuelles d'une base de métadonnées (musicales, culturelles) sur 2 millions de chansons populaires (artiste/album/chansons, typiquement pop/rock/etc.). L'objectif principal de cette thèse est en effet l'étude de stratégies de représentation et de découverte de connaissances appliquées, dans des domaines comme la production de bases de connaissances, avec un focus sur la partie exploratoire des informations, pour des publics tels que DJs, compositeurs, musicologues Nous proposons tout d'abord d'établir une architecture pour la gestion des métadonnées de musique à l'aide des technologies du Web Sémantique. Nous construiront ensuite une ontologie spécialisée et un ensemble de vocabulaires contrôlés pour décrire les différents concepts spécifiques à la musique populaire. Par ailleurs, les contenus musicaux sont de nature complex cars ils portent des dimensions multimédia intégrant des représentation textuelles (ex. titre, paroles), graphiques (ex. courbes sonores), audio (ex. le son produits), ainsi que de métadonnées qualifiant les oeuvres (ex. date d'enregistrement, auteurs, interprètes ) et les usages (ex. reprise, classification pour un usage précis,...). La richesse des bases de métadonnées musicales (en termes de nombre et multiplicité de format d'attributs) pose un défi à l'exploration de l'espace d'information. A ce titre, nous proposons d'utiliser des techniques de visualisation de graphes multidimensionnels pour permettre l'exploration interactive des bases des données musicales. Les visualisations seront construites à partir de la modélisation des données issues de corpus WASABI (qui sera sans doute étendu pendant la durée de la thèse) pour concevoir des mécanismes d'exploration multi-dimensionnels (textuels, graphiques et audio) de ces données. Les enjeux de l'emploi des techniques de visualisation sont, d'une part, permettre de mieux comprendre les relations de causalités, tendances, patrons des concentrations de données; d'autre part, l'aspect visuel des techniques employés, permettra de visualiser la pertinence des relations sémantiques; l'aspect interactif des techniques de visualisation rendra les outils accessibles au public ciblé par le projet (tels que DJs, compositeurs, musicologues,...); et de façon plus globale, cela permettra de mieux communiquer les résultats à un public encore plus large. La visualisation devra intégrer la transformation des données numériques du corpus en données paramétriques musicales (i.e. manipulation de sons). On étudiera les modèles sémantiques pour décrire les différents éléments mis en oeuvre, les différentes manières d'exploiter ces données (pour la recherche, la découverte, l'exploration sonore et visuelle) et on pourra poursuivre les travaux sur les composants musicaux réutilisables abordés dans le cadre du projet ANR WASABI autour des standards WebAudio et WebMidi, notamment le standard WAP (WebAudio Plugins) créé à cette occasion ainsi que la station de travail audionumérique d'assemblage qui les accompagne. Verrous scientifiques : Quels modèles peuvent être appliqués avec succès pour mieux représenter ces données multimédia et textuelles, en particulier dans un but d'exploration/ découverte/ vues synthétiques? Quel sont les besoins et les usages des utilisateurs pour l'exploration d'une base de métadonnées multidimensionnelles sur la musique populaire ? Parmi les utilisateurs, nous nous intéressons particulièrement à des compositeurs, DJs, musicologues et chercheurs en musique/audio, et enseignants de musiques. L'objectif est d'étudier le comportement et les besoin des utilisateurs de façon à pouvoir répondre à leur besoin et rendre les outils (et la base de métadonnées) accessible au plus grand nombre. Comment intégrer de façon ergonomique l'explorations visuelle et sonore des contenus du corpus de la base de métadonnées multidimensionnelles sur la musique populaire ? Les réponses à ces questions ouvrent sur divers sujets de recherche : Comment des algorithmes basés sur les graphes peuvent aider à la mise en oeuvre de systèmes de visualisations multi échelles et multimédia ? Quelles sont les informations non explicites qu'il est possible d'extraire depuis les sources de données dont on dispose ? Outre les métadonnées, la représentation visuelle multi-échelles et multimédia est-elle spécifique au type de musique représentée (la musique populaire pop/rock/etc.)