Thèse soutenue

Jusqu'où les goûts musicaux sont-ils prédictibles par l'intelligence artificielle ?

FR  |  
EN
Auteur / Autrice : Nicolas Dauban
Direction : Julien PinquierPascal Gaillard
Type : Thèse de doctorat
Discipline(s) : Informatique et Télécommunications
Date : Soutenance le 06/04/2021
Etablissement(s) : Toulouse 3
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....)

Résumé

FR  |  
EN

Cette thèse a pour objet l'utilisation de l'intelligence artificielle (IA) pour la recommandation de musique en tant que prédiction de goûts. Notre recherche s'est focalisée sur l'étude des goûts musicaux, du fonctionnement de la recommandation de musique et de la place de l'humain dans ce processus. Nous nous sommes intéressés à la pertinence des données utilisées pour la recommandation de musique : les données comportementales d'une part, souvent supposées traduire les affinités des utilisateurs ; les descripteurs des morceaux, utilisés pour la recommandation basée sur le contenu d'autre part. La démarche proposée s'est notamment appuyée sur des travaux en sciences humaines et en musicologie. Les problématiques sont focalisées sur la prédiction des goûts musicaux, dans un domaine où les incertitudes autour de l'explicabilité de ces goûts sont nombreuses : - Quels éléments influencent les goûts musicaux ? Quels sont les liens entre les genres musicaux et les goûts des auditeurs en matière de musique ? - La recommandation de musique est-elle une prédiction de goûts ? Comment les données comportementales sont-elles interprétées par les plateformes de streaming ? Le comportement traduit-il vraiment des goûts musicaux ? - Les paramètres acoustiques appris par un réseau de neurones convolutionnels pour la reconnaissance automatique de genre sont-ils pertinents pour la prédiction de goûts musicaux ? Quels facteurs déterminants dans l'affinité musicale un réseau de neurones convolutionnels est-il capable d'identifier dans un spectrogramme ? Le premier chapitre présente notre étude des goûts musicaux, leurs liens avec les genres et les paramètres contextuels qui peuvent influencer l'écoute de musique. Cette étude met en relation des conclusions issues de notre bibliographie et des données provenant d'une plateforme de streaming. Dans le second chapitre, nous nous sommes intéressés aux données, aux méthodes, et aux modes d'évaluation employées par les plateformes de streaming pour la recommandation. Nous avons également proposé une méthode afin de lier des paramètres acoustiques à une catégorisation humaine, en vue d'une recommandation de musique personnalisée. Le troisième chapitre présente une méthode de prédiction de goûts mise au point en nous appuyant sur les conclusions des chapitres précédents. Cette méthode est basée sur des réseaux de neurones convolutionnels profonds pré-entraînés pour la prédiction de genres. Un processus d'évaluation hors ligne a apporté des résultats satisfaisants (plus de 70% de précision) qui ont été confirmés par une évaluation humaine : 100% de réussite sur un tiers des volontaires, plus de 77% précisions moyenne. Enfin, une étude qualitative des résultats apporte des pistes d'améliorations du système proposé.