Système de recommandation équitable d'oeuvres numériques. En quête de diversité

par Pierre-René Lherisson

Thèse de doctorat en Informatique

Sous la direction de Pierre Maret.

Soutenue le 20-06-2018

à Lyon , dans le cadre de École doctorale Sciences Ingénierie Santé (Saint-Etienne) , en partenariat avec Université Jean Monnet (Saint-Étienne) (Etablissement opérateur d'inscription) et de Laboratoire Hubert Curien (Saint-Etienne) (laboratoire) .

Le président du jury était Laurent Pottier.

Le jury était composé de Fabrice Muhlenbach, Elsa Negre.

Les rapporteurs étaient Francis Rousseaux, Julien Velcin.


  • Résumé

    Les systèmes de recommandation jouent un rôle important dans l'orientation des choix des utilisateurs. La recommandation se fait généralement par une optimisation d'une mesure de précision de l'adéquation entre un utilisateur et un produit. Cependant, plusieurs travaux de recherche ont montré que l’optimisation de la précision ne produisait pas les recommandations les plus utiles pour les utilisateurs. Un système trop précis peut contribuer à confiner les utilisateurs dans leur propre bulle de choix. Ceci peut aussi produire un effet de foule qui va concentrer les usages autour de quelques articles populaires. Par conséquent, il y a un manque de diversité et de nouveauté dans les recommandations et une couverture limitée du catalogue. Par ailleurs, l’utilisateur peut ressentir de la frustration envers ces recommandations monotones et arrêter de se fier au système. Ce type de recommandation va à l’antithèse de l’esprit humain qui peut être friand de nouveauté et de diversité. Même si la routine peut être sécurisante, l’être humain aime sortir des sentiers battus pour, par exemple, découvrir de nouveaux produits, tenter de nouvelles expériences. Cette absence de découverte est préjudiciable pour une plateforme numérique, surtout si cette dernière veut être équitable dans ses recommandations envers tous les producteurs de contenu (par exemple, les artistes, les écrivains, les développeurs de jeux vidéos, les vidéastes). Dans cette thèse, nous présentons deux familles de modèles qui cherchent à produire des résultats qui vont au-delà des aspects de précision pour des systèmes de recommandation pour des produits culturels basés sur le contenu. Les deux modèles que nous présentons reposent sur l’étude du profil de l’utilisateur avant de lui proposer des listes de recommandations contenant des articles nouveaux et divers. Ces approches captent la diversité qu’il y a dans le profil de l’utilisateur et répondent à cette diversité en cherchant à créer une liste diversifiée de recommandations sans trop pénaliser la précision. Le premier modèle repose principalement sur une approche de clustering. Dans ce modèle, nous proposons de la diversité à l’utilisateur tout en restant dans le périmètre de ses goûts. Le second modèle est basé sur une fonction issue de la loi normale. Nous faisons l’hypothèse de l’existence d’une zone intermédiaire définie entre des éléments considérés comme trop similaires et d’autres considérés comme trop différents. Cette zone intermédiaire est une zone propice à la découverte et à l’exploration de genres et d’expériences nouveaux. Nos propositions sont testées sur des jeux de données standards et comparées à des algorithmes de l’état de l’art. Les résultats de nos expériences montrent que nos approches apportent de la diversité et de la nouveauté et sont compétitives par rapport aux méthodes de l’état de l’art. Nous proposons également une expérience utilisateur pour valider notre modèle basé sur la fonction issue de la loi normale. Les résultats des expériences centrées sur l’utilisateur montrent que ce modèle correspond au comportement cognitif de l’être humain ainsi qu’à sa perception de la diversité.

  • Titre traduit

    Fair recommender system for cultural content In search of discovery


  • Résumé

    Recommender systems play a leading role in user’s choice guidance. The search of accuracy in such systems is generally done through an optimization of a function between the items and the users. It has been proved that maximizing only the accuracy does not produce the most useful recommendation for the users. This can confine individuals inside the bubble of their own choices. Additionally, it tends to emphasize the agglomaration of the users’ behavior on few popular items. Thus, it produces a lack of diversity and novelty in recommendations and a limited coverage of the platform catalog. This can lead to an absence of discovery. Monotony and frustration are also induced for the users. This non-discovery is even more crucial if the platform wants to be fair in its recommendations with all contents’ producers (e.g, music artists, writers, video game developers or videographers). The non diversity, and novelty problem is more important for the users because it has been shown that human mind appreciates when moved outside of its comfort zone. For example, the discovery of new artists, the discovery of music genres for which he is not accustomed. In this thesis we present two families of model that aim to go beyond accuracy in content based recommender system scenario. Our two models are based on a user profile understanding prior to bring diversification. They capture the diversity in the user profile and respond to thisdiversity by looking to create a diverse list of recommendation without loosing to much accuracy. The first model is mainly built upon a clustering approach, while the second model is based on an wavelet function. This wavelet function in our model helps us delimit an area where the user will find item slightly different from what he liked in the past. This model is based on the assumption of the existence of a defined intermediate area between similar and different items. This area is also suitable for discovery. Our proposals are tested on a common experimental design that consider well-known datasets and state-of-the-art algorithm. The results of our experiments show that our approaches indeed bring diversity and novelty and are also competitive against state-of-the-art method. We also propose a user-experiment to validate our model based on the wavelet. The results of user centered experiments conclude that this model corresponds with human cognitive and perceptual behavior.


Il est disponible au sein de la bibliothèque de l'établissement de soutenance.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Jean Monnet. Service commun de la documentation. Bibliothèque électronique.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.