Thèse soutenue

Modèles neuronaux de recommandation basés sur les folksonomies

FR  |  
EN
Auteur / Autrice : Tahar-Rafik Boudiba
Direction : Mohand BoughanemTaoufiq Dkaki
Type : Thèse de doctorat
Discipline(s) : Image, Information, Hypermédia
Date : Soutenance le 25/11/2022
Etablissement(s) : Toulouse 3
Ecole(s) doctorale(s) : École doctorale Mathématiques, informatique et télécommunications (Toulouse)
Partenaire(s) de recherche : Laboratoire : Institut de Recherche en Informatique de Toulouse (1995-....)
Jury : Président / Présidente : Lynda Tamine-Lechani
Examinateurs / Examinatrices : Mohand Saïd Hacid
Rapporteurs / Rapporteuses : Amel Bouzeghoub, Patrice Bellot

Résumé

FR  |  
EN

Les travaux présentés dans cette thèse s'articulent principalement autour des folksonomies : une structure de données collaborative ayant émergé avec le Web 2.0. Les besoins accrus des services collaboratifs d'indexer de classer et de retrouver l'information sous diverses formes, l'immensité des données engendrées ainsi que l'hétérogénéité des sources de données, ont favorisé l'apparition de processus par lesquels des utilisateurs qualifient des contenus en ligne, notamment, en leur associant des tags (ou descripteurs). De tels processus produisent des données pouvant être modélisées par des hypergraphes en considérant des graphes tripartites représentant les folksonomies et constituant l'ensemble des tags assignés par les utilisateurs à des ressources. Du fait que ces tags soient générés par les utilisateurs, ils forment un nouvel ensemble de données personnelles qui reflètent les intérêts ainsi que les préférences des utilisateurs à l'égard de ressources ou d'items dans le Web. Les tags sont utilisés dans différentes tâches de recherche d'informations, précisément dans le domaine de la recherche d'informations personnalisées et de la recommandation. Pour ce type de tâche, des caractéristiques propres aux usagers sont extraites puis traitées pour enrichir des profils folksonomiques. Ces profils sont construits en exploitant différentes approches : vectorielles, temporelles ou basées sur le clustering. C'est dans ce contexte que nous avons abordé notre première contribution, dans la mesure où nous avons pu mettre en œuvre une méthode non supervisée pour la construction de profils folksonomiques. Nous avons constaté que ces profils que nous avons représentés sous la forme de clusters d'intérêts évolutifs étaient plus aptes à décrire efficacement les utilisateurs et les ressources. Ils ont d'ailleurs été implémentés avec succès dans un processus de recommandation, puis évalués parmi des méthodes de construction de profils vectoriels classiques. Cela nous a aidés à mieux appréhender la nature diverse et évolutive des intérêts de l'utilisateur véhiculés par les annotations sociales. Plus précisément, en exploitant le degré de préférence normalisé de l'utilisateur propagé par les tags. Notre travail s'est ensuite porté sur l'étude des récents travaux en apprentissage de représentations qui exploitent notamment des modèles neuronaux pour enrichir les méthodes de profilage grâce à des représentations continues d'utilisateurs et d'items. En constatant que de tels modèles ont amélioré de manière significative les performances des systèmes de recommandation classique. Cela nous a poussé à envisager d'enrichir ces modèles neuronaux en y associant des représentations d'utilisateurs et d'items intégrant des plongements lexicaux (embeddings en anglais) de tags. Ces embeddings de tags que nous avons extraits à partir de modèles de langues neuronales pré-entraînés nous ont permis de formaliser des modèles de filtrage collaboratif neuronales. C'est dans ce cadre que s'inscrit notre deuxième contribution. Nous avons mis en évidence à l'issue de l'exploitation de ces représentations (embeddings) à travers différentes architectures neuronales, quels étaient les modèles neuronaux permettant l'extraction de caractéristiques plus précises et renseignant sur la sémantique contextuelle des tags. Enfin, l'intégration de ces représentations au sein de ces architectures neuronales, nous a aussi permis d'aborder d'autres problématiques sous-jacentes et qui sont liées notamment au moyen d'inclure efficacement le voisinage des représentations de tags dans un modèle de filtrage collaboratif neuronal pour la recommandation. Dans ce sens, il a été question d'évaluer la précision des prédictions des notes d'utilisateurs à partir d'historique d'activité d'annotation puis de déterminer quels modèles conduisent à de meilleures performances par rapport aux approches neuronales de filtrage collaboratif classiques n'intégrant pas forcément ce type de représentation.