Thèse soutenue

Évaluation de la réputation des produits sur le Web

FR  |  
EN
Auteur / Autrice : Umar Farooq
Direction : Yacine Ouzrout
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 20/01/2017
Etablissement(s) : Lyon
Ecole(s) doctorale(s) : École doctorale InfoMaths (Lyon ; 2009-....)
Partenaire(s) de recherche : Equipe de recherche : DISP - Décision et Information pour les Systèmes de Production (Lyon, INSA)
établissement opérateur d'inscriptions : Université Lumière (Lyon ; 1969-....)
Jury : Président / Présidente : Nadège Troussier
Examinateurs / Examinatrices : Sergio Terzi
Rapporteur / Rapporteuse : Sebti Foufou, Ahmed Lbath

Résumé

FR  |  
EN

Internet est une immense source de données non structurées dont l'extraction et l'analyse devient un enjeu majeur. Ces informations peuvent être plus qu'utiles à des consommateurs et des fabricants dans leur processus de prise de décision quant à un produit. Dans ce contexte, l'exploitation de telles information se révèle être une tâche très difficile. De nombreuses méthodes d'évaluation de produits existent à l'heure actuelle, utilisant principalement les notes et les commentaires disponibles sur Internet. Cependant, ces méthodes rencontrent vite des limites et ne sont donc pas en mesure de répondre aux besoins et aux exigences des clients ou des fabricants. Par exemple, les méthodes existantes d'analyse de sentiments, qui classent les opinions des clients sur un produit à l’aide de leur polarité, ne sont pas en mesure de déterminer le contexte du mot dans une phrase avec précision, ce qui biaise fortement leurs résultats. De plus, les méthodes de traitement des négations utilisées, qui déterminent les sentiments exprimées par les clients dans leur commentaires, ne sont pas en mesure de traiter tous les types de négation, ne considèrent pas non plus toutes les exceptions où les négations se comportent différemment. De même, les modèles existants d'estimation de réputation de produits sont basés sur une source unique, et donc peu robuste aux fausses évaluations ou aux évaluations biaisées, ne sont pas en mesure de refléter les opinions récentes. Ils ne permettent pas aux utilisateurs d'évaluer le produit au regard de critères spécifiques, et ainsi ne fournissent pas une estimation précise. D'autre part, les systèmes de réputation évaluant des produits fonctionnent de manière centralisée, entraînant des problèmes de robustesse et des facilités de manipulation, voire de falsification, d'informations, ces approches ne convenant pas à résoudre un problème aussi complexe. Cette thèse propose des modèles et des méthodes d'évaluation de la réputation dédiées aux produits, fonctionnant à partir des données disponibles sur Internet, et visant à fournir des informations précises aux consommateurs et aux fabricants, les appuyant dans leur prise de décision. Ces méthodes concernent i) l'extraction des données d'évaluation des produits à partir de plusieurs sources; ii) une analyse sémantique des évaluations des clients pour déterminer si les opinions exprimées sur chacune des caractéristiques d'un produit sont positives ou négatives; iii) le calcul des différentes valeurs de réputation d'un produit, tout en considérant différents critères d'évaluation, et iv) enfin, le retour des résultats aux consommateurs ou aux fabricants afin de les aider dans leur prise de décisions. Cette thèse contribue à trois principaux domaines de recherche à savoir i) l'analyse des sentiments exprimées quant aux caractéristiques d'un produit, comprenant une méthode de désambiguïsation du sens des mots ainsi qu'une prise en compte plus fine des négations pour améliorer la performance de l'analyse de sentiments selon différents niveaux; ii) les modèles d'évaluation de la réputation d'un produit, basé sur un modèlemathématique calculant plusieurs valeurs de réputation pour une évaluation d'un produit selon différents critères et enfin iii) une architecture multi-agents robuste, facilitant le déploiement et la parallélisation des tâches. Sur Internet, la plupart des opinions sur des produits sont de nature textuelle, comme par exemple les avis des consommateurs. Afin d'analyser de tels commentaires, une méthode d'analyse de sentiments exprimés ciblant spécifiquement les caractéristiques d'un produit a été développée. Une méthode de désambiguïsation identifiant le sens des mots selon leur contexte tout en déterminant leur polarité a enrichi le processus, qui fût complété par une méthode d'analyse fine des négations, déterminant les séquences de mots affectées par chaque type de négation.....