Thèse soutenue

Analyse du sentiment dans les médias sociaux

FR  |  
EN
Auteur / Autrice : Hussam Hamdan
Direction : Patrice BellotFrédéric Béchet
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 01/12/2015
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : Ecole Doctorale Mathématiques et Informatique de Marseille (Marseille)
Jury : Président / Présidente : Béatrice Daille
Rapporteurs / Rapporteuses : Patrick Paroubek, Julien Velcin

Résumé

FR  |  
EN

Dans cette thèse, nous abordons le problème de l'analyse des sentiments. Plus précisément, nous sommes intéressés à analyser le sentiment exprimé dans les textes de médias sociaux.Nous allons nous concentrer sur deux tâches principales: la détection de polarité de sentiment dans laquelle nous cherchons à déterminer la polarité (positive, négative ou neutre) d'un texte donné et l'extraction de cibles d’opinion et le sentiment exprimé vers ces cibles (par exemple, pour le restaurant nous allons extraire des cibles comme la nourriture, pizza, service). Notre principal objectif est de construire des systèmes à la pointe de la technologie qui pourrait faire les deux tâches. Par conséquent, nous avons proposé des systèmes supervisés différents suivants trois axes de recherche: l'amélioration de la performance du système par la pondération de termes, en enrichissant de la représentation de documents et en proposant un nouveau modèle pour la classification de sentiment.Pour l'évaluation, nous avons participé à un atelier international sur l'évaluation sémantique (Sem Eval), nous avons choisi deux tâches: l'analyse du sentiment sur Twitter dans laquelle nous déterminer la polarité d'un tweet et l'analyse des sentiments basée sur l’aspect dans laquelle nous extrayons les cibles d'opinion dans les critiques de restaurants, puis nous déterminons la polarité de chaque cible, nos systèmes ont été classés parmi les premiers trois meilleurs systèmes dans toutes les sous-tâches. Nous avons également appliqué nos systèmes sur un corpus des critiques de livres français construit par l'équipe Open Edition pour extraire les cibles d'opinion et leurs polarités.