Thèse soutenue

Transformer les big social data en prévisions - méthodes et technologies : Application à l'analyse de sentiments

FR  |  
EN
Auteur / Autrice : Imane El Alaoui
Direction : Abdessamad KobiAlexis TodoskoffRochdi Messoussi
Type : Thèse de doctorat
Discipline(s) : Sciences et technologie industrielles
Date : Soutenance le 04/07/2018
Etablissement(s) : Angers en cotutelle avec Université Ibn Tofail. Faculté des sciences de Kénitra
Ecole(s) doctorale(s) : Sciences de l'ingénierie et des systèmes (Centrale Nantes)
Partenaire(s) de recherche : Laboratoire : Laboratoire angevins de recherche en ingénierie des systèmes (EA 7315) / LARIS
Jury : Président / Présidente : Raja Touahni
Examinateurs / Examinatrices : Youssef Gahi
Rapporteurs / Rapporteuses : Youssef El Merabet, Fabrice Bouquet

Résumé

FR  |  
EN

Extraire l'opinion publique en analysant les Big Social data a connu un essor considérable en raison de leur nature interactive, en temps réel. En effet, les données issues des réseaux sociaux sont étroitement liées à la vie personnelle que l’on peut utiliser pour accompagner les grands événements en suivant le comportement des personnes. C’est donc dans ce contexte que nous nous intéressons particulièrement aux méthodes d’analyse du Big data. La problématique qui se pose est que ces données sont tellement volumineuses et hétérogènes qu’elles en deviennent difficiles à gérer avec les outils classiques. Pour faire face aux défis du Big data, de nouveaux outils ont émergés. Cependant, il est souvent difficile de choisir la solution adéquate, car la vaste liste des outils disponibles change continuellement. Pour cela, nous avons fourni une étude comparative actualisée des différents outils utilisés pour extraire l'information stratégique du Big Data et les mapper aux différents besoins de traitement.La contribution principale de la thèse de doctorat est de proposer une approche d’analyse générique pour détecter de façon automatique des tendances d’opinion sur des sujets donnés à partir des réseaux sociaux. En effet, étant donné un très petit ensemble de hashtags annotés manuellement, l’approche proposée transfère l'information du sentiment connue des hashtags à des mots individuels. La ressource lexicale qui en résulte est un lexique de polarité à grande échelle dont l'efficacité est mesurée par rapport à différentes tâches de l’analyse de sentiment. La comparaison de notre méthode avec différents paradigmes dans la littérature confirme l'impact bénéfique de notre méthode dans la conception des systèmes d’analyse de sentiments très précis. En effet, notre modèle est capable d'atteindre une précision globale de 90,21%, dépassant largement les modèles de référence actuels sur l'analyse du sentiment des réseaux sociaux.