Thèse soutenue

Fouille de données provenant des réseaux sociaux pour la détection et la recherche

FR  |  
EN
Auteur / Autrice : Meryem Bendella
Direction : Mohamed Quafafou
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 09/12/2019
Etablissement(s) : Aix-Marseille
Ecole(s) doctorale(s) : Ecole doctorale Mathématiques et Informatique de Marseille (Marseille ; 1994-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d’Informatique et Systèmes (LIS) (Marseille, Toulon)
Jury : Président / Présidente : Léonard Kwuida
Examinateurs / Examinatrices : Nicolas Durand, Philippe Mulhem
Rapporteurs / Rapporteuses : Mohamed Nadif, Anne Laurent

Résumé

FR  |  
EN

L'avènement des réseaux sociaux a suscité un intérêt considérable pour la société au cours de notre décennie. Ces plateformes permettent aux utilisateurs de produire, partager et échanger des contenus divers. Twitter est l'un des réseaux sociaux les plus populaires permettant à ses utilisateurs de publier des messages, appelés tweets. Ces derniers peuvent contenir des textes offensifs, tels que les messages de harcèlement, ou encore des informations liées à des sujets controversés. De nombreux travaux de recherche ont montré comment ces contenus sociaux peuvent avoir une influence sur les utilisateurs. Un système de détection de ce type de messages est nécessaire afin de protéger l'utilisateur et prédire l'apparition des évènements. Dans ce travail de thèse, nous proposons un système de détection de tweets suspects basé sur les modèles thématiques probabilistes et la logique floue. Afin d'identifier les tweets de harcèlement, nous introduisons un modèle de classification exploitant un ensemble de caractéristiques et utilisant des algorithmes d'apprentissage supervisé. Les utilisateurs effectuent également des recherches sur ces plateformes pour trouver des informations qui répondent à un besoin exprimé par une requête. Cependant, les tweets sont courts et l'accès à l'information est parfois difficile. Une partie de nos travaux se situe plus particulièrement dans le contexte de la recherche d'information sociale et vise à améliorer la recherche de tweets. Nous proposons une méthode d'expansion de requêtes, afin de pallier le problème de concision des messages ainsi que des requêtes, basée sur l’extraction des motifs fermés fréquents et utilisant des plongements lexicaux