Fouille de données provenant des réseaux sociaux pour la détection et la recherche

Meryem Bendella

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Fouille de données provenant des réseaux sociaux pour la détection et la recherche

FR |

EN

Auteur / Autrice :	Meryem Bendella
Direction :	Mohamed Quafafou
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 09/12/2019
Etablissement(s) :	Aix-Marseille
Ecole(s) doctorale(s) :	École doctorale Mathématiques et Informatique de Marseille (Marseille ; 1994-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d’Informatique et Systèmes (Marseille ; La Garde, Var ; 2018-….)
Jury :	Président / Présidente : Léonard Kwuida
	Examinateurs / Examinatrices : Nicolas Durand, Philippe Mulhem
	Rapporteurs / Rapporteuses : Mohamed Nadif, Anne Laurent

Mots clés

FR |

EN

Mots clés contrôlés

Bases de données -- Interrogation

Moteurs de recherche

Analyse informatique

Réseaux sociaux

Mots clés libres

Réseaux sociaux

Twitter

Fouille de données

Recherche d’information sociale

Modèles thématiques probabilistes

Logique floue

Classification

Expansion de requêtes

Motifs fermés fréquents

Plongements lexicaux

Résumé

FR |

EN

L'avènement des réseaux sociaux a suscité un intérêt considérable pour la société au cours de notre décennie. Ces plateformes permettent aux utilisateurs de produire, partager et échanger des contenus divers. Twitter est l'un des réseaux sociaux les plus populaires permettant à ses utilisateurs de publier des messages, appelés tweets. Ces derniers peuvent contenir des textes offensifs, tels que les messages de harcèlement, ou encore des informations liées à des sujets controversés. De nombreux travaux de recherche ont montré comment ces contenus sociaux peuvent avoir une influence sur les utilisateurs. Un système de détection de ce type de messages est nécessaire afin de protéger l'utilisateur et prédire l'apparition des évènements. Dans ce travail de thèse, nous proposons un système de détection de tweets suspects basé sur les modèles thématiques probabilistes et la logique floue. Afin d'identifier les tweets de harcèlement, nous introduisons un modèle de classification exploitant un ensemble de caractéristiques et utilisant des algorithmes d'apprentissage supervisé. Les utilisateurs effectuent également des recherches sur ces plateformes pour trouver des informations qui répondent à un besoin exprimé par une requête. Cependant, les tweets sont courts et l'accès à l'information est parfois difficile. Une partie de nos travaux se situe plus particulièrement dans le contexte de la recherche d'information sociale et vise à améliorer la recherche de tweets. Nous proposons une méthode d'expansion de requêtes, afin de pallier le problème de concision des messages ainsi que des requêtes, basée sur l’extraction des motifs fermés fréquents et utilisant des plongements lexicaux

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Fouille de données provenant des réseaux sociaux pour la détection et la recherche

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Fouille de données provenant des réseaux sociaux pour la détection et la recherche

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses