Thèse soutenue

Détection des influenceurs dans des médias sociaux

FR  |  
EN
Auteur / Autrice : Kévin Deturck
Direction : Frédérique Segond
Type : Thèse de doctorat
Discipline(s) : Traitement automatique des langues
Date : Soutenance le 18/11/2021
Etablissement(s) : Paris, INALCO
Ecole(s) doctorale(s) : École doctorale Langues, littératures et sociétés du monde (Paris)
Partenaire(s) de recherche : Laboratoire : Equipe de Recherche Textes, Informatique, Multilinguisme (Paris)
Jury : Examinateurs / Examinatrices : Frédérique Segond, Claudine Moïse, Patrick Paroubek, Pascal Amsili, Mathieu Valette, Damien Nouvel
Rapporteurs / Rapporteuses : Claudine Moïse, Patrick Paroubek

Résumé

FR  |  
EN

Dans cette thèse, nous présentons la conception et l’évaluation d’un système pour détecter automatiquement les personnes influentes dans les médias sociaux, à partir des manifestations de leur action d’influence dans les communications interpersonnelles. Les approches pour la détection des influenceurs utilisent généralement, soit la structure de la communication entre les individus, soit l’analyse de son contenu. Le cadre théorique retenu dans notre thèse a la particularité de combiner ces deux types d’approches pour leur complémentarité. Nous caractérisons l’action des influenceurs à l’échelle d’un individu cible, depuis sa mise en œuvre jusqu’à ses effets, par des traits discursifs relevant aussi bien des messages envoyés par les influenceurs que de ceux envoyés par les individus influencés. La détection automatique de ces traits discursifs est faite avec des méthodes en traitement automatique des langues, basées sur des règles linguistiques et des modèles par apprentissage automatique. À l’échelle d’un groupe, l’action des influenceurs est caractérisée par leur position centrale dans un graphe social qui représente des actions interpersonnelles ayant eu cours à l’intérieur de ce groupe. L’hybridité de notre système consiste en l’utilisation des informations linguistiques sur les traits discursifs d’influence, extraits automatiquement depuis les messages textuels échangés entre individus, afin de construire les graphes sociaux.