Thèse soutenue

Approches multimodales d'apprentissage automatique pour la détection des rumeurs dans les microblogs

FR  |  
EN
Auteur / Autrice : Abderrazek Azri
Direction : Jérôme Darmont
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 07/07/2022
Etablissement(s) : Lyon
Ecole(s) doctorale(s) : École doctorale en Informatique et Mathématiques de Lyon (2009-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : Université Lumière (Lyon ; 1969-....)
Laboratoire : Entrepôts, Représentation et Ingénierie des Connaissances
Jury : Président / Présidente : Christophe Gravier
Examinateurs / Examinatrices : Guillaume Cabanac, Nouria Harbi, Cécile Favre
Rapporteurs / Rapporteuses : Pascale Kuntz-Cosperec, Cédric Wemmert

Résumé

FR  |  
EN

La nature ubiquitaire et la popularité des plateformes de médias sociaux entraînent la génération d’une grande quantité de données multimédia. L’ouverture et la facilité de partage sur ces plateformes favorisent la diffusion de l’information sans nécessairement tenir compte de sa véracité. Sans moyen de vérification et d’analyse du contenu échangé, les rumeurs peuvent affecter sérieusement la crédibilité de ces plateformes et engendrer des conséquences désastreuses dans la vie réelle. L’objectif de cette thèse est de proposer des solutions au problème de la classification automatique de la véracité des rumeurs dans les sites de microblogging. En se basant sur le contenu riche et de nature diverse fourni par ces plateformes nous considérons plusieurs caractéristiques des messages, notamment le texte, le contexte social, les sentiments et les images pour analyser leur véracité.Nous proposons un cadre pour la fusion multimodale de caractéristiques qui s’appuie sur plusieurs modèles d’apprentissage automatique pour l’évaluation de la véracité des messages, ainsi que son implémentation dans le framework MONITOR (Multimodal Fusion Framework to Assess Message Veracity in Social Networks). L’originalité de ce travail réside notamment dans le recours à des indicateurs de qualité d’image comme caractéristiques des images pour qu’ils soient utilisés dans un contexte de détection de rumeurs.Afin d’améliorer les performances de MONITOR, nous exploitons également l’apprentissage ensembliste, un paradigme très peu exploré dans le domaine de la classification des rumeurs. Nous proposons plusieurs algorithmes de meta-learning en utilisant les modèles individuels de MONITOR comme modèles de base. Toujours avec l’idée d’améliorer la performance de la classification des rumeurs, nous proposons un modèle multimodal appelé deepMONITOR, basé sur les réseaux de neurones profonds, qui se révèlent capables d’apprendre efficacement des représentations de textes et d’images. L’apport de ce travail concerne particulièrement l’intégration des images et de l’analyse de sentiments dans l’apprentissage multimodal. Enfin, pour répondre au problème du peu de jeux de données disponibles pour la détection multimodale des rumeurs, nous avons construit DAT@Z21, un jeu de données multimédia volumineux issues de Twitter, avec un étiquetage qui s’appuie sur une vérité terrain collectée à partir d’un site de fact checking. Ce jeu de données est partagé en respectant la réglementation en vigueur. Les expériences que nous avons menées à l’aide de divers jeux de données, dont DAT@Z21, démontrent la pertinence de nos propositions. En effet, MONITOR et deepMONITOR réalisent les meilleures performances en les comparant avec les méthodes récentes de l’état de l’art.