Thèse en cours

Analyse linguistique outillée des corpus de tweets politiques : Détection de l'ironie, du sarcasme et du second degré.

FR  |  
EN
Auteur / Autrice : Abdelouafi El otmani
Direction : Julien Longhi
Type : Projet de thèse
Discipline(s) : Sciences du langage
Date : Inscription en doctorat le 01/11/2017
Etablissement(s) : CY Cergy Paris Université
Ecole(s) doctorale(s) : Arts, Humanité, Sciences Sociales
Partenaire(s) de recherche : Laboratoire : AGORA - Laboratoire de recherche civilisation, identités culturelles, textes et francophonies

Résumé

FR  |  
EN

Les travaux existants en analyse des discours numériques, en particulier les tweets, se concentrent en général, et selon les disciplines, sur la constitution de réseaux ou de communautés d'échanges, sur les thèmes ou sujets (topics) abordés, sur la polarité des messages (positifs ou négatifs), ou encore sur les spécificités stylistiques ou discursives liées au médium. Ce projet de thèse souhaite se concentrer sur la tonalité des tweets politiques, notamment au prisme du triptyque sarcasme/ironie/second degré. Il s'agirait alors de mobiliser des connaissances en pragmatique linguistique et en énonciation, pour les rendre opérationnelles dans des systèmes de traitement automatisés. L'analyse outillée des discours articulerait une approche qualitative centrée sur la complexité des phénomènes linguistiques, et quantitative avec la recherche de régularités pouvant être implantées dans des traitements automatiques en les combinant avec des algorithmes issus de l'apprentissage cognitif. Le défi sera de prendre en compte toutes les dimensions d'un message comme la compréhension des hashtags présents, la recontextualisation de sa thématique en lien avec l'actualité, l'analyse du porteur du message, les relations interpersonnes et les interactions du message dans le graphe social. Après avoir fait un état de l'art des nombreux classifieurs et des différents modèles d'apprentissage supervisé, il s'agira de réfléchir sur la notion de méta-apprentissage afin d'avoir une approche réflexive sur les différentes dimensions liées à la détection du sarcasme/ironie/second degré, discipline en sciences informatiques désignée par l'expression « sarcasm mining ».