Détection automatique de l'ironie dans les contenus générés par les utilisateurs
Auteur / Autrice : | Jihen Karoui |
Direction : | Farah Benamara, Véronique Moriceau, Nathalie Aussenac-Gilles, Lamia Hadrich Belguith |
Type : | Thèse de doctorat |
Discipline(s) : | Intelligence artificielle |
Date : | Soutenance le 28/09/2017 |
Etablissement(s) : | Toulouse 3 |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, informatique et télécommunications (Toulouse) |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse a pour objectif la détection du langage figuratif dans les réseaux sociaux. Nous nous focalisons en particulier sur l'ironie et le sarcasme dans Twitter et proposons une approche basée sur l'apprentissage supervisée afin de prédire si le message véhiculé dans un tweet est ironique ou non. Pour ce faire, trois étapes ont été réalisées : (1) Analyse des phénomènes pragmatiques de l'ironie et annotation multi-niveaux d'un corpus de référence, (2) Développement d'un modèle de détection automatique pour les tweets en français qui exploite à la fois des traits sémantiques et le contexte extralinguistique, (3) Etude de la portabilité du modèle pour la détection de l'ironie dans un cadre multilingue (italien, anglais et arabe). Les résultats obtenus pour cette tâche extrêmement complexe sont très encourageants et permettrons d'améliorer sensiblement la détection de polarité lors de l'analyse de sentiments.