Analyse automatique des émotions dans les textes : contributions théoriques et applicatives dans le cadre de l'étude de la complexité des textes pour enfants
Auteur / Autrice : | Aline Etienne |
Direction : | Delphine Battistelli |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences du langage : traitement automatique des langues |
Date : | Soutenance le 21/06/2023 |
Etablissement(s) : | Paris 10 |
Ecole(s) doctorale(s) : | École doctorale Connaissance, langage, modélisation (Nanterre, Hauts-de-Seine ; 1992-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire MoDyCo (Nanterre) |
Jury : | Président / Présidente : Sophie Rosset |
Examinateurs / Examinatrices : Delphine Battistelli, Sophie Rosset, Nùria Gala, Dominique Legallois, Nathalie Blanc, Anne Lacheret-Dujour, Gwénolé Lecorvé, Iva Novakova | |
Rapporteur / Rapporteuse : Nùria Gala, Dominique Legallois |
Mots clés
Résumé
Notamment de par la diversité des moyens linguistiques employés pour les dénoter, les émotions exprimées dans un texte constituent un objet difficile à circonscrire. Leur étude, abordée ici dans le contexte de l'analyse de la complexité linguistique de textes jeunesse, pose alors de nombreux défis en linguistique comme en traitement automatique des langues (TAL). Cette thèse vise à déterminer comment explorer la dimension émotionnelle d’un texte de sorte à opérer une analyse qui rende compte de la diversité des marqueurs linguistiques des émotions (c’est-à-dire ne se limitant pas au lexique émotionnel) ; qui soit automatisable ; et qui puisse contribuer à mettre au jour des éléments de complexité des textes. L’objectif est donc de proposer des outils théoriques opératoires pour l’analyse linguistique des émotions, mobilisables pour évaluer le caractère plus ou moins accessible – c’est-à-dire compréhensible – d’un texte pour un enfant. La méthodologie mise en œuvre pour cela repose sur la définition d'un schéma d'annotation des émotions, intégrant des notions pertinentes à la fois sur le plan linguistique, TAL et psycholinguistique pour caractériser la notion d'émotion. Son application manuelle sur un corpus de plus de 1 500 textes a permis l'élaboration d'un corpus annoté en émotions, à partir duquel un outil d'analyse automatique des émotions dans les textes a été développé grâce aux techniques d'apprentissage automatique profond (modèle transformeur CamemBERT). Ce corpus annoté a aussi donné lieu à de nombreuses observations linguistiques aidant à mieux cerner le fonctionnement de l’expression des émotions.