Le rôle des inférences pour la fouille d'opinion : applications aux réseaux sociaux en langue chinoise
Auteur / Autrice : | Liyun Yan |
Direction : | Mathieu Valette, Cyril Grouin |
Type : | Thèse de doctorat |
Discipline(s) : | Science du langage et langues appliquées : ingéniérie linguistique |
Date : | Soutenance le 05/07/2021 |
Etablissement(s) : | Paris, INALCO |
Ecole(s) doctorale(s) : | École doctorale Langues, littératures et sociétés du monde (Paris) |
Partenaire(s) de recherche : | Laboratoire : Equipe de Recherche Textes, Informatique, Multilinguisme (Paris) |
Jury : | Examinateurs / Examinatrices : Mathieu Valette, Cyril Grouin, Farah Benamara, Dominique Legallois, Yue Ma, Christine Lamarre |
Rapporteurs / Rapporteuses : Farah Benamara, Dominique Legallois |
Mots clés
Résumé
Cette thèse s'intéresse à l'inférence linguistique dans la fouille d'opinion dans un corpus des commentaires touristiques en chinois. Les techniques existantes qui sont bien développées sur des opinions courtes et explicites donnent des résultats limités dans l'interprétation des contextes implicites. De plus, l'expression de l'opinion met en œuvre des stratégies énonciatives différentes suivant les langues et les cultures. Notre hypothèse de travail consiste à étudier les inférences pour améliorer la fouille d'opinion. Dans cette perspective, notre première contribution propose une typologie des inférences pour le chinois en 5 types: logique, pragmatique, lexicale, énonciative et discursive (Rossi et Campion, 1999; Marin, 2004; Duchêne, 2008; Doucy et Massoussi, 2012). Nous avons appliqué cette typologie pour annoter un corpus, dans l'objectif de mener des expériences de fouille d'opinion avec et sans le traitement des inférences. Notre deuxième contribution se focalise sur la classification automatique des inférences en nous basant sur les caractéristiques linguistiques, les métadonnées du domaine et les vecteurs du plongement de mots. L'objectif d'une part est de prouver que le traitement des inférences améliore la performance de la fouille d'opinion et d'autre part de trouver une solution équilibrée entre la classification manuelle couteuse et la classification automatique. Dans ce travail de thèse, nous avons démontré l'intérêt d'étudier les inférences pour réaliser une fouille d'opinion en chinois. Toutefois, l'identification automatique des inférences reste complexe et nécessite une poursuite des travaux de recherche.