Regards croisés sur les avis en ligne : approches du TAL et de la linguistique de corpus
Auteur / Autrice : | Hyun Jung Kang |
Direction : | Iris Eshkol |
Type : | Thèse de doctorat |
Discipline(s) : | Traitement automatique des langues |
Date : | Soutenance le 28/01/2021 |
Etablissement(s) : | Paris 10 |
Ecole(s) doctorale(s) : | École doctorale Connaissance, langage, modélisation (Nanterre, Hauts-de-Seine ; 1992-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire MoDyCo (Nanterre) |
Jury : | Président / Présidente : Dominique Legallois |
Examinateurs / Examinatrices : Iris Eshkol, Dominique Legallois, Farah Benamara, Caroline Brun, Guillaume Desagulier, Jean-Luc Minel | |
Rapporteurs / Rapporteuses : Farah Benamara |
Résumé
Cette thèse vise à étudier des évaluations de restaurants rédigées par des clients en ligne. Elle s’inscrit dans le domaine du traitement automatique des langues (TAL) et relève de la fouille d’opinions, devenue essentielle dans de nombreux champs d’application tels que la veille d’opinions et l’analyse de tendances ou de marchés. Les évaluations diffusées en ligne occupent ainsi une place importante dans l’ère numérique. L’étude réalisée permet de montrer les raisons qui poussent les clients à laisser leurs avis, d’analyser les moyens linguistiques qu’ils utilisent pour exprimer et partager leurs expériences, ainsi que de relever les caractéristiques propres aux évaluations rédigées en ligne. Pour atteindre cet objectif, le corpus est étudié en exploitant les méthodes de linguistique outillée et du TAL. La détection automatique d’informations contenues dans l’évaluation est réalisée. La généralisabilité du modèle développé est testée ensuite sur d’autres données : un corpus relevant du domaine de l’hôtellerie et un corpus écrit dans une autre langue – le coréen.