Thèse soutenue

Mesures de similarité syntaxique dans des corpus annotés pour la didactique des langues : application à la grammaire du coréen

FR  |  
EN
Auteur / Autrice : Ilaine Wang
Direction : Sylvain KahaneIsabelle Tellier
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 17/10/2017
Etablissement(s) : Paris 10
Ecole(s) doctorale(s) : École doctorale Connaissance, langage, modélisation (Nanterre)
Partenaire(s) de recherche : Laboratoire : Laboratoire MoDyCo (Nanterre)
Jury : Président / Présidente : Iris Eshkol
Examinateurs / Examinatrices : Sylvain Kahane, Iris Eshkol, Benoît Crabbé, Jin-Ok Kim, Christian Surcouf
Rapporteurs / Rapporteuses : Angela Chambers, Olivier Kraif

Résumé

FR  |  
EN

L'exploration de corpus à travers des requêtes fait aujourd'hui partie de la routine de nombreux chercheurs adoptant une approche empirique de la langue, mais aussi de non-spécialistes qui utilisent des moteurs de recherche ou des concordanciers dans le cadre de l'apprentissage d'une langue. Si les requêtes ainsi basées sur des mots-clés sont communes, les non-spécialistes semblent encore peu enclins à explorer des constructions syntaxiques. En effet, les requêtes syntaxiques requièrent souvent des connaissances spécifiques comme la maîtrise des expressions régulières, le langage de requête de l'outil utilisé, ou même simplement le jeu d'étiquettes morpho-syntaxiques du corpus étudié.Pour permettre aux apprenants de langue de se concentrer sur l'analyse des données langagières plutôt que sur la formulation de requêtes, nous proposons une méthodologie incluant un analyseur syntaxique et utilisant des mesures de similarité classiques pour comparer des séquences d'étiquettes syntaxiques ainsi obtenues de manière automatique.