Mesures de similarité syntaxique dans des corpus annotés pour la didactique des langues : application à la grammaire du coréen
Auteur / Autrice : | Ilaine Wang |
Direction : | Sylvain Kahane, Isabelle Tellier |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences du langage |
Date : | Soutenance le 17/10/2017 |
Etablissement(s) : | Paris 10 |
Ecole(s) doctorale(s) : | École doctorale Connaissance, langage, modélisation (Nanterre) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire MoDyCo (Nanterre) |
Jury : | Président / Présidente : Iris Eshkol |
Examinateurs / Examinatrices : Sylvain Kahane, Iris Eshkol, Benoît Crabbé, Jin-Ok Kim, Christian Surcouf | |
Rapporteurs / Rapporteuses : Angela Chambers, Olivier Kraif |
Mots clés
Résumé
L'exploration de corpus à travers des requêtes fait aujourd'hui partie de la routine de nombreux chercheurs adoptant une approche empirique de la langue, mais aussi de non-spécialistes qui utilisent des moteurs de recherche ou des concordanciers dans le cadre de l'apprentissage d'une langue. Si les requêtes ainsi basées sur des mots-clés sont communes, les non-spécialistes semblent encore peu enclins à explorer des constructions syntaxiques. En effet, les requêtes syntaxiques requièrent souvent des connaissances spécifiques comme la maîtrise des expressions régulières, le langage de requête de l'outil utilisé, ou même simplement le jeu d'étiquettes morpho-syntaxiques du corpus étudié.Pour permettre aux apprenants de langue de se concentrer sur l'analyse des données langagières plutôt que sur la formulation de requêtes, nous proposons une méthodologie incluant un analyseur syntaxique et utilisant des mesures de similarité classiques pour comparer des séquences d'étiquettes syntaxiques ainsi obtenues de manière automatique.