Construction et exploitation d'un corpus syntaxiquement annoté pour le français
Auteur / Autrice : | Lionel Clément |
Direction : | Anne Abeillé |
Type : | Thèse de doctorat |
Discipline(s) : | Lettres, sciences humaines et sociales |
Date : | Soutenance en 2001 |
Etablissement(s) : | Paris 7 |
Mots clés
Résumé
Dans ce mémoire, nous avons présenté un corpus annoté syntaxiquement pour le français, pleinement désambigui͏̈sé et validé manuellement. Ce travail est particulièrement centré sur la méthodologie mise en oeuvre lors de l'annotation semi-automatique de corpus et sur la description linguistique. L'annotation comprend l'assignation de traits ou catégories à des unités textuelles, les ''mots'' dans une première étape, et la représentation des constituances et dépendances articulant des unités syntagmatiques dans une seconde étape. Cette seconde phase de l'annotation de corpus est en cours et soulève encore un certain nombre de problèmes théoriques (comment annoter les dépendances ambigue͏̈s par exemple). L'annotation syntaxique comprend un ensemble de procédures qui ne sont pas sans influence sur la mise en lumière de certains phénomènes linguistiques lors de l'exploitation du corpus. . .