Thèse soutenue

Construction et exploitation d'un corpus syntaxiquement annoté pour le français

FR
Auteur / Autrice : Lionel Clément
Direction : Anne Abeillé
Type : Thèse de doctorat
Discipline(s) : Lettres, sciences humaines et sociales
Date : Soutenance en 2001
Etablissement(s) : Paris 7

Résumé

FR  |  
EN

Dans ce mémoire, nous avons présenté un corpus annoté syntaxiquement pour le français, pleinement désambigui͏̈sé et validé manuellement. Ce travail est particulièrement centré sur la méthodologie mise en oeuvre lors de l'annotation semi-automatique de corpus et sur la description linguistique. L'annotation comprend l'assignation de traits ou catégories à des unités textuelles, les "mots" dans une première étape, et la représentation des constituances et dépendances articulant des unités syntagmatiques dans une seconde étape. Cette seconde phase de l'annotation de corpus est en cours et soulève encore un certain nombre de problèmes théoriques (comment annoter les dépendances ambigue͏̈s par exemple). L'annotation syntaxique comprend un ensemble de procédures qui ne sont pas sans influence sur la mise en lumière de certains phénomènes linguistiques lors de l'exploitation du corpus. . .