Une grammaire lexicalisée d'arbres adjoints pour le français : application à l'analyse automatique

par Anne Abeillé

Thèse de doctorat en Linguistique

Sous la direction de Maurice Gross.

Soutenue en 1991

à Paris 7 .


  • Résumé

    Nous avons travaillé sur un formalisme appelé grammaires d'arbres adjoints (tag) qui appartient a la famille des grammaires d'unification mais avec la particularité d'être basé sur des structures arborescente. L'intérêt théorique est double: d'un point de vue linguistique, les tag élargissent la notion de localité et permettent de redéfinir les interactions multiples entre lexique, syntaxe et sémantique; nous avons ajouté une contrainte de lexicalisation qui les rend a même de formaliser les hypothèses qui sous-tendent les lexiques-grammaires de M. GROSS et peuvent contribuer à les préciser. D'un point de vue informatique, les tags sont un peu plus puissants que les grammaires hors contexte mais gardent des propriétés informatiques intéressantes (temps de traitement, décidabilité). Nous discutons d'abord de la pertinence de l'usage des arbres en linguistique et présentons les structures retenues pour notre grammaire du français. En particulier, nous remettons en cause la notion de groupe verbal. La couverture de la grammaire est suivante: sous-catégorisation, accord, complétives et infinitives, relatives, clivées, extra-position, clitiques, déterminants simples et complexes, circonstanciels simples et complexes, dépendances non bornées, constructions à verbe support et phrases figées. Nous comparons à chaque fois les représentations retenues en tag avec celles utilisées dans d'autres formalismes (gpsg, lfg, grammaires en chaine). Nous présentons enfin la stratégie d'analyse spécifique aux grammaires lexicalisées et l'état actuel de l'implémentation de notre analyseur.

  • Titre traduit

    Lexicalized tree adjoining grammar for french : application to passing


  • Résumé

    This thesis presents the implementation of a french grammar using a formalism called tree adjoining grammar (tag). This formalism belongs to the family of unificationbased formalisms which have proved fruitful for natural language processing. We have added some constraints to the original formalism, especially a "lexicalization" constraint, which captures the philosophy of m. Gross 'lexicon-grammars. We have defined the elementary structures needed for describing a large range of syntactic french phenomena such as : subcategorization, agreement, complement clauses and unbounded dependencies, support verb constructions and idioms, different kind of relative clauses and cleft extractions, passive and extraposition. In particular we challenge the usual notion ov vp constitutants. We have defined the necessary features associated to these structures. We present for each phenomenon a detailed comparison with other formalisms such as gpsg, lfg and string grammars. We then present the parsing strategy suitable for "lexicalized" grammars and the current state of implementation of our french parser. Other applications such as paraphrasing and machine translation are also sketched.

Autre version

Cette thèse a donné lieu à une publication en 2002 par CNRS édition à Paris

Une grammaire électronique du français


Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (389 p.)
  • Notes : Publication autorisée par le jury

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Bibliothèque Diderot LSHS (Lyon).
  • Disponible pour le PEB
  • Bibliothèque : Ecole Polytechnique de l’Université de Tours. Départements Electronique et Energie, Informatique, Mécanique et Systèmes. Centre de documentation.
  • Disponible pour le PEB
  • Cote : DI-TH-221
  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque Universitaire des Grands Moulins.
  • Accessible pour le PEB
  • Bibliothèque : Bibliothèque interuniversitaire de la Sorbonne. Fonds général.
  • Non disponible pour le PEB
  • Cote : TMC 92-543
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : I 4= 15106
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : MSH TH 3896
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.

Consulter en bibliothèque

Cette thèse a donné lieu à une publication en 2002 par CNRS édition à Paris

Informations

  • Sous le titre : Une grammaire électronique du français
  • Dans la collection : Sciences du langage , 0991-5877
  • Détails : 1 vol. (396 p.)
  • ISBN : 2-271-05824-4
  • Annexes : Bibliogr. p. [331]-356. Notes bibliogr.. Index
La version de soutenance de cette thèse existe aussi sous forme papier.

Où se trouve cette thèse\u00a0?