Thèse soutenue

Analyse syntaxique transformationnelle du francais par transducteurs et lexique-grammaire

FR  |  
EN
Auteur / Autrice : Emmanuel Roche
Direction : Maurice Gross
Type : Thèse de doctorat
Discipline(s) : Informatique fondamentale
Date : Soutenance en 1993
Etablissement(s) : Paris 7

Mots clés

FR

Mots clés contrôlés

Résumé

FR

A de rares exceptions pres, le cheminement de l'analyse syntaxique automatique suit la creation de modeles de grammaires formelles (gb, hpsg, etc. ) censees refleter les mecanismes internes de la langue. Pour notre part nous avons utilise le formalisme le plus simple et le plus neutre possible, celui des listes, listes que sont les dictionnaires morphologiques et syntaxiques. Ces dictionnaires forment cependant des listes trop importantes pour etre manipulees directement. La notion d'automate, et plus particulierement celle de transducteur, permet de pallier a cet inconvenient en factorisant un tres grand nombre d'informations communes a plusieurs entrees. Nous avons represente par un transducteur un dictionnaire syntaxique de plus de 2000000 d'entrees. Ce dictionnaire, dont la taille est appelee a augmenter tres notablement est appele delsyn, le transducteur qui le representera f-delsyn. Par ailleurs, de telles representations conduisent a des programmes d'analyse extremement simples, l'analyse d'une phrase ph consistant simplement a appliquer la fonction f-delsyn cycliquement a un automate representant ph jusqu'a l'obtention d'un point fixe. L'application cyclique d'une transduction peut en effet effectuer une analyse descendante d'identification de l'element predicatif de la phrase (le verbe en general) puis passer a l'analyse de chacun des arguments de cet element (le sujet et les complements le plus souvent). Mais une transduction peut egalement simuler une analyse de type ascendant qui reconnait des segments de plus en plus grand; enfin nous verrons qu'une transduction peut egalement appliquer des regles de grammaires locales dans une analyse qu'on peut dire transversale par rapport aux deux types precedents