Analyse syntaxique transformationnelle du francais par transducteurs et lexique-grammaire
Auteur / Autrice : | Emmanuel Roche |
Direction : | Maurice Gross |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique fondamentale |
Date : | Soutenance en 1993 |
Etablissement(s) : | Paris 7 |
Mots clés
Mots clés contrôlés
Résumé
A de rares exceptions pres, le cheminement de l'analyse syntaxique automatique suit la creation de modeles de grammaires formelles (gb, hpsg, etc. ) censees refleter les mecanismes internes de la langue. Pour notre part nous avons utilise le formalisme le plus simple et le plus neutre possible, celui des listes, listes que sont les dictionnaires morphologiques et syntaxiques. Ces dictionnaires forment cependant des listes trop importantes pour etre manipulees directement. La notion d'automate, et plus particulierement celle de transducteur, permet de pallier a cet inconvenient en factorisant un tres grand nombre d'informations communes a plusieurs entrees. Nous avons represente par un transducteur un dictionnaire syntaxique de plus de 2000000 d'entrees. Ce dictionnaire, dont la taille est appelee a augmenter tres notablement est appele delsyn, le transducteur qui le representera f-delsyn. Par ailleurs, de telles representations conduisent a des programmes d'analyse extremement simples, l'analyse d'une phrase ph consistant simplement a appliquer la fonction f-delsyn cycliquement a un automate representant ph jusqu'a l'obtention d'un point fixe. L'application cyclique d'une transduction peut en effet effectuer une analyse descendante d'identification de l'element predicatif de la phrase (le verbe en general) puis passer a l'analyse de chacun des arguments de cet element (le sujet et les complements le plus souvent). Mais une transduction peut egalement simuler une analyse de type ascendant qui reconnait des segments de plus en plus grand; enfin nous verrons qu'une transduction peut egalement appliquer des regles de grammaires locales dans une analyse qu'on peut dire transversale par rapport aux deux types precedents