Synchronisation des connaissances syntaxiques et sémantiques pour l'analyse d'énoncés en langage naturel à l'aide des grammaires d'arbres adjoints lexicalisés
Auteur / Autrice : | Djamé Seddah |
Direction : | Jean-Marie Pierrel |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2004 |
Etablissement(s) : | Nancy 1 |
Partenaire(s) de recherche : | Autre partenaire : Université Henri Poincaré Nancy 1. Faculté des sciences et techniques |
Mots clés
Résumé
Une interface entre la syntaxe et la sémantique vise à proposer une formalisation logique des relations entre les segments d'un énoncé. Dans cette thèse, nous proposons une approche basée sur l'analyse de phénomènes linguistiques problématiques dans le paradigme des grammaires d'arbres adjoints lexicalisées (TAG). Les TAG sont un formalisme linguistique proposant deux structures de représentations (arbre dérivé et arbre de dérivation) dont l'une est une structure quasi idéale pour servir de canevas à une analyse sémantique. Or cette structure, l'arbre de dérivation, ne peut représenter de façon autonome des co-indiciations. A partir de l'analyse des phénomènes induits par les verbes à contrôle, nous proposons une solution algorithmique basée sur le parcours synchrone de l'arbre dérivé et de l'arbre de dérivation (via une forêt partagée) afin d'inférer les liens argument aux témoignant d'une co-indiciation. Nous avons ajouté au formalisme initial une information lexicale (le canevas de contrôle) permettant une formalisation complète de ces phénomènes. Nous proposons un algorithme de reconstruction dynamique reposant sur des règles d'inférences exécutées lors de l'extraction des arbres de dérivation de la forêt partagée. Utilisant des techniques tabulaires, nous pouvons extraire d'une seule forêt partagée toutes les analyses qu'elle décrit au sein d'un graphe de dépendance.