Thèse soutenue

Création d'analyseurs de dépendance par combinaison d'analyseurs synthaxiques

FR
Auteur / Autrice : Francis Brunet-Manquat
Direction : Christian BoitetDamien Genthial
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2004
Etablissement(s) : Grenoble 1

Résumé

FR  |  
EN

L'objectif de cette thèse est de définir et développer des outils génériques permettant de combiner les résultats de différents analyseurs syntaxiques pour produire une analyse de dépendance plus pertinente et plus couvrante que chacune des analyses utilisées. Ces outils sont regroupés dans la plate-forme logicielle DepAn (Dependency Analysis). Après avoir étudié les analyseurs syntaxiques robustes existants et présenté les travaux antérieurs portant sur l'approche par combinaison en analyse syntaxique, nous spécifions le formalisme de dépendance et les différents outils de combinaison supportés par DepAn. La deuxième partie de cette thèse est consacrée à la description du processus permettant de créer, pour chaque analyseur disponible, un "normaliseur" des analyses qu'il produit. Un normaliseur découpe une analyse en un ensemble d'informations linguistiques élémentaires et "projette" ces informations dans un ensemble de structures de dépendance normalisées. Le processus de création d'un normaliseur est fondé sur des techniques de compilation et permet un gain de temps lors de l'ajout d'un analyseur à la plate-forme. La dernière partie de cette thèse présente une nouvelle approche par combinaison, dont l'originalité réside dans l'utilisation de méthodes statistiques et de méthodes de reconstruction. Toutes les analyses d'une phrase sont combinées au sein d'une unique représentation de dépendances. Des évaluations effectuées lors d'un prétraitement servent alors à pondérer les informations contenues dans cette représentation. Enfin, une ou plusieurs nouvelles structures de dépendances sont produites grâce à une des méthodes de reconstruction