Thèse soutenue

Un modèle de reformulation automatique fondé sur la théorie sens-texte : application aux langues contrôlées

FR  |  
EN
Auteur / Autrice : Alexis Nasr
Direction : Laurence Danlos
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1996
Etablissement(s) : Paris 7

Mots clés

FR

Mots clés contrôlés

Résumé

FR

La thèse propose un modèle de reformulation automatique de phrases basé sur la théorie linguistique sens-texte. Le modèle est appliqué au domaine des langues contrôlées, nées dans le milieu documentaire industriel et qui imposent, à certains types de textes techniques, des contraintes diverses parmi lesquelles des contraintes lexicales et syntaxiques. L'objectif du modèle est de détecter au sein d'une phrase des constructions lexico-syntaxiques non conformes à la langue contrôlée pour en proposer des reformulations. Le modèle proposé repose sur la théorie sens-texte, qui accorde une place importante à la paraphrase. L'idée principale de la thèse est d'utiliser les capacités paraphrastiques de la théorie pour réaliser la reformulation. Celle-ci repose sur l'identification, dans la grammaire et dans le lexique, des structures autorisées et des structures interdites. La reformulation, elle-même, consiste à remplacer, dans la représentation syntaxique d'une phrase, les structures interdites par des structures autorisées paraphrastiques grâce au système de paraphrase. Le travail effectué porte principalement sur l'intégration de la théorie sens-texte dans un cadre de reformulation automatique. Une telle intégration nécessite une réorganisaion des connaissances au sein de la théorie dans le double but de proposer un moyen de représentation des structures lexico-syntaxiques interdites et autorisées, tout en optimisant le traitement automatique. Le modèle proposé comporte trois phases principales, une phase d'analyse à l'issue de laquelle une représentation syntaxique profonde de la phrase à reformuler est construite. Cette dernière sera modifiée lors de la phase de transformation par application de règles de paraphrases afin d'éliminer certaines constructions interdites. La dernière phase, dite de régénération, constiste à synthétiser une nouvelle phrase en s'assurant de ne pas réintroduire de structures interdites