Un modèle de reformulation automatique fondé sur la théorie sens-texte : application aux langues contrôlées

par Alexis Nasr

Thèse de doctorat en Informatique

Sous la direction de Laurence Danlos.

Soutenue en 1996

à Paris 7 .


  • Résumé

    La thèse propose un modèle de reformulation automatique de phrases basé sur la théorie linguistique sens-texte. Le modèle est appliqué au domaine des langues contrôlées, nées dans le milieu documentaire industriel et qui imposent, à certains types de textes techniques, des contraintes diverses parmi lesquelles des contraintes lexicales et syntaxiques. L'objectif du modèle est de détecter au sein d'une phrase des constructions lexico-syntaxiques non conformes à la langue contrôlée pour en proposer des reformulations. Le modèle proposé repose sur la théorie sens-texte, qui accorde une place importante à la paraphrase. L'idée principale de la thèse est d'utiliser les capacités paraphrastiques de la théorie pour réaliser la reformulation. Celle-ci repose sur l'identification, dans la grammaire et dans le lexique, des structures autorisées et des structures interdites. La reformulation, elle-même, consiste à remplacer, dans la représentation syntaxique d'une phrase, les structures interdites par des structures autorisées paraphrastiques grâce au système de paraphrase. Le travail effectué porte principalement sur l'intégration de la théorie sens-texte dans un cadre de reformulation automatique. Une telle intégration nécessite une réorganisaion des connaissances au sein de la théorie dans le double but de proposer un moyen de représentation des structures lexico-syntaxiques interdites et autorisées, tout en optimisant le traitement automatique. Le modèle proposé comporte trois phases principales, une phase d'analyse à l'issue de laquelle une représentation syntaxique profonde de la phrase à reformuler est construite. Cette dernière sera modifiée lors de la phase de transformation par application de règles de paraphrases afin d'éliminer certaines constructions interdites. La dernière phase, dite de régénération, constiste à synthétiser une nouvelle phrase en s'assurant de ne pas réintroduire de structures interdites

  • Titre traduit

    An Automatic reformulation system based on the meaning-text theory : application to controlled languages


  • Pas de résumé disponible.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 277 p.
  • Annexes : 117 réf.

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris-Est Marne-la-Vallée. Bibliothèque.
  • Consultable sur place dans l'établissement demandeur
  • Cote : 1996 NAS
  • Bibliothèque : Université Paris Diderot - Paris 7. Service commun de la documentation. Bibliothèque Universitaire des Grands Moulins.
  • Accessible pour le PEB
  • Cote : TS1996
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.