De la création de documents normalisés à la normalisation de documents en domaine contraint

par Aurélien Max

Thèse de doctorat en Informatique

Sous la direction de Christian Boitet et de Marc Dymetman.

Soutenue en 2003

à l'Université Joseph Fourier (Grenoble) , en partenariat avec Groupe d'étude sur la traduction automatique (Grenoble) (laboratoire) , Xerox Research Centre Europe (Grenoble) (entreprise) et de Institut d'informatique et mathématiques appliquées (Grenoble) (autre partenaire) .

Le président du jury était Catherine Berrut.

Le jury était composé de Hervé Blanchon, Bernard Normier.

Les rapporteurs étaient Philippe Blache, Pierre Zweigenbaum.


  • Résumé

    Les documents en domaine contraint doivent répondre à de nombreuses conditions de bonne formation qui sont souvent difficiles à appliquer. Un courant de recherche actif s’intéresse à la création de documents normalisés par spécification du contenu sémantique, facilitant ainsi de nombreuses applications de ces documents, dont la production multilingue. Néanmoins, les systèmes actuels ne permettent pas l’analyse d’un document existant afin de le normaliser. Dans ce contexte, nous proposons une approche réutilisant les ressources de tels systèmes pour recréer le contenu sémantique d’un document, à partir duquel sa forme textuelle normalisée est ensuite générée. Cette approche s’articule autour de deux paradigmes centraux : la génération inversée floue, qui permet de trouver heuristiquement des représentations sémantiques candidates, et la négociation interactive, qui permet à un expert du domaine de valider progressivement la représentation sémantique correspondant au document originel

  • Titre traduit

    From the authoring of normalized documents to the normalization of documents in constrained domains


  • Résumé

    Well-formedness conditions on documents in constrained domains are often hard to apply. An active research trend approaches the authoring of normalized documents through semantic specification, thereby facilitating such applications as multilingual production. However, the current systems are not able to analyse an existing document in order to normalize it. We therefore propose an approach that reuses the resources of such systems to recreate the semantic content of a document, from which a normalized textual version can be generated. This approach is based on two main paradigms : fuzzy inverted generation, which heuristically finds candidate semantic representations, and interactive negotiation, which allows an expert of the domain to progressively validate the semantic representation that corresponds to the original document

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (XII-203 p.)
  • Annexes : Bibliographie p. 195-203

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Grenoble Alpes (Saint-Martin d'Hères, Isère). Bibliothèque et Appui à la Science Ouverte. Bibliothèque universitaire Joseph-Fourier.
  • Disponible pour le PEB
  • Cote : TS03/GRE1/0227
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.