Thèse soutenue

De la création de documents normalisés à la normalisation de documents en domaine contraint

FR  |  
EN
Auteur / Autrice : Aurélien Max
Direction : Christian BoitetMarc Dymetman
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2003
Etablissement(s) : Université Joseph Fourier (Grenoble ; 1971-2015)
Partenaire(s) de recherche : Laboratoire : Groupe d'étude sur la traduction automatique (Grenoble) - Institut d'informatique et mathématiques appliquées (Grenoble ; 1989-2006)
Entreprise : Xerox Research Centre Europe (Grenoble)
Jury : Président / Présidente : Catherine Berrut
Examinateurs / Examinatrices : Hervé Blanchon, Bernard Normier
Rapporteurs / Rapporteuses : Philippe Blache, Pierre Zweigenbaum

Résumé

FR  |  
EN

Les documents en domaine contraint doivent répondre à de nombreuses conditions de bonne formation qui sont souvent difficiles à appliquer. Un courant de recherche actif s’intéresse à la création de documents normalisés par spécification du contenu sémantique, facilitant ainsi de nombreuses applications de ces documents, dont la production multilingue. Néanmoins, les systèmes actuels ne permettent pas l’analyse d’un document existant afin de le normaliser. Dans ce contexte, nous proposons une approche réutilisant les ressources de tels systèmes pour recréer le contenu sémantique d’un document, à partir duquel sa forme textuelle normalisée est ensuite générée. Cette approche s’articule autour de deux paradigmes centraux : la génération inversée floue, qui permet de trouver heuristiquement des représentations sémantiques candidates, et la négociation interactive, qui permet à un expert du domaine de valider progressivement la représentation sémantique correspondant au document originel