De la création de documents normalisés à la normalisation de documents en domaine contraint
Auteur / Autrice : | Aurélien Max |
Direction : | Christian Boitet, Marc Dymetman |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2003 |
Etablissement(s) : | Université Joseph Fourier (Grenoble ; 1971-2015) |
Partenaire(s) de recherche : | Laboratoire : Groupe d'étude sur la traduction automatique (Grenoble) - Institut d'informatique et mathématiques appliquées (Grenoble ; 1989-2006) |
Entreprise : Xerox Research Centre Europe (Grenoble1993-2017) | |
Jury : | Président / Présidente : Catherine Berrut |
Examinateurs / Examinatrices : Hervé Blanchon, Bernard Normier | |
Rapporteur / Rapporteuse : Philippe Blache, Pierre Zweigenbaum |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Les documents en domaine contraint doivent répondre à de nombreuses conditions de bonne formation qui sont souvent difficiles à appliquer. Un courant de recherche actif s’intéresse à la création de documents normalisés par spécification du contenu sémantique, facilitant ainsi de nombreuses applications de ces documents, dont la production multilingue. Néanmoins, les systèmes actuels ne permettent pas l’analyse d’un document existant afin de le normaliser. Dans ce contexte, nous proposons une approche réutilisant les ressources de tels systèmes pour recréer le contenu sémantique d’un document, à partir duquel sa forme textuelle normalisée est ensuite générée. Cette approche s’articule autour de deux paradigmes centraux : la génération inversée floue, qui permet de trouver heuristiquement des représentations sémantiques candidates, et la négociation interactive, qui permet à un expert du domaine de valider progressivement la représentation sémantique correspondant au document originel