L'analyse de corpus et la génération automatique de texte : méthodes et usages
Auteur / Autrice : | Stéphanie Pouchot |
Direction : | Jacques Rouault |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences de l'information et de la communication |
Date : | Soutenance en 2003 |
Etablissement(s) : | Université Stendhal (Grenoble ; 1970-2015) |
Mots clés
Résumé
La communication entre une machine et un individu peut prendre différentes formes (icônes, sons, textes. . . ). Le but de la génération automatique de textes est la production informatisée de messages en langue naturelle destinés à des lecteurs humains. Le résultat doit être compréhensible, adapté et, idéalement, se rapprocher des productions humaines. Cette thèse présente un travail de recherche consacré à l'amélioration des performances d'un processus de génération automatique du français écrit. Basée sur l'étude d'un ensemble de textes réels, cette recherche a consisté en l'identification et l'étude de caractéristiques propres à la langue naturelle (mise en forme, vocabulaire. . . ) à re-produire de manière automatique. Nous présentons ces critères, la manière dont ils sont compatibles entre eux et nous proposons une nouvelle architecture pour le système de génération permettant de les intégrer au processus.