Thèse soutenue

Methodes pour une generation variable de resume automatique : vers un systeme de reduction de texte

FR  |  
EN
Auteur / Autrice : Nicolas Masson
Direction : Gérard Sabah
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1998
Etablissement(s) : Paris 11

Résumé

FR

Notre but est de developper des methodes qui permettent de resumer automatiquement des textes de vulgarisation scientifique traitant de n'importe quel domaine. Cette contrainte d'independance du domaine nous a conduit a concevoir un systeme travaillant sans connaissance sur le domaine. Notre approche porte sur la recherche, l'analyse et la formalisation des phenomenes de surface du texte qui permettent d'en construire une representation a partir de laquelle on pourra engendrer des resumes par extraction de phrases dans le texte source. Les analyses de surface mises en uvre ont pour but de repondre aux caracteristiques qu'un resume requiert. Une premiere analyse permet de degager les grands developpements thematiques du texte ainsi que les relations d'inclusion qu'ils entretiennent. La methode est fondee sur une analyse statistique de la distribution des termes du texte inspiree des techniques de recherche d'informations. Elle permet le reglage de la concision et de la coherence des extraits produits. Une deuxieme analyse permet de determiner les liens logiques et rhetoriques qui existent entre les differentes phrases du texte source en vue de controler la cohesion des resumes produits. Enfin, une troisieme analyse est dediee a la determination des differents contenus vehicules par les differentes phrases du textes source. Elle autorise la modulation des contenus informationnels et du type de resume engendre dans le but d'assurer l'adaptation a l'utilisateur.