Thèse soutenue

Le résumé automatique des textes scientifiques et techniques : aspects linguistiques et computationnels : réalisation d'un prototype procédant par extraction de phrases du texte source : le système de Résumé Automatique à Fragments Indicateurs (RAFI)

FR  |  
EN
Auteur / Autrice : Abderrafih Lehmam
Direction : Henri-Claude Grégoire
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance en 1995
Etablissement(s) : Nancy 2

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Le résumé de texte automatique s'inscrit dans le cadre des industries de la langue. Notre travail propose un système qui transforme automatiquement un texte source brut en un texte cible plus réduit. Ce système traite uniquement les textes scientifiques et techniques. Le système est fondé sur la reconnaissance d'éléments phrastiques qui lui permet d'évaluer la pertinence de la phrase en vue d'une éventuelle sélection pour la construction du résumé. La méthode mise en œuvre cherche à donner un score a toutes les phrases du texte et ensuite à procéder à l'élimination de celles ayant obtenu les scores les plus bas et de celles ayant réalisé un score nul. Nous avons fait appel, pour la réalisation du système RAFI (résumé automatique à fragments indicateurs), aux moyens linguistiques d'analyse du discours et aux capacités de calcul des outils informatiques.