Thèse soutenue

Élaboration d'un thésaurus pour l'indexation thématique d'oeuvres littéraires

FR  |  
EN
Auteur / Autrice : Michel Bernard
Direction : Henri Béhar
Type : Thèse de doctorat
Discipline(s) : Littérature française
Date : Soutenance en 1992
Etablissement(s) : Paris 3

Résumé

FR  |  
EN

Cette thèse retrace les étapes de l'élaboration d'un thesaurus de termes littéraires destine a indexer les œuvres de la littérature de langue française répertoriées dans la banque de données d'histoire littéraire, développée a l'université de paris iii-la Sorbonne nouvelle. Il s'agit de rendre compte du contenu des textes littéraires du domaine francophone, en utilisant la terminologie en usage. Un thesaurus, conforme a la norme documentaire, permet de structurer le vocabulaire en descripteurs et non descripteurs. Une première version a été utilisée pour faire indexer 1500 œuvres par des étudiants. Les résultats de cette première phase ont permis d'améliorer le thesaurus, la liste des thèmes et sa structure. Il se présente actuellement sous la forme d'un réseau sémantique non hiérarchisé. Par ailleurs, des essais d'indexation automatique ont permis d'établir qu'une indexation thématique assistée par ordinateur s'appuyant sur des résumés était envisageable. Des études statistiques préfigurent ce que pourraient être les études littéraires permises par une base de données thématiques : analyse des corrélations de la thématique avec les mouvements, les époques, les genres. . .