Thèse soutenue

Méthodes d'amélioration de la pertinence des réponses dans un système de bases de données textuelles

FR  |  
EN
Auteur / Autrice : Hary Pierre Radasoa
Direction : Christian Fluhr
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1988
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Résumé

FR

Lors d'une recherche documentaire, la question que l'utilisateur pose, est exprimée à l'aide de mots qui peuvent être différents de ceux contenus dans les documents mais relatant les mêmes notions. Cela est un problème général de la paraphrase. La reformulation est une solution à ce problème. Le rôle de la reformulation est de trouver un chemin pour apparier les notions (mots, groupes de mots, expressions, phrases,. . . ) contenues dans les documents et dans la question. La reformulation consiste à localiser ces notions et à amplifier la reconnaissance de leur proximité sémantique, donc celle de la proximité sémantique entre les documents et la question. Le but est de diminuer le "silence" qui correspond à la non- proposition de documents pertinents. Cependant, la reformulation ne doit pas engendrer du "bruit" qui correspond à la proposition de documents non pertinents. La diminution du silence et du bruit permet d'augmenter la précision des réponses. Les différentes méthodes de reformulation pour améliorer la pertinence des réponses lors de la recherche documentaire, exposées dans ce travail, sont : - la normalisation ; - les mots de la même famille ; - le thésaurus ; - le correcteur de fautes d'orthographe ; - l'explicitation ; - l'apprentissage de règles de reformulation ; -et l'interrogation par partie de document. Parmi ces méthodes, la normalisation et l'explicitation sont présentées en s'appuyant sur des travaux antérieurs ; les mots de la même famille, le correcteur de fautes d'orthographe et l'interrogation par partie de document sont améliorés ; le thésaurus et l'apprentissage de règles de reformulation sont étudiés. Chaque méthode de reformulation exploite des règles de reformulation. Ces règles de reformulation sont caractérisées par un type de relation évaluant la proximité sémantique entre les mots mis en relation. Ces règles sont facilement modifiables. Le système de recherche documentaire SPIRIT qui comporte un traitement linguistique et un traitement statistique, a été utilisé pour la validation de nos expérimentations sur la reformulation. Des modifications ont été apportées au niveau du module de comparaison afin de pouvoir prendre en compte la reformulation. Un système expert est proposé pour piloter la reformulation. Les bases de connaissances sont constituées par des groupes de règles correspondant aux différentes méthodes de reformulation. Le mécanisme d'inférence est régi par des métarègles contrôlant chaque processus de reformulation ainsi que l'enchaînement de tous les processus de reformulation.