Thèse soutenue

Un système pour la recherche plein texte et la consultation hypertexte de documents techniques
FR
Accès à la thèse
Auteur / Autrice : Quentin Delacroix
Direction : Michel Schneider
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1999
Etablissement(s) : Clermont-Ferrand 2

Résumé

FR

Ce travail est motivé par les difficultés que rencontrent les utilisateurs et producteurs d'informations dans leurs activités au sein de l'entreprise. Une étude réalisée au sein du groupe des labo d'électricité de France a permis de préciser les contraintes liées au traitement des informations et des documents. L'analyse des techniques et outils les plus utilisés pour rechercher et consulter informations et documents montre que les solutions actuelles ne sont pas complètement adaptées aux exigences industrielles. Un modèle des données/informations de l'entreprise qui considère leurs caractéristiques matérielles, organisationnelles et temporelles est présenté. Les fonctionnalités du système que nous proposons pour faciliter l'accès aux informations sont exposées. Le système RECITAL tient compte aussi bien des attentes et besoins des utilisateurs et producteurs d'informations que des préoccupations des administrateurs de systèmes informatiques. RECITAL est basé sur une architecture trois-tiers utilisant les techniques et standards de l'internet/intranet. Le 1er tiers est composé de clients universels (butineurs Web) utilisés par les acteurs de l'entreprise. Le 2d tiers est le système RECITAL lui-même. Il assure la localisation des informations, la conversion éventuelle des documents vers les formats universels (par ex HTML) et l'association des documents en générant automatiquement des liens hypertextes. Le 3e tiers regroupe les systèmes de stockage de l'entreprise. Les composants de cette architecture peuvent être répartis sur les différents sites de l'entreprise. Les principaux processus de RECITAL que sont l'indexation, la recherche plein texte et l'hypertextualisation de documents sont détaillés. Ils s'appuient sur la reconnaissance de chaînes de caractères (pattern matching). Les fonctionnalités essentielles et innovantes du système proposé sont illustées en utilisant une maquette de RECITAL. Ainsi, l'association automatique (linkage) des versions successives d'un même document et le respect des permissions d'accès aux documents lors de la recherche interactive d'informations et de la génération dynamique de liens hypertextes sont montrées