Thèse soutenue

Principes de conception de systèmes hypertextes pour la fouille de données bibliographiques multibases
FR
Accès à la thèse
Auteur / Autrice : Emmanuel Nauer
Direction : Amedeo Napoli
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2001
Etablissement(s) : Nancy 1
Ecole(s) doctorale(s) : École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine
Partenaire(s) de recherche : Laboratoire : Laboratoire lorrain de recherche en informatique et ses applications

Résumé

FR  |  
EN

Le besoin en information est primordial pour la recherche et la veille scientifiques et techniques. L'importante quantité de données disponibles actuellement sur un domaine d'activité nécessite de mettre en oeuvre des moyens adaptés pour exploiter ces données. Le but de ce travail de recherche est de fournir un environnement pour exploiter les données d'un domaine (références bibliographiques et Web) pour des besoins de recherches bibliographiques ou d'analyses de domaines. Dans ce cadre une approche générale pour construire un système hypertexte de fouille de données bibliographiques est proposé. L'hypertexte favorise l'accès exploratoire des données. Des fonctionnalités de fouille (dénombrements, classifications, extractions de règles) sont déclenchées à la demande pour analyser plus précisément les données. L'idée principale de cette thèse est que la fouille de données et la recherche d'information sont deux approches complémentaires pour appréhender des données : la fouille de données permet de guider la recherche d'information à partir des connaissances extraites des données. Inversement, la recherche d'information permet de guider la fouille de données par l'exploitation des connaissances issues de la fouille. La fouille de données favorise également l'accès à l'information sur le Web. Concrètement, les connaissances extraites des données bibliographiques fournissent une aide à la formulation de requêtes et permettent d'améliorer la précision des réponses obtenues lors de l'interrogation de moteurs de recherche. La mise en place d'un tel système nécessite d'exploiter les travaux de recherche en fouille de données, recherche d'information et bases de données. D'un point de vue technique, les outils de ces différents domaines sont combinés grâce à une approche modulaire exploitant XML pour la représentation et l'échange des données manipulées, et un traitement par flux de données.