Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2014

Buisness Intelligence contribution : DOWSER, Discovering of Web Sources Evaluating Relevance

Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel

Résumé

The constant growth of the Web in recent years has made more difficult the discovery of new sources of information on a given topic. This is a prominent problem for Expert in Intelligence Analysis (EIA) who are faced with the search of pages on specific and sensitive topics. Because of their lack of popularity or because they are poorly indexed due to their sensitive content, these pages are hard to find with traditional search engine. In this article, we describe a new Web source discovery system called DOWSER. The goal of this system is to provide users with new sources of information related to their needs without considering the popularity of a page unlike classic Information Retrieval tools. The expected result is a balance between relevance and originality, in the sense that the wanted pages are not necessary popular. DOWSER in based on a user profile to focus its exploration of the Web in order to collect and index only related Web documents.
L'augmentation constante du volume d'information disponible sur le Web a rendu compliquée la découverte de nouvelles sources d'intérêt sur un sujet donné. Les experts du renseignement doivent faire face à cette problématique lorsqu'ils recherchent des pages sur des sujets spécifiques et sensibles. Ces pages non populaires sont souvent mal indexées ou non indexées par les moteurs de recherche à cause de leur contenu délicat, les rendant difficile à trouver. Nos travaux, qui s'inscrivent dans ce contenu du Renseignement d'Origine Source Ouverte (ROSO), visent à aider l'expert du renseignement dans sa tâche de découverte de nouvelles sources. Notre approche s'articule autour de la modélisation du besoin opérationnel et de l'exploration ciblée du Web. La modélisation du besoin informationnel permet de guider l'exploration du web pour découvrir et fournir des sources pertinentes à l'expert.
Fichier principal
Vignette du fichier
2014ISAM0011.pdf (4.84 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-01127081 , version 1 (06-03-2015)

Identifiants

  • HAL Id : tel-01127081 , version 1

Citer

Romain Noël. Contribution à la veille stratégique : DOWSER, un système de découverte de sources Web d’intérêt opérationnel. Recherche d'information [cs.IR]. INSA de Rouen, 2014. Français. ⟨NNT : 2014ISAM0011⟩. ⟨tel-01127081⟩
597 Consultations
645 Téléchargements

Partager

Gmail Facebook X LinkedIn More