Thèse soutenue

Reformulation sémantique des requêtes pour la recherche d’information ad hoc sur le Web

FR  |  
EN
Auteur / Autrice : Bissan Audeh
Direction : Olivier Boissier
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 09/09/2014
Etablissement(s) : Saint-Etienne, EMSE
Ecole(s) doctorale(s) : ED SIS 488
Partenaire(s) de recherche : Laboratoire : Département Informatique pour les Systèmes Coopératifs Ouverts et Décentralisés
Jury : Président / Présidente : Éric Gaussier
Examinateurs / Examinatrices : Olivier Boissier, Éric Gaussier, Patrice Bellot, Jacques Savoy, Sylvie Calabretto, Philippe Beaune, Michel Beigbeder
Rapporteurs / Rapporteuses : Patrice Bellot, Jacques Savoy

Résumé

FR  |  
EN

Dans le cadre d’une solution de modification de la requête, nous nous intéressons aux différentes façons d’utiliser la sémantique pour mieux exprimer le besoin d’information de l’utilisateur dans un contexte Web. Nous distinguons deux types de concepts : ceux identifiables dans une ressource sémantique comme une ontologie, et ceux que l’on extrait à partir d’un ensemble de documents de pseudo retour de pertinence. Nous proposons une Approche Sémantique Mixte d’Expansion et de Reformulation (ASMER) qui permet de modéliser l’utilisation de ces deux types de concepts dans une requête modifiée. Cette approche considère plusieurs défis liés à la modification automatique des requêtes, notamment le choix sélectif des termes d’expansion, le traitement des entités nommées et la reformulation de la requête finale.Bien que dans un contexte Web la précision soit le critère d’évaluation le plus adapté, nous avons aussi pris en compte le rappel pour étudier le comportement de notre approche sous plusieurs aspects. Ce choix a suscité une autre problématique liée à l’évaluation du rappel en recherche d’information. En constatant que les mesures précédentes ne répondent pas à nos contraintes, nous avons proposé la mesure MOR (Mesure Orientée Rappel), qui permet d’évaluer le rappel en tenant compte de la précision comme importante mais pas prioritaire dans un contexte dirigé rappel.En incluant MOR dans notre stratégie de test, nous avons évalué ASMER sur quatre collections Web issues des campagnes INEX et TREC. Nos expériences montrent qu’ASMER améliore la performance en précision par rapport aux requêtes originales et par rapport aux requêtes étendues par une méthode de l’état de l’art.