Reformulation sémantique des requêtes pour la recherche d’information ad hoc sur le Web
Auteur / Autrice : | Bissan Audeh |
Direction : | Olivier Boissier |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 09/09/2014 |
Etablissement(s) : | Saint-Etienne, EMSE |
Ecole(s) doctorale(s) : | ED SIS 488 |
Partenaire(s) de recherche : | Laboratoire : Département Informatique pour les Systèmes Coopératifs Ouverts et Décentralisés |
Jury : | Président / Présidente : Éric Gaussier |
Examinateurs / Examinatrices : Olivier Boissier, Éric Gaussier, Patrice Bellot, Jacques Savoy, Sylvie Calabretto, Philippe Beaune, Michel Beigbeder | |
Rapporteurs / Rapporteuses : Patrice Bellot, Jacques Savoy |
Résumé
Dans le cadre d’une solution de modification de la requête, nous nous intéressons aux différentes façons d’utiliser la sémantique pour mieux exprimer le besoin d’information de l’utilisateur dans un contexte Web. Nous distinguons deux types de concepts : ceux identifiables dans une ressource sémantique comme une ontologie, et ceux que l’on extrait à partir d’un ensemble de documents de pseudo retour de pertinence. Nous proposons une Approche Sémantique Mixte d’Expansion et de Reformulation (ASMER) qui permet de modéliser l’utilisation de ces deux types de concepts dans une requête modifiée. Cette approche considère plusieurs défis liés à la modification automatique des requêtes, notamment le choix sélectif des termes d’expansion, le traitement des entités nommées et la reformulation de la requête finale.Bien que dans un contexte Web la précision soit le critère d’évaluation le plus adapté, nous avons aussi pris en compte le rappel pour étudier le comportement de notre approche sous plusieurs aspects. Ce choix a suscité une autre problématique liée à l’évaluation du rappel en recherche d’information. En constatant que les mesures précédentes ne répondent pas à nos contraintes, nous avons proposé la mesure MOR (Mesure Orientée Rappel), qui permet d’évaluer le rappel en tenant compte de la précision comme importante mais pas prioritaire dans un contexte dirigé rappel.En incluant MOR dans notre stratégie de test, nous avons évalué ASMER sur quatre collections Web issues des campagnes INEX et TREC. Nos expériences montrent qu’ASMER améliore la performance en précision par rapport aux requêtes originales et par rapport aux requêtes étendues par une méthode de l’état de l’art.