Apprentissage d'ordonnancements pour la constitution de corpus d'évaluation et pour l'agrégation de listes en recherche d'information
Auteur / Autrice : | Huyen-Trang Vu |
Direction : | Patrick Gallinari |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2008 |
Etablissement(s) : | Paris 6 |
Résumé
La thèse aborde les problématiques de l'évaluation de la performance des systèmes de recherche d'information en grande échelle. Il faut sélectionner les documents à juger, et choisir un protocole d'évaluation qui facilite le travail de l'expert humain, avec la contrainte de conserver une évaluation fiable. La première partie de la thèse concerne la recherche d'information dans les documents XML. Nos analyses s'avèrent qu'une évaluation suivant le cadre traditionnel était aussi fiable que des évaluations plus complexes proposées pour la RI XML. Nous nous sommes ensuite intéressés à contrôler le nombre de documents à juger. Nous avons proposé une nouvelle méthode pour la constitution de corpus d'évaluation basée sur des algorithmes de l'apprentissage d'ordonnancements. Nous avons montré que la méthode proposée permet de constituer des corpus de meilleure qualité à moindre coût que celles de l'état de l'art. Nous étudions enfin la robustesse des algorithmes de méta-recherche supervisée en mettant en évidence différents facteurs. Nous avons montré que ces algorithmes étaient d'une grande stabilité.