Analyse fine : bornes inférieures et algorithmes de calculs d'intersection pour moteurs de recherche
Auteur / Autrice : | Jérémy Barbay |
Direction : | Claire Mathieu |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2002 |
Etablissement(s) : | Paris 11 |
Mots clés
Mots clés contrôlés
Résumé
La résolution de requêtes conjonctives dans les moteurs de recherche indexés met en oeuvre l'intersection de tableaux triés. L'analyse classique dans le pire des cas ne permet pas de distinguer les algorithmes résolvant ce problème. Faisant suite aux travaux de Demaine, Lopez-Ortiz et Munro [DLOM00] nous proposons une analyse plus fine [BK02] de la complexité probabiliste de ce problème : idéalement un algorithme efficace devrait résoudre des instances ''faciles'' plus rapidement. Cette analyse est basée sur la complexité non-déterministe du problème et permet de montrer l'optimalité de l'algorithme de Demaine, Lopez-Ortiz et Munro [DLOM01]. Nous généralisons l'intersection à l'ensemble de multiplicité t et à l'ensemble de multiplicité optimale, et montrons des résultats similaires à ceux obtenus sur l'intersection. Nous étudions la généralisation de ces travaux à d'autres requêtes, sous la forme de combinaisons de problèmes de décision [BR02]. Cela nous permet de généraliser les résultats précédents au calcul de l'InterUnion (intersection d'unions de tableaux triés). Ces problèmes de calcul apparaissent dans le moteur de recherche intégré à FFSS, un système de partage de fichiers visant à remplacer le protocole de partage de fichier SMB, en cours de développement. Nous décrivons le concept de moteur de recherche intégré, les spécifications du protocole, et l'implémentation de divers aspects du moteur de recherche.