Thèse soutenue

Analyse fine : bornes inférieures et algorithmes de calculs d'intersection pour moteurs de recherche

FR  |  
EN
Auteur / Autrice : Jérémy Barbay
Direction : Claire Mathieu
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2002
Etablissement(s) : Paris 11

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

La résolution de requêtes conjonctives dans les moteurs de recherche indexés met en oeuvre l'intersection de tableaux triés. L'analyse classique dans le pire des cas ne permet pas de distinguer les algorithmes résolvant ce problème. Faisant suite aux travaux de Demaine, Lopez-Ortiz et Munro [DLOM00] nous proposons une analyse plus fine [BK02] de la complexité probabiliste de ce problème : idéalement un algorithme efficace devrait résoudre des instances ''faciles'' plus rapidement. Cette analyse est basée sur la complexité non-déterministe du problème et permet de montrer l'optimalité de l'algorithme de Demaine, Lopez-Ortiz et Munro [DLOM01]. Nous généralisons l'intersection à l'ensemble de multiplicité t et à l'ensemble de multiplicité optimale, et montrons des résultats similaires à ceux obtenus sur l'intersection. Nous étudions la généralisation de ces travaux à d'autres requêtes, sous la forme de combinaisons de problèmes de décision [BR02]. Cela nous permet de généraliser les résultats précédents au calcul de l'InterUnion (intersection d'unions de tableaux triés). Ces problèmes de calcul apparaissent dans le moteur de recherche intégré à FFSS, un système de partage de fichiers visant à remplacer le protocole de partage de fichier SMB, en cours de développement. Nous décrivons le concept de moteur de recherche intégré, les spécifications du protocole, et l'implémentation de divers aspects du moteur de recherche.