Thèse soutenue

Prédiction de parcours Web : vers un dépôt légal du Web français

FR
Auteur / Autrice : Younés Hafri
Direction : Chaabane Djeraba
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2005
Etablissement(s) : Nantes
Ecole(s) doctorale(s) : École doctorale sciences et technologies de l'information et des matériaux (Nantes)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Les recherches sur les modèles de prédiction de parcours sur le Web ont largement inspiré les chercheurs ces dernières années. Beaucoup d'algorithmes ont été proposés tels que les systèmes de recommandations, les guides de lecture, les caches serveur et les sites adaptatifs. L'objectif est toujours la réduction des temps de latences perçus par les utilisateurs à la recherche d'une information. Les modèles de Markov d'ordre k>1 sont bien adaptés pour répondre à ce besoin. Bien que ces modèles soient plus précis, ils sont pénalisés par leur nombre d'états et leur faible couverture des données. Cette thèse propose de résoudre cette problématique par la construction d'un modèle appelé Chaînes de Markov Combinées. Ce dernier fusionne les propriétés de plusieurs chaînes afin d'obtenir un ensemble d'états très réduit, des prédictions précises et une bonne couverture des données. D'autre part, nous avons développé un crawler web hautement performant, flexible par son déploiement sur un cluster de machines et sa gestion des pannes. Enfin, nous avons comparé ses performances par rapport aux crawlers existants de la littérature.