Thèse soutenue

FR
Auteur / Autrice : Khaled Yagoub
Direction : Patrick Valduriez
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2001
Etablissement(s) : Versailles-St Quentin en Yvelines

Mots clés

FR

Résumé

FR  |  
EN

Un site Web à usage intensif de données (SWID) est un site Web qui gère un nombre important de pages dont le contenu est construit dynamiquement, à partir de grandes bases de données. C'est à dire que l'ensemble des pages Web constituant le site n'est pas construit et stocké une fois pour toutes, sur le serveur Web, pour être utilisé ; mais au contraire, les pages Web sont regénérées dynamiquement lorsque le site est parcouru par les utilisateurs. . Cette création demande d'extraire des données d'une base de données et de construire les pages HTML correspondantes. Dans ce contexte, la demande d'une page par un client peut n"cessiter une interaction coûteuse avec le système de gestion de base de données, pour la connexion à la base et l'exécution des requêtes nécessaires à la récupération des données, risquant ainsi d'augmenter considérablement le temps d'attente du client. Dans cette thèse nous adressons ce problème de performance en nous appuyant sur la spécification déclarative de sites Web. Nous proposons une architecture configurable de caches à plusieurs niveaux et sa mise en oeuvre dans le cadre de Weave, un système de gestion de sites Web développé à l'INRIA. Dans notre approche, il est possible de cacher des données extraites d'une base de données (sous forme de vues matérialisées), des fragments XML et/ou des pages HTML. Pour spécifier et personnaliser différentes stratégies de caching, nous offrons un langage de haut niveau, appelé WeaveRPL. Nous développons aussi une infrastructure de base permettant de compiler une spécification déclarative d'un site Web et de générer automatiquement une stratégie de caching optimale. Nous illustrons notre approche à l'aide d'un site Web construit à partir de la base de données TCP/D. Puis, nous évaluons expérimentalement, les performances de différentes stratégies de caching en utilisant notre plate-forme de test WeaveBench. Les résultats obtenus montrent clairement qu'une stratégie mixte est généralement la meilleure.