Outil de conception et d'administration des bases de données relationnelles parallèles
Auteur / Autrice : | Abdelkader Redouane |
Direction : | Georges Louis |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2000 |
Etablissement(s) : | La Rochelle |
Mots clés
Résumé
Dans cette thèse, nous abordons le problème d'optimisation du placement de données sur disques pour une architecture parallèle à mémoire distribuée. Le placement de données sur plusieurs disques permet d'augmenter la bande passante en e/s en exploitant au maximum le parallélisme des opérations de lecture/écriture d'une ou plusieurs relations. Dans le domaine des bases de données relationnelles parallèles, le placement de données a été largement étudié pour les architectures à mémoire distribuée et différentes stratégies de placement ont été développées. Pour chaque relation, ce placement peut être réalisé soit par une répartition de la relation sur tous les nuds (un nud est constitué d'un processeur, d'une mémoire et d'un ou plusieurs disques), soit par une répartition sur un sous-ensemble de nuds. Un mauvais placement de données sur les disques peut augmenter le cout de communication entre les nuds et par conséquent dégrader les performances du système. Actuellement, le placement sur disque et la réorganisation périodique de ce placement sont à la charge de l'administrateur. Nous proposons un évaluateur de placement de données sur disques dans un environnement d'exécution parallèle, pour une architecture à mémoire distribuée. Il permet d'estimer le cout d'un placement de données dans un environnement multi-utilisateurs. Cet évaluateur s'appuie sur un modèle de cout. Nous étendons le modèle de cout proposé dans Zait 94 Zait 95 et nous validons ce modèle à l'aide d'études expérimentales connues. Cette extension consiste à prendre en compte les couts d'accès en lecture ou en écriture aux données sur disque, d'intégrer de nouvelles fonctions de cout pour certaines opérations relationnelles et les couts de communication lorsqu'une saturation éventuelle du réseau est engendrée. Finalement, toute exécution concurrente des transactions induit des conflits d'accès aux ressources processeurs et données. Nous les modélisons par un cout moyen d'attente pour accéder à la ressource partagée. Afin d'évaluer la charge du système lors de l'exécution concurrente, nous proposons un modèle stochastique de files d'attente. Nous avons réalisé plusieurs séries d'expériences. Cette expérimentation nous permet d'une part de valider notre évaluateur de placements et d'autre part d'obtenir le placement de moindre cout.