Thèse soutenue

Optimisation de requetes relationnelles pour execution parallele

FR  |  
EN
Auteur / Autrice : MOHAMED ZAIT
Direction : Patrick Valduriez
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1994
Etablissement(s) : Paris 6

Résumé

FR

Dans cette these, nous abordons le probleme de l'optimisation de requetes relationnelles dans les systemes de gestion de bases de donnees paralleles. L'optimisation pour un modele d'execution parallele ouvre la voie a plusieurs problemes nouveaux dont: l'optimisation dynamique, un espace de recherche plus grand, et un modele de cout complexe. Nous avons apporte des solutions a certains de ces problemes et les avons implantes dans l'optimiseur de requetes du systeme eds. La premiere contribution est de proposer un modele de cout pour un environnement d'execution parallele, pour les deux architectures memoire partagee et memoire distribuee, et de le valider. Deuxiemement, nous proposons un nouveau critere d'equivalence pour la strategie de programmation dynamique, qui prend en compte les aspects d'un plan d'execution lies a l'environnement parallele. Troisiemement, nous montrons que les strategies de recherche basees sur les transformations sont une bonne alternative aux strategies exhaustives, telle que programmation dynamique. Les strategies exhaustives ne peuvent plus etre utilisees pour des requetes de taille moyenne (par exemple, plus de sept jointures) car la taille de l'espace de recherche est beaucoup plus importante. Troisiemement, nous montrons que l'espace des plans paralleles est beaucoup plus large que l'espace des plans sequentiels pour une requete donnee. Cependant, au lieu de restreindre statiquement l'espace de recherche (considerer uniquement les plans lineaires), qui peut faire rater de meilleurs plans, nous reduisons le cout de l'optimisation en controlant la strategie de recherche. En particulier, l'utilisation de strategies de recherche aleatoires dans un espace non restreint (espace des plans bushy) donne de meilleurs resultats qu'une strategie exhaustive dans un espace restreint. Quatriemement, un nouveau format pour representer les plans d'execution a ete propose, appele zigzag. Il permet, dans le cas ou la memoire est limitee, d'obtenir de meilleures performances que les arbres droits. Finalement, nous proposons une approche pour une optimisation extensible basee sur des techniques orientees objet. Ces techniques ont ete utilisees dans la conception et la realisation de l'optimiseur de requetes du systeme eds. Mots-cles: base de donnees, conception orientee objet, espace de recherche, graphe de requetes, modele de cout, optimisation de requetes, parallelisme, plan d'execution, strategie de recherche, serveur de bases de donnees, sql