Thèse soutenue

Du chargement en masse dans une base de donnees (en general) et de la migration relationnel-objet (en particulier)

FR  |  
EN
Auteur / Autrice : Sihem Amer-Yahia
Direction : Claude Delobel
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1999
Etablissement(s) : Paris 11

Résumé

FR

Ce travail porte sur l'etude de techniques d'optimisation du chargement en masse dans une base de donnees relationnelle ou objet. En premiere partie, nous considerons le probleme dans sa generalite. Nous decrivons le modele sur lequel est fondee notre approche. Celui-ci permet de representer les types relationnel, objet mais aussi des fichiers texte ayant une grammaire simple. Nous presentons une algebre qui permet d'exprimer les transformations source-cible. Notre but etant d'optimiser les programmes qui peuplent une base de donnees, nous avons defini une nouvelle classe d'equivalences algebriques qui tiennent compte des effets de bord sur la base. En deuxieme partie, nous validons notre approche par le developpement d'un prototype de la migration de donnees relationnelles vers un systeme a objets. Le prototype offre un langage declaratif et haut niveau qui permet de specifier des transformations relationnel-objet mais egalement des contraintes d'oganisation des objets. Nous montrons comment les transformations sont traduites dans l'algebre. Notre strategie de recherche applique des equivalences algebriques afin de realiser les contraintes physiques et de generer des programmes de chargement efficaces. Cette efficacite est mesuree par un modele de cout qui tient compte des temps de communication entre les systemes source et cible, de traitement sur chacun d'eux et du volume de stockage necessite par le chargement. Le resultat de l'optimisation est donne a un generateur de code qui produit des transactions parametrees. Chaque transaction utilise l'interface odbc pour charger des donnees de basee relationnellee vers le systeme a objets o2. Enfin, nous avons effectue des tests de validation et de performance sur notre prototype. Du fait de la genericite de notre approche, nous pensons que nos techniques d'optimisation peuvent optimiser la materialisation de vues, la construction d'entrepots de donnees, le chargement de bases du genome a partir de fichiers, etc.