Le déploiement, une phase à part entière dans le cycle de vie des entrepôts de données : application aux plateformes parallèles
Auteur / Autrice : | Soumia Benkrid |
Direction : | Ladjel Bellatreche, Khaled-Walid Hidouci |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique et application |
Date : | Soutenance le 24/06/2014 |
Etablissement(s) : | Chasseneuil-du-Poitou, Ecole nationale supérieure de mécanique et d'aérotechnique en cotutelle avec Ecole Nationale Supérieure d'Informatique (ESI) - Alger |
Ecole(s) doctorale(s) : | École doctorale Sciences et ingénierie pour l'information, mathématiques (Limoges ; 2009-2018) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique et d'Automatique pour les Systèmes / LIAS |
Jury : | Président / Présidente : Djamel Eddine Zegour |
Examinateurs / Examinatrices : Yamine Aït-Ameur, Karima Benatcheba, Pascal Lienhardt | |
Rapporteur / Rapporteuse : Arnaud Giacometti, Mahmoud Boufaida |
Mots clés
Résumé
La conception d’un entrepôt de données parallèle consiste à choisir l’architecture matérielle,à fragmenter le schéma d’entrepôt de données, à allouer les fragments générés, à répliquer les fragments pour assurer une haute performance du système et à définir la stratégie de traitement et d’équilibrage de charges. L’inconvénient majeur de ce cycle de conception est son ignorance de l’interdépendance entre les sous-problèmes liés à la conception d’un EDP et l’utilisation des métriques hétérogènes pour atteindre le même objectif. Notre première proposition définie un modèle de coût analytique pour le traitement parallèle des requêtes OLAP dans un environnement cluster. Notre deuxième proposition prend en considération l’interdépendance existante entre la fragmentation et l’allocation. Dans ce contexte, nous avons proposé une nouvelle approche de conception d’un EDP sur un cluster de machine. Durant le processus de fragmentation, notre approche décide si le schéma de fragmentation généré est pertinent pour le processus d’allocation. Les résultats obtenus sont très encourageant et une validation est faite sur Teradata. Notre troisième proposition consiste à présenter une méthode de conception qui est une extension de notre travail. Dans cette phase, une méthode de réplication originale, basée sur la logique floue, est intégrée.