Thèse soutenue

Tolérance aux fautes et ordonnancement adaptatif dans les systèmes distribués hétérogènes

FR
Auteur / Autrice : Djemai Kebbal
Direction : Jean-Marc Geib
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2000
Etablissement(s) : Lille 1

Résumé

FR

Les reseaux de stations et les clusters de processeurs deviennent de plus en plus des plateformes populaires pour le calcul parallele et distribue. Ils sont caracterises par plusieurs proprietes rendant leur exploitation difficile (heterogeneite materielle et logicielle, frequence de defaillance elevee, charge dynamique imprevisible, etc. ). L'objectif du projet mars, de l'equipe opac du lifl, est d'integrer ces plateformes pour donner une vue unique du systeme (meta-systeme) dans le but de pendre en charge des applications de longue duree de vie. Mars est un systeme d'ordonnancement adaptatif dans lequel, l'application parallele change son degre de parallelisme suivant la disponibilite de ressources. L'objectif principal de ce travail de these est de concevoir un systeme ayant une vue globale du meta-systeme afin d'assurer une gestion efficace des ressources et de repondre aux besoins des applications paralleles. Un environnement d'execution, comportant les outils necessaires pour le controle, la gestion et l'allocation de ressources aux applications paralleles, est mis en uvre. Afin de pouvoir developper aisement des applications adaptatives, nous avons adopte un modele de construction et d'ordonnancement d'applications paralleles adaptatives, fournissant une interface de programmation simple. L'algorithme d'ordonnancement utilise des criteres simples dans le but d'ameliorer les performances de l'application (puissance relative, dependances des taches). Pour pouvoir supporter plusieurs applications paralleles simultanement, nous avons dote le systeme d'un ordonnanceur multi-application. Concernant la tolerance aux fautes, nous avons, d'une part, dote les applications paralleles adaptatives d'un mecanisme de sauvegarde/reprise.