Thèse soutenue

Performances et fiabilite des systemes paralleles et distribues

FR  |  
EN
Auteur / Autrice : Sophie Chabridon
Direction : Erol Gelenbe
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1996
Etablissement(s) : Paris 5

Mots clés

FR

Résumé

FR

Dans cette these, nous nous interessons a l'evaluation des performances des systemes paralleles et distribues tolerant les pannes. Nous pouvons distinguer deux grandes classes de methodes permettant de rendre un systeme informatique sur de fonctionnement, celles basees sur les points de reprise et celles utilisant la replication. En general, ces methodes ne font aucune hypothese sur l'application. Nous avons choisi une approche differente en cherchant a tirer parti de la structure meme de l'application. Notre etude est basee sur le concept de graphe de taches qui a deja ete largement utilise dans la litterature pour l'analyse des performances des programmes paralleles. Ce concept est tres general et permet de representer facilement un programme parallele en decrivant les relations de precedence existant entre les taches sequentielles qui le composent. Nous proposons plusieurs algorithmes de detection des pannes permettant de garantir la terminaison correcte d'un programme parallele. Certaine taches du graphe sont selectionnees comme agents et sont chargees de tester l'etat des autres taches. Une part importante de notre travail a ete consacree a la realisation d'un simulateur a evenements discrets pour l'etude du temps d'execution de programmes paralleles en environnements a memoire partagee et a memoire distribuee ou les processeurs sont sujets a des defaillances. Nous avons egalement teste la faisabilite de notre approche sur un reseau de stations de travail en utilisant le logiciel pvm (parallel virtual machine). Nous avons compare experimentalement deux solutions, l'une centralisee et l'autre distribuee.