Un service de synchronisation distribuee tolerant les pannes : implantation dans chorus
Auteur / Autrice : | Stéphane Eranian |
Direction : | Jean-Marie Rifflet |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences appliquées |
Date : | Soutenance en 1995 |
Etablissement(s) : | Paris 7 |
Résumé
L'evolution des environnements informatiques et notamment le developpement des reseaux ouvre de nouvelles possibilites au niveau de la construction des systemes d'exploitations: les systemes repartis. Les nouvelles architectures sont basees sur des micro noyaux fournissant des abstractions et services de base a partir desquels on construit des systemes complets via un ensemble de serveurs, dissemines sur plusieurs sites, communicants par echanges de messages. Cette repartition des taches impose une certaine coordination afin de maintenir une coherence d'ensemble. Ce maintien repose sur l'utilisation de synchronisations. Notre environnement cible est constitue d'un ensemble de sites fonctionnant sous le systeme micro noyau reparti chorus. Le but de cette these est de fournir un service de synchronisation distribuee generique basee sur la notion de jeton pour garantir la propriete d'exclusion mutuelle repartie. Deux qualites de service sont fournies. La premiere est basee sur un algorithme centralise, la seconde utilise un algorithme distribue, derive de celui de naimi et trehel, base sur une structure arborescente dynamique. Nous presentons des resultats sur les performances obtenus a partir d'un prototype. Dans un second temps, nous montrons comment ce service est rendu tolerant aux pannes franches de site sans perte de performances. Les services sont regeneres dynamiquement, les clients sont perdus et les sites peuvent etre reintegres apres reparation. Nous n'utilisons aucune technique a base de points de controle ou transactions. Notre architecture repose sur un service generique externe, am ou gestionnaire de pannes reparti. Il fournit des services de detection de pannes, de notifications sur pannes et d'aide au recouvrement. Le serveur de remplacement est choisi dynamiquement suivant un principe d'hospitalite. Le recouvrement exploite la nature repartie de l'environnement, il est base sur la collecte de l'etat aupres des clients survivants en vue de sa reconstruction dans le serveur. La tolerance est supportee dans les deux qualites de services