Thèse soutenue

Conception et mise en oeuvre d'une plate-forme logicielle de tolérance aux fautes pour le support d'applications reparties

FR  |  
EN
Auteur / Autrice : Pierre Sens
Direction : Claude Girault
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1994
Etablissement(s) : Paris 6

Résumé

FR

Cette thèse présente la conception et la mise en oeuvre d'une plate-forme logicielle de tolérance aux fautes: star. Star repose sur un modèle de pannes franches de sites pour des applications composées de processus déterministes communicants. Pour détecter efficacement les défaillances, les sites forment un anneau virtuel ou chacun surveille périodiquement son voisin. Lorsqu'une défaillance est détectée, chaque processus s'exécutant sur le site en panne est relance, de façon transparente, sur un site valide. Régulièrement, les processus sauvegardent leur état sur un support fiable de manière à reprendre leur exécution uniquement depuis la dernière sauvegarde. Ces points de reprise sont réalisés de façon indépendante ce qui permet de réduire le coût de sauvegarde en évitant des synchronisations entre processus. Afin de garantir la cohérence du système lors de la reprise, un processus rééxecutant son code n'interagit pas avec les autres jusqu'a ce qu'il atteigne l'état précédent la défaillance. La mise en oeuvre de ce principe repose sur la journalisation de tous les messages reçus. Afin d'améliorer les performances, un gestionnaire de répartition de charge a été utilisé pour créer une version étendue de la plate-forme, Gatostar. Des algorithmes de placement sont alors utilises, lors de la reprise des processus fautifs, pour choisir judicieusement les nouveaux sites d'exécution. Star a été réalisée au-dessus d'Unix dans un environnement de stations de travail reliées par un réseau local (Ethernet). Afin de rendre star facilement portable, le système d'exploitation n'a pas été modifié et la plate-forme n'exige aucun composant matériel spécifique. Des mesures de performance, en environnement réel, illustre l'efficacité de la plate-forme