Thèse soutenue

Réseau longue distance et application distribuée dans les grilles de calcul : étude et propositions pour une interaction efficace

FR  |  
EN
Auteur / Autrice : Ludovic Hablot
Direction : Pascale Vicat-Blanc
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2009
Etablissement(s) : Lyon, École normale supérieure (sciences)
Partenaire(s) de recherche : Laboratoire : Laboratoire de l'informatique du parallélisme (Lyon1988-....)

Résumé

FR  |  
EN

Les grilles ont fait leur apparition au début des années 1990, de manière à fédérer les ressources de calcul de différentes entités en les interconnectant et ainsi disposer d'une plus grande puissance de calcul. Les applications parallèles s'appuient la plupart du temps sur le standard MPI qui fonctionne par passage de message. Initialement destiné aux grappes, celui-ci est toujours utilisé pour programmer les communications des applications s'exécutant sur les grilles, afin de réutiliser d'anciennes applications. Alors que différents problèmes ont été résolus pour les communications au sein des grappes, le réseau longue distance de la grille pose plusieurs problèmes. Tout d'abord, les messages MPI sont transmis de manière fiable sur le réseau longue distance via le protocole TCP. Or TCP, qui reste le protocole de transport utilisé dans la plupart des grilles, est basé sur un transfert de données à l'aide de flux; il est donc peu adapté aux communications MPI sous forme de messages. Ensuite, la grande latence du réseau longue distance implique des communications et des retransmissions de paquets perdus qui sont coûteuses. Enfin, le débit disponible sur le lien d'accès à ce réseau est généralement inférieur à la somme des débits nécessaires si tous les processus communiquent en même temps sur ce lien. Ceci crée de la congestion à la fois au sein d'une même application et à la fois avec les autres applications qui l'utilisent, et il devient nécessaire de gérer ce goulot d'étranglement. L'objectif principal de cette thèse est d'étudier en détail les interactions entre les applications parallèles MPI et la couche de transport TCP dans les réseaux longue distance des grilles de calcul, puis de proposer des solutions à ces problèmes. Durant ma thèse, j'ai tout d'abord étudié le comportement des applications MPI sur une grille de calcul, afin de déterminer les points problématiques des communications sur le réseau longue distance. Puis, j'ai analysé en détail l'interaction entre les deux principales couches de communication : la couche MPI et la couche TCP. Enfin, j'ai proposé une approche à base de passerelles qui permet l'éclatement des connexions TCP pour les communications MPI, afin de rendre visible la traversée du réseau longue distance.