Thèse soutenue

Simulation avancée pour la gestion de ressources des superordinateurs

FR  |  
EN
Auteur / Autrice : Adrien Faure
Direction : Denis TrystramOlivier Richard
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 02/12/2020
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique de Grenoble (2007-....)
Entreprise : ATOS
Equipe de recherche : Équipe-projet Mouvements de données pour le calcul haute performance (Montbonnot, Isère ; 2021-....)
Jury : Président / Présidente : Yves Denneulin
Examinateurs / Examinatrices : Pascale Rossé-Laurent, Adrien Lebre
Rapporteurs / Rapporteuses : Georges Da Costa, Frédéric Suter

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Les superordinateurs sont des systèmes mutualisant la puissance de milliers de coeurs de calculs dédiés à la résolution des problèmes compliqués de notre société.Le gestionnaire de ressources est un système distribué et complexe chargé de la gestion de ses ressources de calculs.Son rôle est multiple: Gérer la plateforme physique et traiter les requêtes d'accès des utilisateurs au superordinateur.La pierre angulaire du gestionnaire de ressources est son algorithme d'ordonnancement des requêtes des utilisateurs.L'ordonnancement est un problème difficile; pour gérer efficacement un superordinateur le gestionnaire de ressources doit disposer d'heuristiques d'ordonnancement efficaces permettant de prendre des décisions pertinentes sur des milliers de ressources de calculs.Évaluer et tester de nouvelles heuristiques est fondamental avant de pouvoir les utiliser dans un système en production.Toute panne induite par une nouvelle politique peut avoir des conséquences importantes sur la qualité de service du superordinateur.Il est ainsi nécessaire de disposer d'outils et méthodes dédiés à l'évaluation des algorithmes d'ordonnancement.La première partie de ce document présente un nouvel algorithme d'ordonnancement, ainsi que son évaluation par le biais de la simulation.L'algorithme en question repose sur la possibilité de rediriger les programmes des utilisateurs en cours d'exécution.L'évaluation est réalisée par le biais d'une large campagne de simulation, et montre que rediriger des programmes permet d'améliorer les performances de l'ordonnancement.L'objectif principal de la seconde partie de ce document est de proposer et développer de nouveaux outils et méthodes pour l'évaluation des gestionnaires de ressources.Cette seconde partie est elle même divisée en deux arcs: Nous proposons dans un premier temps d'étendre les techniques de simulations d’algorithmes d'ordonnancement avec des modèles dédiés aux programmes permettant ainsi la simulation d'interférences réseaux entre les différents programmes.Dans un second temps, nous proposons deux nouvelles approches pour créer des expériences sur un seul ordinateur, en se basant directement sur de vrais gestionnaires de ressources.L'objectif de ces travaux est d'étendre le paysage expérimental des outils et méthodologies nécessaires à l'évaluation de nouveaux algorithmes d'ordonnancement.