Thèse en cours

Agent d'apprentissage par renforcement pour l'allocation optimale des ressources dans le cadre des systèmes distribués

FR  |  
EN
Auteur / Autrice : Abdessalam Benhari
Direction : Denis Trystram
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/05/2021
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique de Grenoble
Equipe de recherche : Efficient and RObust Distributed Systems

Résumé

FR  |  
EN

Bull (groupe Atos) s'associe à l'équipe DataMove (INRIA, CNRS, Grenoble INP, UGA) afin de proposer une thèse pour la conception et le développement d'un framework de Re-enforcement Learning dans le cadre de l'ordonnancement de tâches sur supercalculateur. Cette thèse s'appuiera sur deux cas d'utilisation : — La recherche et la recommendation de paramètres optimaux pour la configuration de la solution sur des gestionnaires de datacenters (Gestionnaire de ressources classique). — L'enrichissement des algorithmes d'ordonnancement classiques (du type 'First Come First Served' (FCFS) ou 'Short Job First' (SJF) par un agent RL autonome dans un espace d'actions contraint. Une recherche approfondie sur quelques pistes de minimisation de l'impact carbone des système distribués est aussi envisagée en parallèle, notamment sur des sujets tels que : le 'Power capping', le management des ressources , et la prise en compte de l'impact carbone dans la gestion des scores de 'fairness' lors de la soumission des jobs (taches) dans les systèmes distribués.