Agent d'apprentissage par renforcement pour l'allocation optimale des ressources dans le cadre des systèmes distribués
Auteur / Autrice : | Abdessalam Benhari |
Direction : | Denis Trystram |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 01/05/2021 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale mathématiques, sciences et technologies de l'information, informatique |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique de Grenoble |
Equipe de recherche : Efficient and RObust Distributed Systems |
Mots clés
Résumé
Bull (groupe Atos) s'associe à l'équipe DataMove (INRIA, CNRS, Grenoble INP, UGA) afin de proposer une thèse pour la conception et le développement d'un framework de Re-enforcement Learning dans le cadre de l'ordonnancement de tâches sur supercalculateur. Cette thèse s'appuiera sur deux cas d'utilisation : La recherche et la recommendation de paramètres optimaux pour la configuration de la solution sur des gestionnaires de datacenters (Gestionnaire de ressources classique). L'enrichissement des algorithmes d'ordonnancement classiques (du type 'First Come First Served' (FCFS) ou 'Short Job First' (SJF) par un agent RL autonome dans un espace d'actions contraint. Une recherche approfondie sur quelques pistes de minimisation de l'impact carbone des système distribués est aussi envisagée en parallèle, notamment sur des sujets tels que : le 'Power capping', le management des ressources , et la prise en compte de l'impact carbone dans la gestion des scores de 'fairness' lors de la soumission des jobs (taches) dans les systèmes distribués.