Vers des systèmes distribués large échelle auto-réparants fondés sur les jumeaux numériques
Auteur / Autrice : | Gabriel Job antunes grabher |
Direction : | Noël de Palma |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 01/03/2022 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 199.-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique de Grenoble |
Equipe de recherche : Efficient and RObust Distributed Systems |
Mots clés
Mots clés libres
Résumé
Cette thèse vise à utiliser l'intelligence artificielle pour améliorer la disponibilité des infrastructures distribuées de grande taille. À cause de la taille et de la complexité des systèmes distribués actuels, les fautes logicielles et matérielles sont fréquentes. Les techniques d'auto-réparation, qui permettent aux systèmes de s'auto-reconfigurer pour limiter les conséquences des fautes, sont des approches prometteuses pour en améliorer la disponibilité. Cependant, afin de pouvoir prendre de bonnes décisions d'auto-reconfiguration, plusieurs défis doivent être relevés. Tout d'abord, il est nécessaire d'obtenir une représentation précise de l'état actuel du système. Ensuite, il faut prendre la bonne décision de reconfiguration pour améliorer l'état du système. Dans cette thèse, l'intelligence artificielle sera utilisée pour concevoir des systèmes distribués auto-réparants. Pour ce faire, le premier objectif est d'adapter le concept de Jumeaux Numériques pour représenter l'état d'un système distribué en cours de fonctionnement. Cette représentation numérique sera utilisée pour détecter les fautes et en identifier les causes. Le deuxième objectif est de construire des solutions fondées sur l'apprentissage machine capables d'apprendre les meilleures décisions à prendre pour corriger automatiquement les problèmes créés par une faute, et ainsi être capables d'améliorer la disponibilité et l'efficacité d'infrastructures distribuées de grande taille. La représentation fidèle de l'état du système, fournie par l'approche fondée sur les jumeaux numériques, permettra de prendre de meilleures décisions de reconfiguration.