Thèse en cours

Vers des systèmes distribués large échelle auto-réparants fondés sur les jumeaux numériques

FR  |  
EN
Auteur / Autrice : Gabriel Job antunes grabher
Direction : Noël de Palma
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/03/2022
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique de Grenoble
Equipe de recherche : Efficient and RObust Distributed Systems

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Cette thèse vise à utiliser l'intelligence artificielle pour améliorer la disponibilité des infrastructures distribuées de grande taille. À cause de la taille et de la complexité des systèmes distribués actuels, les fautes logicielles et matérielles sont fréquentes. Les techniques d'auto-réparation, qui permettent aux systèmes de s'auto-reconfigurer pour limiter les conséquences des fautes, sont des approches prometteuses pour en améliorer la disponibilité. Cependant, afin de pouvoir prendre de bonnes décisions d'auto-reconfiguration, plusieurs défis doivent être relevés. Tout d'abord, il est nécessaire d'obtenir une représentation précise de l'état actuel du système. Ensuite, il faut prendre la bonne décision de reconfiguration pour améliorer l'état du système. Dans cette thèse, l'intelligence artificielle sera utilisée pour concevoir des systèmes distribués auto-réparants. Pour ce faire, le premier objectif est d'adapter le concept de Jumeaux Numériques pour représenter l'état d'un système distribué en cours de fonctionnement. Cette représentation numérique sera utilisée pour détecter les fautes et en identifier les causes. Le deuxième objectif est de construire des solutions fondées sur l'apprentissage machine capables d'apprendre les meilleures décisions à prendre pour corriger automatiquement les problèmes créés par une faute, et ainsi être capables d'améliorer la disponibilité et l'efficacité d'infrastructures distribuées de grande taille. La représentation fidèle de l'état du système, fournie par l'approche fondée sur les jumeaux numériques, permettra de prendre de meilleures décisions de reconfiguration.