Contribution des méthodes d'apprentissage à la distribution de tâches dans un cluster robotique
Auteur / Autrice : | Paul Gautier |
Direction : | Jean-Philippe Diguet, Johann Laurent |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 27/04/2021 |
Etablissement(s) : | Lorient |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance - Laboratoire des sciences et techniques de l'information- de la communication et de la connaissance / Lab-STICC |
Jury : | Président / Présidente : Cédric Buche |
Examinateurs / Examinatrices : Maher Jridi | |
Rapporteur / Rapporteuse : Cécile Belleudy, François Berry |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
La coordination d'un système multi-robots est une tâche complexe nécessitant l'exécution d'algorithmes de calcul intensif. Dès lors, les ressources calculatoires du robot deviennent une préoccupation majeure puisqu'elles conditionnent la capacité du système à interagir avec l'environnement. Si le recours au cloud robotique permet de s'affranchir de cette difficulté, son utilisation demeure conditionnelle et impraticable dans de nombreux cas. Une autre solution consiste à organiser le système multi-robots en un cluster robotique où les ressources non-utilisées sont mutualisées afin de paralléliser les tâches fortement calculatoires. Cependant, ces ressources mutualisées s'avèrent limitées et fluctuantes nécessitant la mise en place d'un processus d'allocation dynamique. Ces travaux de thèse sont consacrés aux apports de l'apprentissage par renforcement dans l'administration d'un cluster robotique évoluant dans un environnement dynamique et incertain. Dans un nouveau contexte appelé MRpTA, deux axes sont étudiés : Le premier traite du transfert de tâches au sein d'un cluster où des approches classiques sont comparées à une solution utilisant un DQN. Le deuxième axe aborde, dans un contexte de recherche et sauvetage, la question de la distribution des tâches au sein d'un cluster. Le recours à l'apprentissage par renforcement permet d'améliorer considérablement les performances du système.