Thèse soutenue

Contribution des méthodes d'apprentissage à la distribution de tâches dans un cluster robotique
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Paul Gautier
Direction : Jean-Philippe DiguetJohann Laurent
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 27/04/2021
Etablissement(s) : Lorient
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance - Laboratoire des sciences et techniques de l'information- de la communication et de la connaissance / Lab-STICC
Jury : Président / Présidente : Cédric Buche
Examinateurs / Examinatrices : Maher Jridi
Rapporteurs / Rapporteuses : Cécile Belleudy, François Berry

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

La coordination d'un système multi-robots est une tâche complexe nécessitant l'exécution d'algorithmes de calcul intensif. Dès lors, les ressources calculatoires du robot deviennent une préoccupation majeure puisqu'elles conditionnent la capacité du système à interagir avec l'environnement. Si le recours au cloud robotique permet de s'affranchir de cette difficulté, son utilisation demeure conditionnelle et impraticable dans de nombreux cas. Une autre solution consiste à organiser le système multi-robots en un cluster robotique où les ressources non-utilisées sont mutualisées afin de paralléliser les tâches fortement calculatoires. Cependant, ces ressources mutualisées s'avèrent limitées et fluctuantes nécessitant la mise en place d'un processus d'allocation dynamique. Ces travaux de thèse sont consacrés aux apports de l'apprentissage par renforcement dans l'administration d'un cluster robotique évoluant dans un environnement dynamique et incertain. Dans un nouveau contexte appelé MRpTA, deux axes sont étudiés : Le premier traite du transfert de tâches au sein d'un cluster où des approches classiques sont comparées à une solution utilisant un DQN. Le deuxième axe aborde, dans un contexte de recherche et sauvetage, la question de la distribution des tâches au sein d'un cluster. Le recours à l'apprentissage par renforcement permet d'améliorer considérablement les performances du système.