Thèse en cours

Transfert de compétences entre robots par abstraction d'état

FR  |  
EN
Auteur / Autrice : Samuel Beaussant-Daclinat
Direction : Olivier Stasse
Type : Projet de thèse
Discipline(s) : Génie électrique,électronique et systèmes
Date : Inscription en doctorat le 01/10/2020
Etablissement(s) : Université Clermont Auvergne (2021-...)
Ecole(s) doctorale(s) : Sciences pour l'Ingénieur
Partenaire(s) de recherche : Laboratoire : Institut Pascal

Résumé

FR  |  
EN

L'apprentissage par renforcement a été appliqué avec succès à un large éventail de problèmes au cours des dernières années, démontrant à la fois sa polyvalence et son efficacité. Le domaine de la robotique en particulier a bénéficié des progrès considérables réalisés dans l'apprentissage par renforcement. Cependant, l'apprentissage d'un comportement performant nécessite un nombre important d'interactions avec l'environnement, ce qui est énergivore et chronophage. Cela est généralement dû au fait que le robot ne dispose pas d'informations préalables sur la tâche ou sa propre incarnation physique. En général, la méthode habituelle pour aborder et atténuer ce besoin important de données consiste à utiliser le transfert d'apprentissage, une méthode qui exploite l'expérience ou les connaissances préalables pour accélérer l'apprentissage d'une tâche distincte mais connexe. Cette approche est actuellement largement utilisée dans la vision par ordinateur basée sur l'apprentissage profond ou le traitement du langage naturel. Cependant, trouver une approche pratique et générale pour le pré-entrainement et le transfert d'apprentissage dans le contexte de l'apprentissage par renforcement reste un problème de recherche ouvert. Dans cette thèse, nous explorons le transfert d'apprentissage dans le contexte de l'apprentissage par renforcement dans le but spécifique de transférer des comportements d'un robot à un autre, même en présence de disparités morphologiques. En d'autres termes, nous souhaitons réutiliser les connaissances acquises par un robot (source) pour une tâche afin d'accélérer, voire d'éviter, le processus d'apprentissage d'un robot différent (cible) sur la même tâche. Nous mettons en évidence les défis particuliers posés par l'application du transfert d'apprentissage dans le contexte du transfert de compétences entre robots et proposons une méthode efficace pour aborder ces questions.