Une approche modulaire pour l’apprentissage par imitation générique à l’aide d’une représentation spatio-temporelle des démonstrations basée sur les graphes : application à l’apprentissage robotique
Auteur / Autrice : | Yassine El Manyari |
Direction : | Patrick Le Callet, Laurent Dollé |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique appliquée |
Date : | Soutenance le 22/06/2023 |
Etablissement(s) : | Nantes Université |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et Sciences et Technologies du numérique, de l’Information et de la Communication (Nantes ; 2022-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire des Sciences du Numérique de Nantes |
Jury : | Président / Présidente : David Filliat |
Examinateurs / Examinatrices : Mehdi Khamassi, Sylvain Lamprier, Silvia Rossi | |
Rapporteurs / Rapporteuses : Olivier Bernard Henri Buffet, Alain Dutech |
Mots clés
Résumé
L’apprentissage par renforcement et l’apprentissage par imitation permettent aux robots d’apprendre à effectuer des tâches de manière autonome, sans avoir besoin d’instructions explicites. Cette thèse examine les deux méthodes et les intègre dans un cadre modulaire et générique pour résoudre le problème d’apprentissage par imitation à partir d’observations. L’approche est mise en œuvre en deux étapes, en commençant par apprendre un modèle de représentation qui capture les caractéristiques spatiales et temporelles des démonstrations observées, suivi de l’application d’un algorithme RL prêt à l’emploi avec une fonction de récompense générique pour apprendre la politique d’imitation. Les résultats expérimentaux indiquent que la méthode proposée surpasse les méthodes de pointe et présente des capacités de généralisation prometteuses pour une gamme de tâches de manipulation, dépassant les méthodes génératives dans la plupart des cas.