Exploration des paradigmes Enseignant-centré et Tâche-centré pour le transfert de compétences entre robots de morphologie distincte
Auteur / Autrice : | Mehdi Mounsif |
Direction : | Lounis Adouane |
Type : | Thèse de doctorat |
Discipline(s) : | Electronique et Systèmes |
Date : | Soutenance le 15/12/2020 |
Etablissement(s) : | Université Clermont Auvergne (2017-2020) |
Ecole(s) doctorale(s) : | École doctorale des sciences pour l'ingénieur (Clermont-Ferrand) |
Partenaire(s) de recherche : | Laboratoire : Institut Pascal (Aubière, Puy-de-Dôme) |
Jury : | Examinateurs / Examinatrices : Benoît Thuilot, Sébastien Lengagne, Gentiane Venture, Sébastien Druon |
Rapporteur / Rapporteuse : David Filliat, Olivier Stasse |
Mots clés
Mots clés contrôlés
Résumé
Récemment, il a été possible d’observer l’accélération du déploiement de robots dans des domaines dépassant l’habituel cadre industriel et manufacturier. Cependant, pour la majorité des tâches autonomes, la définition d’un modèle analytique ou la recherche d’une solution optimale requiert des ressources rarement accessibles en temps-réel, favorisant par conséquent des techniques basées sur l’apprentissage. Ces dernières, présentant l’avantage de ne pas nécessiter de modèle ainsi que de présenter un temps de calcul en exécution relativement constant, permettent d’appréhender des configurations et tâches hautement complexes. Les techniques basées sur les données font cependant état de temps d’entraînement considérables, nécessitant fréquemment des millions d’exemples et d’interaction avec leur environnement pour construire des politiques de contrôle admissibles. Le transfert de connaissance entre modèles est crucial pour le déploiement à grande échelle des méthodes d’apprentissage et bien que des stratégies de transmission aient été au coeur des récentes préoccupations, elles sont essentiellement dirigées vers les domaines de vision ou de compréhension du langage et ne sont pas directement applicables à des problématiques de transfert de compétences entre robots présentant des structures cinématique différentes. Les travaux présentés dans ce manuscrit de thèse se focalisent précisément sur ce point et visent à déterminer dans quelle mesure la compréhension entre deux entités morphologiquement distinctes est possible. Cette question est explorée via l’introduction de deux paradigmes distincts: Task-Centered et Teacher-Centered. La famille de techniques dite Task-Centered est basée sur l’idée de la séparation du savoir-faire relatif àune tâche des stratégies de contrôle du robot. A la manière d’une notice d’instruction, un tel noyau indépendant peut par conséquent être passé à d’autres robots de morphologie différentes et idéalement rendre possible la réalisation de la tâche par ce nouvel agent. Dans ce contexte, plusieurs procédures de création de ce noyau sont proposées et évaluées sur un large panel d’environnements simulés. Cependant, en dépit des perspectives attractives de cette formulation, le caractère ''onesize-fits-all'' des techniques Task-Centered n’est pas exempte de limitations qui sont extensivement discutées. C’est dans ce contexte que les approches Teacher-Centered sont introduites. Poursuivant le même objectif, ces démarches innovantes font intervenir un agent expert à partir duquel le savoir relatif à la tâche doit être distillé dans l’agent cible. Pour ce faire, une métrique originale est utilisée pour contourner la différence de structure entre l’agent cible et l’agent expert et permettre,malgré cette distinction, la rétro-propagation de l’erreur afin d’optimiser l’agent.