Thèse soutenue

Architecture robotique et cognitive pour l'apprentissage de tâches en interaction avec l'humain. Une application pour la collaboration homme/robot dans l'Industrie 4.0.

FR  |  
EN
Auteur / Autrice : François Helenon
Direction : Olivier Gibaru
Type : Thèse de doctorat
Discipline(s) : Informatique-traitement du signal (AM)
Date : Soutenance le 18/01/2022
Etablissement(s) : Paris, HESAM
Ecole(s) doctorale(s) : École doctorale Sciences des métiers de l'ingénieur
Partenaire(s) de recherche : Laboratoire : LISPEN - LISPEN
établissement de préparation de la thèse : École nationale supérieure d'arts et métiers (1780-....)
Jury : Président / Présidente : Rachid Alami
Examinateurs / Examinatrices : Olivier Gibaru, Pedro Neto, Zigang Zheng, Hélène Chanal, Martin Riedmiller
Rapporteurs / Rapporteuses : Pedro Neto, Zigang Zheng

Résumé

FR  |  
EN

Des capacités d'interaction flexible et centrée sur l'humain, en robotique collaborative, est un aspect essentiel de l'industrie 4.0/5.0. Les robots collaboratifs peuvent désormais fournir une assistance dans de nombreuses tâches, contribuant ainsi à réduire les risques de troubles musculo-squelettiques pour les travailleurs humains. Cependant, le niveau de collaboration reste encore loin du niveau naturel entre deux collègues humains. En effet, la reconfiguration des robots collaboratifs manque encore de flexibilité et est souvent hors de portée du travailleur du quotidien, qui n'est ni un programmeur ni un expert en robotique. Un robot collaboratif idéal devrait devenir un Assistant Robotique Intelligent (ARI) capable d'adapter dynamiquement son comportement à la diversité de chaque situation, y compris les tâches, les changements d'environnement, les caractéristiques des travailleurs et leurs préférences. De telles exigences conduisent à un changement de paradigme dans la façon dont les robots collaboratifs sont programmés.Tout au long de cette thèse, pour répondre aux spécifications d'un ARI, nous avons exploré la conception d'un prototype d'architecture cognitive autour de la notion d'Enseignement Robotisé en Interaction (ERI). L'agent robotique peut apprendre, en s'appuyant sur des connaissances antérieures, comment représenter et exécuter des tâches inconnues avec des capacités de généralisation, selon les préférences et les caractéristiques des travailleurs. L'apprentissage se fait tout au long de l'interaction, dans un cadre d'initiative mixte, de manière incrémentale, rapide et naturelle, par des personnes non expertes en programmation.En nous inspirant d'approches complémentaires de la littérature en Intelligence Artificielle (IA) et en ERI, nous avons mis en évidence les avantages d'une architecture hybride, entrelaçant les approches symbolique et connexionniste en IA. Suivant les spécifications de l'ARI, nous avons choisi de développer un nouveau système cognitif basé sur des modèles de représentations relationnelles et l'intégration de modules d'apprentissage spécifiques basés sur l'apprentissage profond. En particulier, nous nous sommes concentrés sur l'exploitation de représentations modulaires pour comportements de l'ARI, intervenant pour le processus d'apprentissage délibératif et incrémental de l'agent. Cela a conduit à considérer les arbres de comportements réactifs au coeur du modèle de comportement de l'architecture. Cela permet d'apprendre des niveaux hiérarchisés de représentations, de la perception motrice du monde réel aux représentations symboliques abstraites.Des validations expérimentales, avec de vrais robots collaboratifs, ont été effectuées tout au long de la thèse pour évaluer le comportement de l'actuel prototype d'architecture par rapport aux spécifications de l'ARI. Comme les tâches de manipulation sont courantes dans de nombreuses applications industrielles, nous avons choisi de concentrer ces validations expérimentales sur des scénarios de préhension planaires, orientés vers la tâche. Ceci a motivé le développement et l'intégration de modules d'apprentissage en IA basés sur des démonstrations humaines pour l'apprentissage de la préhension. À partir de quelques démonstrations, un humain peut enseigner rapidement et naturellement les emplacements autorisés et interdits, en fonction de la tâche et/ou de leurs propres préférences.En outre, et en tant que perspectives d'intégration futures, nous discutons de la façon dont les techniques d'incertitude et d'estimation pour l'apprentissage profond pourraient être exploitées au cœur de l'architecture, pour les prédictions d'échec et pour l'apprentissage actif.