Thèse en cours

Exploration de l'apprentissage multi-tâche et du méta-apprentissage pour la reconnaissance simultanée et hiérarchique des activités, actions et intentions professionnelles

FR  |  
EN
Auteur / Autrice : Gavriela Senteri
Direction : Sotiris Manitsaris
Type : Projet de thèse
Discipline(s) : Informatique temps réel, robotique et automatique - Paris
Date : Inscription en doctorat le 01/09/2022
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : Ecole doctorale Ingénierie des Systèmes, Matériaux, Mécanique, Énergétique
Partenaire(s) de recherche : Laboratoire : Mathématiques et Systèmes
Equipe de recherche : CAOR - Centre de CAO et Robotique
établissement opérateur d'inscription : Mines Paris-PSL

Résumé

FR  |  
EN

Les machines sont désormais capables de reconnaître des gestes et actions situés ainsi que de les anticiper lors d'une tâche collaborative humain-robot. Néanmoins, la généralisation et l'extrapolation constituent toujours des défis de recherche pour le domaine de la reconnaissance de gestes et actions. La généralisation est un problème bien défini en apprentissage automatique. Du point de vue du mouvement humain, il est désormais possible de reconnaître des modèles de mouvement à partir d'un vocabulaire relativement restreint. Néanmoins, en raison de la nature humaine et des variations dérivées de l'exécution d'un mouvement, la généralisation peut s'avérer difficile, même avec des gestes de même difficulté et nature, par ex. différents gestes au sein du même métier. L'apprentissage multi-tâches constitue une piste très prometteuse pour l'apprentissage de mouvements primitifs qui sont récurrents pour des actions au sein du même métier ou de métiers différents. Mouvements primitifs, actions et activités pourraient être considérés comme des tâches corrélées que le réseau doit apprendre. L'extrapolation est aussi un problème bien défini qui consiste à entrainer une IA sur un certain type de données de manière à être capable de prédire sur un autre type de données. Du point de vue du mouvement humain, l'extrapolation signifierait d'entraîner la machine sur un très grand nombre de mouvements primitifs communs à différents métiers, par ex. visser, attendre, poser, tourner etc., dans le but de les reconnaître et de caractériser hiérarchiquement l'activité humaine comme une suite d'actions constituées à partir de mouvements primitifs. Le méta-apprentissage peut être une voie de recherche prometteuse en raison de sa facilité à apprendre à apprendre, déduisant ainsi à partir d'un ensemble d'actions d'autres actions inédites. La thèse vise à étudier le problème de la reconnaissance hiérarchique et simultanée des activités, actions et intentions humaines dans un contexte professionnel à l'aide de différents capteurs avec ou sans interaction avec un robot. Dans un premier temps, on s'intéressera essentiellement à la cartographie des méthodologies en a) apprentissage multi-tâche (MTL) et b) méta-apprentissage. L'objectif est de pouvoir comparer le potentiel des deux paradigmes qui, malgré leurs différences subtiles, partagent le principe de la structure partagée entre différentes tâches avec le but d'adresser les problèmes de généralisation et d'adaptation. Dans un second temps, on s'intéressera à la conceptualisation d'une architecture neuronale qui sera capable de « raisonner » en même temps en termes d'activité humaine (e.g. assemblage, packaging etc.), des actions au sein de l'activité ainsi que des intentions qui seront modélisées à l'aide du principe des mouvements primitifs. La définition de mouvements primitifs sera basée sur la liste des postures professionnelles définies par des protocoles d'évaluation ergonomique, tels que le Ergonomic Assessment WorkSheet (EAWS). La possibilité d'entrainer le ou les réseaux sur de multiples signaux (rotations, accélérations, son de l'environnement, images, etc.) provenant de différents datasets et de reconnaître seulement sur de signaux provenant de smartphones ou smartwatch est à considérer.