Thèse en cours

Interactions homme-robot situées en environnement social guidées par les perceptions audio-visuelles

FR  |  
EN
Auteur / Autrice : Virgile Sucal
Direction : Fabrice Lefevre
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 05/09/2022
Etablissement(s) : Avignon
Ecole(s) doctorale(s) : Agrosciences et Sciences
Partenaire(s) de recherche : Laboratoire : LIA - Laboratoire d'Informatique d'Avignon
Equipe de recherche : SLG - Speech and Language Group

Résumé

FR  |  
EN

L'objectif principal du projet est d'accroître les capacités d'interaction orale d'un robot humanoïde avec des humains dans un contexte social réaliste. Notre approche consiste à développer une capacité d'autogestion de sa communication, basée sur la perception audio-visuelle de son environnement. En pratique nous envisageons de dédier un ou plusieurs robots à la gestion d'un espace social entier (salle de musée, puis salle de cours). L'enjeu est que le robot puisse se déplacer et interagir avec les humains présents, en complète autonomie. Pour cela ses décisions seront contrôlées par une stratégie basée sur ses observations audio-visuelles (micros et caméras). Cette stratégie va être apprise automatiquement afin d'optimiser, selon des critères objectifs et subjectifs précis, la réalisation des différentes tâches prévues dans l'emploi du robot. Notre méthodologie consistera en pratique à concevoir les systèmes d'interactions finaux pour les tâches (les actions) puis à les intégrer dans un modèle hiérarchique (le contrôleur) qui utilise les informations perceptuelles (les états) pour organiser la planification, l'activation et le suivi du déroulement des tâches. Définir les actions et les états présente encore quelques difficultés de mise en œuvre mais est atteignable avec les travaux récents du domaine. Le contrôleur fera l'objet des propositions scientifiques majeures de la thèse : la fusion des modalités audio et visuelle contraintes par la tâche et l'apprentissage par renforcement d'une stratégie hiérarchique en ligne, toutes les deux basées sur le recours à des solutions à base de réseaux de neurones profonds.