Analyse et reconnaissance des gestes avec un capteur RGBD
Auteur / Autrice : | Alexandre Perez |
Direction : | Christian Dan Vodislav, Hedi Tabia |
Type : | Projet de thèse |
Discipline(s) : | STIC - Cergy |
Date : | Inscription en doctorat le 05/01/2015 Soutenance le 06/12/2017 |
Etablissement(s) : | Cergy-Pontoise |
Ecole(s) doctorale(s) : | ED SI - Sciences et Ingénierie |
Partenaire(s) de recherche : | Laboratoire : Equipes Traitement de l'Information et Systèmes |
Mots clés
Mots clés libres
Résumé
L’analyse et la reconnaissance de gestes est utile dans de nombreuses applications, notamment pour les interfaces homme-machine. L’apparition de capteurs RGB-D à bas prix permet d’exploiter l’information 3D afin d’améliorer les performances des méthodes de reconnaissance d’actions basées sur les données RGB-D. Néanmoins la reconnaissance précise d’actions humaines 3D est encore un défi à cause de la variabilité des mouvements humains. Dans cette thèse, notre objectif est de fournit des solutions efficaces pour répondre à cette problématique. Dans un premier temps, nous nous concentrons sur la fusion de caractéristiques de squelettes en introduisant un descripteur basé sur la covariance de ces caractéristiques. Un processus de sélection de caractéristiques et de joints de squelette permet d’améliorer significativement la précision de notre approche. Les expériences conduites sur trois jeux de données couramment utilisés permettent de démontrer la supériorité de de notre méthode sur l’état de l’art. De plus, les résultats sur un jeu de données spécifiquement conçu pour les interactions homme-machine, AUSY Kinect V2, confirment l’efficacité de notre approche dans ce contexte. Pour améliorer d’avantage les performances des systèmes de reconnaissance d’actions, nous proposons de fusionner les prédictions de plusieurs méthodes de reconnaissance à l’aide de la théorie des fonctions de croyance. Le conflit généré lors du processus de fusion est alors utilisé pour rejeter les décisions conflictuelles. Les expériences menées démontrent la supériorité de la fusion basée sur la théorie des fonctions de croyance par rapport aux autres méthodes de fusion étudiées. Par ailleurs ces expériences montrent aussi l’efficacité du critère de rejet proposé. Finalement, nous proposons de représenter la séquence de squelette par des images capturant la trajectoire des joints du squelette. A réseaux de neurones convolutionel est entrainé avec ces images ainsi qu’avec un les descripteurs de covariance de caractéristiques. Pour améliorer les performances de cette approche, nous présentons aussi une nouvelle méthode d'enrichissement de la base de données (data augmentation) qui imite des variations réalistes des squelettes. Les tests effectués sur trois jeux de test montrent la supériorité de cette méthode comparé à l’approche par seul covariance de caractéristiques.