Thèse en cours

Analyse et reconnaissance des gestes avec un capteur RGBD

FR  |  
EN

Accès à la thèse

AttentionLa soutenance a eu lieu le 06/12/2017. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Alexandre Perez
Direction : Christian Dan VodislavHedi Tabia
Type : Projet de thèse
Discipline(s) : STIC - Cergy
Date : Inscription en doctorat le 05/01/2015
Soutenance le 06/12/2017
Etablissement(s) : Cergy-Pontoise
Ecole(s) doctorale(s) : ED SI - Sciences et Ingénierie
Partenaire(s) de recherche : Laboratoire : Equipes Traitement de l'Information et Systèmes

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L’analyse et la reconnaissance de gestes est utile dans de nombreuses applications, notamment pour les interfaces homme-machine. L’apparition de capteurs RGB-D à bas prix permet d’exploiter l’information 3D afin d’améliorer les performances des méthodes de reconnaissance d’actions basées sur les données RGB-D. Néanmoins la reconnaissance précise d’actions humaines 3D est encore un défi à cause de la variabilité des mouvements humains. Dans cette thèse, notre objectif est de fournit des solutions efficaces pour répondre à cette problématique. Dans un premier temps, nous nous concentrons sur la fusion de caractéristiques de squelettes en introduisant un descripteur basé sur la covariance de ces caractéristiques. Un processus de sélection de caractéristiques et de joints de squelette permet d’améliorer significativement la précision de notre approche. Les expériences conduites sur trois jeux de données couramment utilisés permettent de démontrer la supériorité de de notre méthode sur l’état de l’art. De plus, les résultats sur un jeu de données spécifiquement conçu pour les interactions homme-machine, AUSY Kinect V2, confirment l’efficacité de notre approche dans ce contexte. Pour améliorer d’avantage les performances des systèmes de reconnaissance d’actions, nous proposons de fusionner les prédictions de plusieurs méthodes de reconnaissance à l’aide de la théorie des fonctions de croyance. Le conflit généré lors du processus de fusion est alors utilisé pour rejeter les décisions conflictuelles. Les expériences menées démontrent la supériorité de la fusion basée sur la théorie des fonctions de croyance par rapport aux autres méthodes de fusion étudiées. Par ailleurs ces expériences montrent aussi l’efficacité du critère de rejet proposé. Finalement, nous proposons de représenter la séquence de squelette par des images capturant la trajectoire des joints du squelette. A réseaux de neurones convolutionel est entrainé avec ces images ainsi qu’avec un les descripteurs de covariance de caractéristiques. Pour améliorer les performances de cette approche, nous présentons aussi une nouvelle méthode d'enrichissement de la base de données (data augmentation) qui imite des variations réalistes des squelettes. Les tests effectués sur trois jeux de test montrent la supériorité de cette méthode comparé à l’approche par seul covariance de caractéristiques.