Human pose estimation and action recognition by multi-robot systems

Emre Dogan

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Estimation de pose humaine et reconnaissance d’action par un système multi-robots

FR |

EN

Auteur / Autrice :	Emre Dogan
Direction :	Atilla Baskurt, Christian Wolf
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 07/07/2017
Etablissement(s) :	Lyon
Ecole(s) doctorale(s) :	École doctorale InfoMaths (Lyon ; 2009-....)
Partenaire(s) de recherche :	établissement opérateur d'inscription : Institut national des sciences appliquées (Lyon ; 1957-....)
	Laboratoire : Laboratoire d'InfoRmatique en Images et Systèmes d'information (Ecully, Rhône ; 2003-....) - Laboratoire d'InfoRmatique en Image et Systèmes d'information / LIRIS
Jury :	Président / Présidente : Denis Pellerin
	Examinateurs / Examinatrices : Atilla Baskurt, Christian Wolf, Denis Pellerin, David Fofi, Nicole Vincent, Christophe Ducottet, Gonen Eren, Céline Teulière
	Rapporteur / Rapporteuse : David Fofi, Nicole Vincent

Mots clés

FR |

EN

Mots clés contrôlés

Reconnaissance gestuelle

Mots clés libres

Informatique

Reconnaissance de mouvement

Reconnaissance d'actions

Estimation de la pose humaine

Mutlivues

Résumé

FR |

EN

L'estimation de la pose humaine et la reconnaissance des activités humaines sont des étapes importantes dans de nombreuses applications comme la robotique, la surveillance et la sécurité, etc. Actuellement abordées dans le domaine, ces tâches ne sont toujours pas résolues dans des environnements non-coopératifs particulièrement. Ces tâches admettent de divers défis comme l'occlusion, les variations des vêtements, etc. Les méthodes qui exploitent des images de profondeur ont l’avantage concernant les défis liés à l'arrière-plan et à l'apparence, pourtant, l’application est limitée pour des raisons matérielles. Dans un premier temps, nous nous sommes concentrés sur la reconnaissance des actions complexes depuis des vidéos. Pour ceci, nous avons introduit une représentation spatio-temporelle indépendante du point de vue. Plus précisément, nous avons capturé le mouvement de la personne en utilisant un capteur de profondeur et l'avons encodé en 3D pour le représenter. Un descripteur 3D a ensuite été utilisé pour la classification des séquences avec la méthodologie bag-of-words. Pour la deuxième partie, notre objectif était l'estimation de pose articulée, qui est souvent une étape intermédiaire pour la reconnaissance de l'activité. Notre motivation était d'incorporer des informations à partir de capteurs multiples et de les fusionner pour surmonter le problème de l'auto-occlusion. Ainsi, nous avons proposé un modèle de flexible mixtures-of-parts multi-vues inspiré par la méthodologie classique de structure pictural. Nous avons démontré que les contraintes géométriques et les paramètres de cohérence d'apparence sont efficaces pour renforcer la cohérence entre les points de vue, aussi que les paramètres classiques. Finalement, nous avons évalué ces nouvelles méthodes sur des datasets publics, qui vérifie que l'utilisation de représentations indépendantes de la vue et l'intégration d'informations à partir de points de vue multiples améliore la performance pour les tâches ciblées dans le cadre de cette manuscrit.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Estimation de pose humaine et reconnaissance d’action par un système multi-robots

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Estimation de pose humaine et reconnaissance d’action par un système multi-robots

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses