Reconnaissance robuste d'activités humaines par vision

Geoffrey Vaquette

Thèse Année : 2018

Robust vision based activity detection and recognition

Reconnaissance robuste d'activités humaines par vision

(1)

Geoffrey Vaquette

Fonction : Auteur

Laboratoire Vision et Ingénierie des Contenus

Résumé

This thesis focuses on supervised activity segmentation from video streams within application context of smart homes. Three semantic levels are defined, namely gesture, action and activity, this thesis focuses mainly on the latter. Based on the Deeply Optimized Hough Transform paridigm, three fusion levels are introduced in order to benefit from various modalities. A review of existing action based datasets is presented and the lack of activity detection oriented database is noticed. Then, a new dataset is introduced. It is composed of unsegmented long time range daily activities and has been recorded in a realistic environment. Finaly, a hierarchical activity detection method is proposed aiming to detect high level activities from unsupervised action detection.

Cette thèse porte sur la segmentation supervisée d'un flux vidéo en fragments correspondant à des activités de la vie quotidienne. En différenciant geste, action et activité, cette thèse s'intéresse aux activités à haut niveau sémantique telles que "Cuisiner" ou "Prendre son repas" par opposition à des actions comme "Découper un aliment". Pour cela, elle s'appuie sur l'algorithme DOHT (Deeply Optimized Hough Transform), une méthode de l'état de l'art utilisant un paradigme de vote (par transformée de Hough). Dans un premier temps, nous adaptons l'algorithme DOHT pour fusionner les informations en provenance de différents capteurs à trois niveaux différents de l'algorithme. Nous analysons l'effet de ces trois niveaux de fusion et montrons son efficacité par une évaluation sur une base de données composée d'actions de la vie quotidienne. Ensuite, une étude des jeux de données existant est menée. Constatant le manque de vidéos adaptées à la segmentation et classification (détection) d'activités à haut niveau sémantique, une nouvelle base de données est proposée. Enregistrée dans un environnement réaliste et dans des conditions au plus proche de l'application finale, elle contient des vidéos longues et non découpées adaptées à un contexte de détection. Dans un dernier temps, nous proposons une approche hiérarchique à partir d'algorithmes DOHT pour reconnaître les activités à haut niveau sémantique. Cette approche à deux niveaux décompose le problème en une détection non-supervisée d'actions pour ensuite détecter les activités désirées.

Mots clés

Activity detection Information fusion HOUGH transform Database Segmentation Hierarchical detection

Détection d’activités Fusion d’informations Transformée de HOUGH Jeu de données Segmentation Détection hiérarchique

Domaines

Base de données [cs.DB]

Fichier principal

these_archivage_3479085_Geoffrey_VAQUETTE.pdf (32.41 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-02480342

Soumis le : dimanche 16 février 2020-01:01:21

Dernière modification le : mercredi 3 avril 2024-11:14:12

Archivage à long terme le : dimanche 17 mai 2020-12:41:27

Dates et versions

tel-02480342 , version 1 (16-02-2020)

Identifiants

HAL Id : tel-02480342 , version 1

Citer

Geoffrey Vaquette. Reconnaissance robuste d'activités humaines par vision. Base de données [cs.DB]. Sorbonne Université, 2018. Français. ⟨NNT : 2018SORUS090⟩. ⟨tel-02480342⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CEA STAR DRT CEA-UPSAY UNIV-PARIS-SACLAY LIST SORBONNE-UNIVERSITE THESES-SU SU-SCIENCES GS-ENGINEERING GS-COMPUTER-SCIENCE GS-SPORT-HUMAN-MOVEMENT

255 Consultations

34 Téléchargements

Robust vision based activity detection and recognition

Reconnaissance robuste d'activités humaines par vision

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager