Représentations hiérarchiques et discriminantes pour la reconnaissance des formes, l'identification des personnes et l'analyse des mouvements dans les séquences d'images
Auteur / Autrice : | Nicolas Thome |
Direction : | Serge Miguet |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2007 |
Etablissement(s) : | Lyon 2 |
Mots clés
Résumé
L'analyse automatique de vidéos est un domaine qui a connu un essor fulgurant au cours des dix dernières années. Nous proposons d'aborder le problème de l'analyse des séquences d'images autour de deux thèmes principaux : la lecture de plaques minéralogiques et l'analyse du mouvement humain. La méthode que nous proposons pour la lecture de plaques se décompose autour des étapes suivante : localisation de la plaque, binarisation, extraction des caractères, reconnaissance et moyennage temporel. L'approche que nous proposons pour l'analyse du mouvement humain se situe à un niveau intermédiaire entre les méthodes génératives et les approches discriminantes. Dans les cas où un suivi région peut être assuré sans ambiguïté, une méthode est mise en place pour détecter et étiquetér les différentes parties visibles du corps de chaque personne. Ceci permet à chaque instant de capturer un ensemble de caractéristiques de forme, de couleur et de texture sur chaque membre, conduisant à la mise à jour dynamique d'un modèle d'apparence articulé. Ce dernier sera ensuite utilisé dans des situations difficiles pour effectuer une identification des personnes. En ce qui concerne l'analyse du mouvement humain, nous proposons une approche dédiée à la détection de chutes dont la contribution se décompose en deux points : d'une part, nous proposons une étude de la pertinence d'un détecteur de verticalité calculé à partir d'une caractéristique image pour discriminer les postures couché et debout. Le second point central de la détection de chutes repose sur l'utilisation d'un Modèle de Markov Caché Hiérarchique (HHMM) pour interpréter la séquence angulaire observée.