Analyse et reconnaissance de séquences vidéos d'activités humaines dans l'espace sémantique
Auteur / Autrice : | Cyrille Beaudry |
Direction : | Laurent Mascarilla, Renaud Péteri |
Type : | Thèse de doctorat |
Discipline(s) : | Automatique, image et signal |
Date : | Soutenance le 26/11/2015 |
Etablissement(s) : | La Rochelle |
Ecole(s) doctorale(s) : | École doctorale Sciences et ingénierie pour l'information, mathématiques (Limoges ; 2009-2018) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Mathématiques, Image et Applications (La Rochelle) |
Jury : | Président / Présidente : Mohamed Daoudi |
Examinateurs / Examinatrices : Laurent Mascarilla, Renaud Péteri, Mohamed Daoudi, François Brémond, Jenny Benois Pineau, Ewa Kijak | |
Rapporteur / Rapporteuse : François Brémond, Jenny Benois Pineau |
Résumé
Dans cette thèse, nous nous intéressons à la caractérisation et la reconnaissance d'activités humaines dans des vidéos. L'intérêt grandissant en vision par ordinateur pour cette thématique est motivé par une grande variété d'applications telles que l'indexation automatique de vidéos, la vidéo-surveillance, ou encore l'assistance aux personnes âgées. Dans la première partie de nos travaux, nous développons une méthode de reconnaissance d'actions élémentaires basée sur l'estimation du mouvement dans des vidéos. Les points critiques du champ vectoriel obtenu, ainsi que leurs trajectoires, sont estimés à différentes échelles spatio-temporelles. La fusion tardive de caractéristiques d'orientation de mouvement et de variation de gradient, dans le voisinage des points critiques, ainsi que la description fréquentielle des trajectoires, nous permet d'obtenir des taux de reconnaissance parmi les meilleurs de la littérature. Dans la seconde partie, nous construisons une méthode de reconnaissance d'activités en considérant ces dernières comme un enchainement temporel d'actions élémentaires. Notre méthode de reconnaissance d'actions est utilisée pour calculer la probabilité d'actions élémentaires effectuées au cours du temps. Ces séquences de probabilité évoluent sur une variété statistique appelée simplexe sémantique. Une activité est finalement représentée comme une trajectoire dans cet espace. Nous introduisons un descripteur fréquentiel de trajectoire pour classifier les différentes activités humaines en fonction de la forme des trajectoires associées. Ce descripteur prend en compte la géométrie induite par le simplexe sémantique.