Détection et indexation d'objets en mouvement pour l'analyse de comportements par interprétation de signaux vidéo et audio
Auteur / Autrice : | Alessia Saggese |
Direction : | Luc Brun |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique et applications |
Date : | Soutenance en 2014 |
Etablissement(s) : | Caen |
Ecole(s) doctorale(s) : | École doctorale structures, informations, matière et matériaux (Caen ; 1992-2016) |
Partenaire(s) de recherche : | Laboratoire : Groupe de recherche en informatique, image, automatique et instrumentation de Caen (1995-....) |
Jury : | Président / Présidente : Mario Vento |
Examinateurs / Examinatrices : Luc Brun, Mario Vento, Nicolai Petkov, Francesc Serratosa, Francesco Tortorella, Salvatore-Antoine Tabbone | |
Rapporteur / Rapporteuse : Nicolai Petkov, Francesc Serratosa |
Mots clés
Mots clés contrôlés
Résumé
Dans les dernières décennies, nous avons été témoin d'un besoin grandissant de sécurité dans les espaces publics. La limitation principale induite par les systèmes de vidéo surveillance réside dans la surcharge cognitive des opérateurs humains chargés de la sécurité, ce qui diminue leur capacités à analyser le flux d'information émanant de sources multimédia multiples. Pour ces raisons, nous proposons dans cette thèse un système de surveillance intelligent capable d'associer des images et des vidéos à une interprétation sémantique afin de faire le lien entre des représentations bas niveau, sous forme de pixels, et le haut niveau correspondant à une description en langage naturel qu'un être humain pourrait faire d'une scène. Plus précisément, les travaux proposés débutent par l'analyse des vidéos et par l'extraction des trajectoires des objets présents dans la scène. Une fois extraites, ce grand nombre de trajectoires doit être indexé et stocké afin d'augmenter la performance du système durant la phase de reconnaissance. En outre, l'opérateur humain est informé immédiatement si un comportement anormal est observé. Tandis que l'information extraite des vidéos n'est pas suffisante ou n'est pas suffisamment fiable, le système proposé est enrichi par un module en charge de la reconnaissance des événements sonores tels que des tirs, des cris ou des vitres cassées. Chaque module proposé a été à la fois testé sur des jeux de données standards mais aussi dans un environnement réel ; les résultats obtenus, tout comme l'application des méthodes proposées dans un contexte réel, permettent de confirmer la contribution de nos travaux à l'état de l'art.