Thèse soutenue

Suivi long terme de personnes pour les systèmes de vidéo monitoring

FR  |  
EN
Auteur / Autrice : Thi Lan Anh Nguyen
Direction : François Brémond
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 17/07/2018
Etablissement(s) : Université Côte d'Azur (ComUE)
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....)
Partenaire(s) de recherche : établissement de préparation : Université de Nice (1965-2019)
Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) - Spatio-Temporal Activity Recognition Systems
Jury : Président / Présidente : Frédéric Precioso
Examinateurs / Examinatrices : Frédéric Precioso, Jordi Gonzàlez, Serge Miguet, Jean-Marc Odobez
Rapporteurs / Rapporteuses : Jordi Gonzàlez, Serge Miguet, Jean-Marc Odobez

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Le suivi d'objets multiples (Multiple Object Tracking (MOT)) est une tâche importante dans le domaine de la vision par ordinateur. Plusieurs facteurs tels que les occlusions, l'éclairage et les densités d'objets restent des problèmes ouverts pour le MOT. Par conséquent, cette thèse propose trois approches MOT qui se distinguent à travers deux propriétés : leur généralité et leur efficacité.La première approche sélectionne automatiquement les primitives visions les plus fiables pour caractériser chaque tracklet dans une scène vidéo. Aucun processus d’apprentissage n'est nécessaire, ce qui rend cet algorithme générique et déployable pour une grande variété de systèmes de suivi.La seconde méthode règle les paramètres de suivi en ligne pour chaque tracklet, en fonction de la variation du contexte qui l’entoure. Il n'y a pas de contraintes sur le nombre de paramètres de suivi et sur leur dépendance mutuelle. Cependant, on a besoin de données d'apprentissage suffisamment représentatives pour rendre cet algorithme générique.La troisième approche tire pleinement avantage des primitives visions (définies manuellement ou apprises), et des métriques définies sur les tracklets, proposées pour la ré-identification et leur adaptation au MOT. L’approche peut fonctionner avec ou sans étape d'apprentissage en fonction de la métrique utilisée.Les expériences sur trois ensembles de vidéos, MOT2015, MOT2017 et ParkingLot montrent que la troisième approche est la plus efficace. L'algorithme MOT le plus approprié peut être sélectionné, en fonction de l'application choisie et de la disponibilité de l’ensemble des données d'apprentissage.