Suivi long terme de personnes pour les systèmes de vidéo monitoring
Auteur / Autrice : | Thi Lan Anh Nguyen |
Direction : | François Brémond |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 17/07/2018 |
Etablissement(s) : | Université Côte d'Azur (ComUE) |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....) |
Partenaire(s) de recherche : | établissement de préparation : Université de Nice (1965-2019) |
Laboratoire : Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes) - Spatio-Temporal Activity Recognition Systems | |
Jury : | Président / Présidente : Frédéric Precioso |
Examinateurs / Examinatrices : Frédéric Precioso, Jordi Gonzàlez, Serge Miguet, Jean-Marc Odobez | |
Rapporteurs / Rapporteuses : Jordi Gonzàlez, Serge Miguet, Jean-Marc Odobez |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Le suivi d'objets multiples (Multiple Object Tracking (MOT)) est une tâche importante dans le domaine de la vision par ordinateur. Plusieurs facteurs tels que les occlusions, l'éclairage et les densités d'objets restent des problèmes ouverts pour le MOT. Par conséquent, cette thèse propose trois approches MOT qui se distinguent à travers deux propriétés : leur généralité et leur efficacité.La première approche sélectionne automatiquement les primitives visions les plus fiables pour caractériser chaque tracklet dans une scène vidéo. Aucun processus d’apprentissage n'est nécessaire, ce qui rend cet algorithme générique et déployable pour une grande variété de systèmes de suivi.La seconde méthode règle les paramètres de suivi en ligne pour chaque tracklet, en fonction de la variation du contexte qui l’entoure. Il n'y a pas de contraintes sur le nombre de paramètres de suivi et sur leur dépendance mutuelle. Cependant, on a besoin de données d'apprentissage suffisamment représentatives pour rendre cet algorithme générique.La troisième approche tire pleinement avantage des primitives visions (définies manuellement ou apprises), et des métriques définies sur les tracklets, proposées pour la ré-identification et leur adaptation au MOT. L’approche peut fonctionner avec ou sans étape d'apprentissage en fonction de la métrique utilisée.Les expériences sur trois ensembles de vidéos, MOT2015, MOT2017 et ParkingLot montrent que la troisième approche est la plus efficace. L'algorithme MOT le plus approprié peut être sélectionné, en fonction de l'application choisie et de la disponibilité de l’ensemble des données d'apprentissage.