Toward Generalizable, Training-Light Multi-Object Tracking: Diagnostics, Regulated Appearance Cues, and Mask-Enhanced & Learned Association
| Auteur / Autrice : | Tomasz Stanczyk |
| Direction : | François Bremond |
| Type : | Projet de thèse |
| Discipline(s) : | Automatique traitement du signal et des images |
| Date : | Inscription en doctorat le 01/02/2023 |
| Etablissement(s) : | Université Côte d'Azur |
| Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication |
| Partenaire(s) de recherche : | Laboratoire : Spatio-Temporal Activity Recognition Systems |
Mots clés
Mots clés libres
Résumé
Ma thèse vise une détection-suivi multi-objets (MOT) robuste, généralisable et training-light, avec un accent sur les scènes sportives et les foules. Elle s'appuie sur trois axes complémentaires : (1) Diagnostic des traqueurs modernes tracking-by-detection : mise en évidence des échecs récurrents (switch d'identité, fragmentation, non-généralisation) et recommandation d'évaluations valorisant la couverture de trajectoires. (2) Évaluation contrôlée du re-identification (re-ID) : analyse des conditions où l'apparence aide réellement, et des cas (occlusion, petite échelle) où elle nuit ; proposition d'un usage sélectif et contraint plutôt qu'une fusion systématique. (3) McByte, une méthode sans entraînement qui exploite la propagation temporelle de masques comme indice d'association avec des politiques d'ambiguïté/isolement ; résultats compétitifs sur plusieurs jeux de données sans réglage par séquence et adoption par la communauté. Les travaux en cours étendent ces contributions : McByte++ améliore la vitesse et la continuité d'identité lors des sorties/retours par une re-ID gated (visibilité/échelle/occlusion), tout en restant générique ; parallèlement, l'explainabilité de CAMELTrack introduit des tokens transformeurs spécifiques aux indices (mouvement, apparence, pose) afin d'attribuer, pour chaque association, la contribution de chaque indice. L'objectif global est de réduire l'écart entre heuristiques TbD et association apprise, en combinant indices génériques et interprétables avec une durabilité d'identité adaptée à la pratique. Les livrables incluent code, métriques, outils d'attribution et un manuscrit intégrant diagnostic, lignes directrices sur le re-ID, McByte/McByte++ et l'explainabilité de CAMELTrack.