Thèse soutenue

Modèles robustes et efficaces pour la reconnaissance d'action et leur localisation

FR  |  
EN
Auteur / Autrice : Dan Oneata
Direction : Cordelia SchmidJakob Verbeek
Type : Thèse de doctorat
Discipline(s) : Mathématiques appliquées
Date : Soutenance le 20/07/2015
Etablissement(s) : Université Grenoble Alpes (ComUE)
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 199.-....)
Partenaire(s) de recherche : Laboratoire : LEAR - Learning and recognition in vision
Jury : Examinateurs / Examinatrices : Cees Snoek
Rapporteurs / Rapporteuses : Jason Corso, Thomas Brox

Résumé

FR  |  
EN

Vidéo d'interprétation et de compréhension est l'un des objectifs de recherche à long terme dans la vision par ordinateur. Vidéos réalistes tels que les films présentent une variété de problèmes difficiles d'apprentissage machine, telles que la classification d'action / récupération d'action, de suivi humaines, la classification interaction homme / objet, etc Récemment robustes descripteurs visuels pour la classification vidéo ont été développés, et ont montré qu'il est possible d'apprendre classificateurs visuels réalistes des paramètres difficile. Toutefois, afin de déployer des systèmes de reconnaissance visuelle à grande échelle dans la pratique, il devient important d'aborder l'évolutivité des techniques. L'objectif principal est cette thèse est de développer des méthodes évolutives pour l'analyse de contenu vidéo (par exemple pour le classement ou la classification).