Thèse soutenue

Catégorisation par le contenu sémantique d'objets vidéo : recherche et reconnaissance d'acteurs dans les films

FR  |  
EN
Auteur / Autrice : Shuji Zhao
Direction : Frédéric PreciosoMatthieu CordSylvie Philipp-Foliguet
Type : Thèse de doctorat
Discipline(s) : STIC (sciences et technologies de l'information et de la communication)
Date : Soutenance le 10/06/2011
Etablissement(s) : Cergy-Pontoise
Ecole(s) doctorale(s) : École doctorale Sciences et ingénierie (Cergy-Pontoise, Val d'Oise)
Partenaire(s) de recherche : Laboratoire : Equipes Traitement de l'Information et Systèmes (Cergy-Pontoise, Val d'Oise ; 2002-....)
Jury : Examinateurs / Examinatrices : Frédéric Precioso, Matthieu Cord, Sylvie Philipp-Foliguet, Nicole Vincent, Ivan Laptev
Rapporteurs / Rapporteuses : Patrick Pérez, Leonardi Riccardo

Résumé

FR  |  
EN

Dans cette thèse, nous proposons un nouveau système de recherche par le contenu de catégories sémantiques d'objets vidéo.A partir des séquences vidéo, nous détectons et extrayons les régions contenant le même objet (visage d'une personne, un modèle de voiture, etc.) au cours d'un plan-séquence. A partir de ce volume, appelé Track, nous extrayons un ensemble de caractéristiques visuelles spatio-temporellement cohérentes qui forme ainsi un Tube Spatio-Temporel représentant l'objet.Pour évaluer la similarité entre Tubes Spatio-Temporels, nous concevons des fonctions noyaux dédiées. À partir de ces noyaux, nous proposons des stratégies d'apprentissage supervisé et interactif, intégrées dans un cadre Machine à Vecteurs de Supports.Notre approche est évaluée sur des bases de données de films réels. Elle surpasse les méthodes de l'état de l'art pour la reconnaissance d'acteurs multi-classes. Notre méthode est également testée pour la recherche interactive d'un acteur dans une base de vidéo et sur une base de données de voitures, illustrant ainsi la généricité de la méthode et ses possibles extensions à tout type d'objets vidéo.