Thèse soutenue

Segmentation de personnes dans les images et les vidéos

FR  |  
EN
Auteur / Autrice : Cyrille Migniot
Direction : Jean-Marc ChasseryPascal Bertolino
Type : Thèse de doctorat
Discipline(s) : Sciences et technologie industrielles
Date : Soutenance le 17/01/2012
Etablissement(s) : Grenoble
Ecole(s) doctorale(s) : École doctorale électronique, électrotechnique, automatique, traitement du signal (Grenoble ; 199.-....)
Partenaire(s) de recherche : Equipe de recherche : Grenoble Images Parole Signal Automatique
Jury : Président / Présidente : William (bill) Triggs
Examinateurs / Examinatrices : Jean-Marc Chassery, Pascal Bertolino, François Bremond, Tien Le van, Muriel Ney
Rapporteur / Rapporteuse : Jean-louis Dillenseger, Sylvie Philipp-foliguet, Jose Teixeira

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

La segmentation de personnes dans les images et les vidéos est une problématique actuellement au coeur de nombreux travaux. Nous nous intéressons à la segmentation de personnes debout. Pour cela, nous avons mis au point deux méthodes originales : La première est une continuation d'une méthode de détection efficace. On réalise une pré-segmentation en associant aux segments de contour de l'image une valeur de vraisemblance en tant qu'élément d'une silhouette humaine par une combinaison d'histogrammes de gradients orientés (HOG) et de machines à vecteurs de support (SVM) prises à l'échelle des ces segments. Une recherche d'arbre optimal dans un graphe intégrant les données de la pré-segmentation permet de reconstruire la silhouette de la personne. Enfin, une utilisation itérative de ce processus permet d'en améliorer la performance. La seconde méthode prend en compte l'interaction de l'utilisateur pour une image. Une coupe de graphe est guidée par un gabarit non binaire représentant une silhouette humaine. Nous proposons également un gabarit par parties pour s'adapter à la posture de la personne. Nous avons enfin transposé cette méthode à la segmentation de vidéos et la réalisation automatique de trimaps.