Structuration intra-programme de contenus TV
Auteur / Autrice : | Alina Elma Abduraman |
Direction : | Bernard Merialdo |
Type : | Thèse de doctorat |
Discipline(s) : | Signal et images |
Date : | Soutenance le 21/05/2013 |
Etablissement(s) : | Paris, ENST |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris (1992-...) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Traitement et Communication de l'Information (Paris) / LTCI |
Jury : | Président / Présidente : Matthieu Cord |
Examinateurs / Examinatrices : Sid-Ahmed Berrani, Jean Carrive | |
Rapporteurs / Rapporteuses : Guillaume Gravier, Philippe Joly |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Les programmes TV possède une structure qui, en général, est perdue quand les programmes sont diffusés. Les programmes qui ont été enregistrés via un enregistreur vidéo personnel ou disponibles via des services comme la TV à la demande, ne peuvent être visionnés que d’une façon linéaire. La navigation y est réalisée en utilisant les fonctions basiques d’avance/retour rapide. Dans ce contexte, la structuration automatique de programmes TV apporte une solution originale. En retrouvant la structure d’origine du programme, elle permet d’offrir aux utilisateurs des outils de navigation originaux. Elle peut également servir pour d’autres applications comme la construction des résumés vidéo, l’indexation et la recherche…Cette thèse s’intéresse ainsi à la structuration automatique des programmes TV. L’objectif est de retrouver automatiquement la structure d’origine d’un programme en déterminant le début et la fin de chaque partie qui le compose. L’approche proposée est complètement non-supervisée et adresse une large catégorie de programmes TV comme les jeux, les magazines, les journaux TV… Cette approche exploite les « séparateurs » qui sont de séquences courtes insérées dans les programmes pour en délimiter les différentes parties. Pour cela, une détection des récurrences audio et visuelles est réalisée sur un ensemble d’épisodes du même programme. Ces récurrences sont ensuite classées à l’aide d’arbres de décision pour en extraire les séparateurs. Les attributs utilisés pour la construction des arbres de décision porte sur la détection des applaudissements, la segmentation en scènes, la détection et le clustering des visages et des locuteurs.