Détection automatique des mouvements de caméra et des régions de textes pour la structuration et l'indexation de documents audiovisuels
Auteur / Autrice : | Hae-Kwang Kim |
Direction : | Philippe Aigrain |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 1997 |
Etablissement(s) : | Toulouse 3 |
Résumé
Le travail de recherche presente dans le rapport de these a pour perspective la proposition d'une interface utilisateur basee sur la manipulation directe d'un document audiovisuel. Dans un premier temps, nous traiterons les caracteristiques et les activites autour des documents audiovisuels et les problematiques generales du traitement informatique des documents audiovisuels. Ensuite, nous presenterons differents interface utilisateurs de la manipulation des documents audiovisuels. Pour realiser ces interfaces utilisateurs, les documents audiovisuels doivent etre prealablement structures et indexes. Du fait des difficultes de la structuration et l'indexation par l'etre humain (la quantite immense de donnees, le cout de la main d'uvre, la subjectivite et la nature monotone et fatigante des travaux), des methodes automatiques et efficaces sont demandees. Nous verrons les differents travaux de la structuration et l'indexation des documents audiovisuels. La detection des mouvements de camera est importante pour l'indexation parce qu'ils sont souvent charges de significations semantiques et participent au langage cinematographique en exprimant les intentions du realisateur et du cameraman. De meme, la micro-segmentation d'un plan par les segments de mouvements de camera homogenes est utile pour la structuration en permettant une manipulation plus souple et plus detaillee des documents audiovisuels. Nous presenterons une methode efficace de detection automatique des mouvements de camera utilisant des images spatio-temporelles appelees image x-ray simplifiee suivant des concepts introduits par y. Tonomura et al. Les images de texte (sous-titres, inter-titres, etc) dans les documents audiovisuels portent des informations linguistiques tres importants et nous presenterons une methode automatique et efficace de detection et location pour l'acces base sur le contenu de documents audiovisuels et son application