Structuration automatique de flux télévisuels
Auteur / Autrice : | Camille Guinaudeau |
Direction : | Pascale Sébillot |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2011 |
Etablissement(s) : | Rennes, INSA |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes) |
Partenaire(s) de recherche : | Autre partenaire : Université européenne de Bretagne (2007-2016) |
Mots clés
Résumé
L’augmentation du nombre de documents multimédias rend nécessaire la mise en place de méthodes de structuration automatique capables de faciliter l’accès à l’information contenue dans tout type de documents. Dans ce cadre, nous proposons deux types de structuration, linéaire et hiérarchique, s’appuyant sur les transcriptions automatiques de la parole prononcée dans les documents. Les transcriptions sont exploitées par le biais de méthodes issues du traitement automatiques des langues adaptées aux spécificités des transcriptions automatiques – erreurs de transcription, faible nombre de répétitions de vocabulaire – grâce à la prise en compte de connaissances linguistiques et d’informations issues de la reconnaissance automatique de la parole et du signal. Les expérimentations menées sur trois corpora composés de journaux télévisés et d’émissions de reportages montrent que ces approches conduisent à une amélioration des performances des méthodes de structuration développées.