Thèse soutenue

Structuration automatique de flux télévisuels

FR  |  
EN
Auteur / Autrice : Camille Guinaudeau
Direction : Pascale Sébillot
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2011
Etablissement(s) : Rennes, INSA
Ecole(s) doctorale(s) : École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes)
Partenaire(s) de recherche : autre partenaire : Université européenne de Bretagne (2007-2016)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

L’augmentation du nombre de documents multimédias rend nécessaire la mise en place de méthodes de structuration automatique capables de faciliter l’accès à l’information contenue dans tout type de documents. Dans ce cadre, nous proposons deux types de structuration, linéaire et hiérarchique, s’appuyant sur les transcriptions automatiques de la parole prononcée dans les documents. Les transcriptions sont exploitées par le biais de méthodes issues du traitement automatiques des langues adaptées aux spécificités des transcriptions automatiques – erreurs de transcription, faible nombre de répétitions de vocabulaire – grâce à la prise en compte de connaissances linguistiques et d’informations issues de la reconnaissance automatique de la parole et du signal. Les expérimentations menées sur trois corpora composés de journaux télévisés et d’émissions de reportages montrent que ces approches conduisent à une amélioration des performances des méthodes de structuration développées.