Indexation vocale à vocabulaire illimité à base de décodage phonétique : application à la détection de clés vocales dans un flux de paroles
| Auteur / Autrice : | Stéphane Peillon |
| Direction : | Renato De Mori |
| Type : | Thèse de doctorat |
| Discipline(s) : | Informatique |
| Date : | Soutenance en 2002 |
| Etablissement(s) : | Avignon |
Mots clés
Résumé
Le stockage de données multimédia est aujourd'hui confronté au manque d'outils efficaces d'extraction et de tri de documents. Dans le cadre particulier de données vocales, nous proposons une technique d'indexation permettant de retrouver des documents sonores à partir de leur seul contenu. La pose d'index appropriés sur le médium permet de réduire considérablement l'information nécessaire a posteriori pour la phase de recherche d'une clé. Nous comparons deux modes d'indexation à base d'index phonétiques: l'un repose sur la meilleure séquence possible de phonèmes, l'autre sur des échelles d'hypothèses phonétiques produites sur une segmentation automatique a priori du corpus. Ce deuxième mode, désigné ''treillis synchrone de phonèmes'', offre de meilleures performances avec un faible surcoût de calcul, et conduit à un apprentissage réduit des paramètres du moteur de recherche. La technique présentée permet en outre la détection de clés vocales aussi bien dans un corpus vocal que textuel