A study on the integration of phonetic landmarks into large vocabulary continuous speech decoding

Stefan Ziegler

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Une étude sur l'intégration de repères phonétiques dans le décodage de la parole continue à grand vocabulaire

FR |

EN

Auteur / Autrice :	Stefan Ziegler
Direction :	Guillaume Gravier
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 17/01/2014
Etablissement(s) :	Rennes 1
Ecole(s) doctorale(s) :	École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes)
Partenaire(s) de recherche :	Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes)
	PRES : Université européenne de Bretagne (2007-2016)

Mots clés

FR |

EN

Mots clés contrôlés

Reconnaissance automatique de la parole

Mots clés libres

Reconnaissance automatique de la parole

Reconnaissance guidée par des repères phonétique

Décodage de la parole

Résumé

FR |

EN

Cette thèse étudie l'intégration de repères phonétiques dans la reconnaissance automatique de la parole (RAP) continue à grand vocabulaire. Les repères sont des événements à temps discret indiquant la présence d’événements phonétiques dans le signal de parole. Le but est de développer des détecteurs de repères qui sont motivés par la connaissance phonétique afin de modéliser quelques événements phonétiques plus précisément. La thèse présente deux approches de détection de repères, qui utilisent l'information extraite par segments et étudie deux méthodes différentes pour intégrer les repères dans le décodage, qui sont un élagage basé sur les repères et une approche reposant sur les combinaisons pondérées. Alors que les deux approches de détection de repères présentées améliorent les performance de reconnaissance de la parole comparées à l'approche de référence, elles ne surpassent pas les prédictions phonétiques standards par trame. Ces résultats indiquant que la RAP guidée par des repères nécessite de l'information phonétique très hétérogène pour être efficace, la thèse présente une troisième méthode d'intégration conçue pour intégrer un nombre arbitraire de flux de repères hétérogènes et asynchrones dans la RAP. Les résultats indiquent que cette méthode est en effet en mesure d'améliorer le système de référence, pourvu que les repères fournissent de l'information complémentaire aux modèles acoustiques standards.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Une étude sur l'intégration de repères phonétiques dans le décodage de la parole continue à grand vocabulaire

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Une étude sur l'intégration de repères phonétiques dans le décodage de la parole continue à grand vocabulaire

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses