Contributions à la reconnaissance automatique de la parole avec données manquantes

Sébastien Demange

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Contributions à la reconnaissance automatique de la parole avec données manquantes

FR |

EN

Auteur / Autrice :	Sébastien Demange
Direction :	Jean-Paul Haton
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 08/11/2007
Etablissement(s) :	Nancy 1
Ecole(s) doctorale(s) :	IAEM Lorraine
Partenaire(s) de recherche :	Laboratoire : LORIA
	EPST : INRIA
Jury :	Examinateurs / Examinatrices : Laurent Miclet, Dirk van Compernolle, Jean-Paul Haton, Noureddine Ellouze, Salvatore Tabbone, Christophe Cerisara
	Rapporteurs / Rapporteuses : Laurent Miclet, Dirk van Compernolle

Mots clés

FR

Mots clés contrôlés

Traitement automatique du langage naturel

Analyse du discours -- Informatique

Reconnaissance automatique de la parole

Mots clés libres

Robustesse

Masques

Résumé

FR |

EN

Ce mémoire propose, dans un premier temps, une introduction détaillée de la reconnaissance automatique de la parole avec données manquantes appuyée par de nombreuses références bibliographiques. Il est montré que l'estimation de masques constitue une étape cruciale. En effet, la qualité des masques estimés conditionne les performances du système de reconnaissance. L'amélioration de la fiabilité des masques constitue donc un enjeu important. Dans un second temps, les travaux menés dans le cadre de l'estimation bayésienne des masques de données manquantes sont présentés. D'une part je propose de nouveaux modèles de masques permettant de modéliser les dépendances entre les masques de différents coefficients d'un signal. Ces modèles sont évalués comparativement à un modèle de référence. Les résultats sont présentés en termes d'erreur de masques ainsi qu'en taux de reconnaissance. Les résultats montrent que ces dépendances contribuent à améliorer les taux de reconnaissance et soulignent l'importance du contexte temporel d'un masque. Je présente, dans un second temps, une nouvelle définition de masque: les masques de contribution. Ces nouveaux masques sont évalués comparativement aux masques usuellement utilisés, fondés sur le seuillage du SNR. Je montre que cette nouvelle définition permet d'améliorer l'algorithme de décodage en affinant les intervalles de marginalisation. L’évaluation, dans le cadre de la marginalisation de données et en présence d'un bruit stationnaire, montrent que les intervalles sont considérablement réduits entraînant une nette amélioration des taux de reconnaissance.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Contributions à la reconnaissance automatique de la parole avec données manquantes

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Contributions à la reconnaissance automatique de la parole avec données manquantes

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses