Traitement automatique de la parole en milieu bruité : Etude de modèles connexionnistes statiques et dynamiques
Auteur / Autrice : | Laurent Buniet |
Direction : | Jean-Marie Pierrel |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 1997 |
Etablissement(s) : | Nancy 1 |
Partenaire(s) de recherche : | Autre partenaire : Université Henri Poincaré Nancy 1. Faculté des sciences et techniques |
Mots clés
Résumé
L'état actuel des développements dans le domaine de la reconnaissance automatique de la parole permet de disposer dès aujourd'hui de systèmes de reconnaissances limités. Au rang des limites de tels systèmes se trouvent les conditions imposées par l'environnement sonore qui détériorent le signal et donc les capacités de reconnaissance. Pour pallier ce problème dans le cadre de petits vocabulaires en parole continue, nous avons mis en œuvre un système de reconnaissance scindé en trois parties. La première partie permet d'isoler les plages de signal ayant une forte probabilité d'être voisé, une deuxième étape assurant la reconnaissance des voyelles et la troisième, la reconnaissance des mots. Une première version de ce système, utilisant les seuls perceptrons multicouches et aucune phase de prétraitement du signal, a été testée avec succès jusqu'a des rapports signal-sur-bruit de 6 décibels. Pour tenter d'augmenter encore les capacités de notre architecture, nous avons utilisé des réseaux connexionnistes dynamiques à récurrence locale : les réseaux gamma. Ces réseaux ont prouvé avoir de bonnes capacités de représentation temporelle sur des exemples simples mais les capacités globales n'ont cependant pas été améliorées.