Thèse soutenue

Mimule : un système de reconnaissance de mots isolés multilocuteurs utilisant les techniques de classification

FR  |  
EN
Auteur / Autrice : Pascal Divoux
Direction : Jean-Paul Haton
Type : Thèse de doctorat
Discipline(s) : Sciences et techniques communes
Date : Soutenance en 1988
Etablissement(s) : Nancy 1
Partenaire(s) de recherche : Autre partenaire : Université Henri Poincaré Nancy 1. Faculté des sciences et techniques

Résumé

FR

La difficulté principale des systèmes de reconnaissance automatique de la parole est due à la grande variabilité du signal vocal ; celle-ci culmine dans les systèmes indépendants du locuteur. Nous présentons ici un tel système appliqué à un contexte restreint : mots isolés, vocabulaire limité, comparaison dynamique globale. Lors de la phase d'apprentissage du système, les références à conserver sont sélectionnées par des méthodes statistiques de réduction de données. Plusieurs algorithmes ont été testés et pour chacun d'eux nous avons tenté de déterminer les paramètres optimaux avec leur influence sur les temps de réponse, l'encombrement mémoire et les taux de reconnaissance. Le corpus utilisé est constitué de 60 locuteurs (30 hommes et 30 femmes), moitié pour l'apprentissage, moitié pour les tests de reconnaissance. L'algorithme optimal s'avère être la classification ascendante hiérarchique utilisant la variance minimale comme critère d'agrégation. Les mots doivent être classés par type, la segmentation de l'arbre est effectuée à hauteur constante telle que le nombre de branches soit égal à 1. 5 fois le nombre de références souhaitées ; les classes les moins importantes sont alors éliminées. Lors de la reconnaissance, c'est la référence la plus proche qui est considérée comme reconnue. On obtient ainsi, sur le vocabulaire difficile (les chiffres français), 89 % de bonne reconnaissance en deux propositions avec seulement 2 % du volume de données initial