Reconnaissance multilocuteur de mots isolés fondée sur une approche phonétique
Auteur / Autrice : | Abdelkhalek Messaoudi |
Direction : | Joseph Mariani |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 1987 |
Etablissement(s) : | Paris 11 |
Partenaire(s) de recherche : | autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne) |
Jury : | Président / Présidente : Christian Fluhr |
Examinateurs / Examinatrices : Jean Caelen, Jean-Luc Gauvain, C. Gagnoulet, Christian Fluhr, Joseph Mariani |
Mots clés
Résumé
L'objet de cette thèse est l'étude d'un système de reconnaissance multilocuteur de mots isolés qui ne nécessite pas d'apprentissage oral. Ce système est fondé sur une approche phonétique où chaque phonème est représenté par un dictionnaire de formes spectrales. Un algorithme de classification automatique a permis de construire les dictionnaires phonétiques à partir d'un corpus multilocuteur segmenté et étiqueté manuellement. La phase d'apprentissage consiste simplement à introduire au clavier, sous forme phonétique, la liste des mots à reconnaître. Chacun de ces mots est représenté par un automate d'états fini lié à son modèle de production. Chaque état correspond à l'émission d'un phonème auquel est associée la durée moyenne de son élocution. Durant la phase de reconnaissance, une distance globale entre le mot inconnu et chacun des modèles de référence est évaluée par un algorithme de programmation dynamique. Cet algorithme permet de trouver la séquence d'états qui minimise la somme des distances locales entre les échantillons centisecondes du mot à identifier et les états du modèle.