Thèse soutenue

Reconnaissance multilocuteur de mots isolés fondée sur une approche phonétique

FR  |  
EN
Auteur / Autrice : Abdelkhalek Messaoudi
Direction : Joseph Mariani
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1987
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)
Jury : Président / Présidente : Christian Fluhr
Examinateurs / Examinatrices : Jean Caelen, Jean-Luc Gauvain, C. Gagnoulet, Christian Fluhr, Joseph Mariani

Résumé

FR  |  
EN

L'objet de cette thèse est l'étude d'un système de reconnaissance multilocuteur de mots isolés qui ne nécessite pas d'apprentissage oral. Ce système est fondé sur une approche phonétique où chaque phonème est représenté par un dictionnaire de formes spectrales. Un algorithme de classification automatique a permis de construire les dictionnaires phonétiques à partir d'un corpus multilocuteur segmenté et étiqueté manuellement. La phase d'apprentissage consiste simplement à introduire au clavier, sous forme phonétique, la liste des mots à reconnaître. Chacun de ces mots est représenté par un automate d'états fini lié à son modèle de production. Chaque état correspond à l'émission d'un phonème auquel est associée la durée moyenne de son élocution. Durant la phase de reconnaissance, une distance globale entre le mot inconnu et chacun des modèles de référence est évaluée par un algorithme de programmation dynamique. Cet algorithme permet de trouver la séquence d'états qui minimise la somme des distances locales entre les échantillons centisecondes du mot à identifier et les états du modèle.