Achile : un dispositif de décodage acoustico-phonétique et d'identification lexicale indépendant du locuteur à partir de modules mixtes
Auteur / Autrice : | Alain Ghio |
Direction : | Mario Rossi |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences appliquées |
Date : | Soutenance en 1997 |
Etablissement(s) : | Aix-Marseille 3 |
Résumé
La reconnaissance de la parole est une activité dont le but est de faire identifier, par des machines, ce qui est dit par une personne. Le processus peut consister à reconnaître des sons (décodage acoustico-phonétique), des mots (identification lexicale) ou des phrases. Un tel système est soit conçu pour un seul utilisateur, soit pour différents locuteurs. Achile est un dispositif de décodage acoustico-phonétique et d'identification lexicale. Il permet la reconnaissance de mots isolés indépendamment du locuteur sans phase d'apprentissage, ni d'adaptation. Notre objectif est d'examiner jusqu'à quel point un modèle à base de connaissances phonétiques est capable de décoder de façon automatique la structure phonique de la parole sans recourir aux méthodes stochastiques. Le dispositif s'inspire, d'un point de vue fonctionnel, du traitement cognitif humain. La tache de reconnaissance est effectuée par répartition du travail et interaction d'une société d'experts. Le signal de parole alimente tout d'abord les analyseurs de bas niveau. Pour cela, est utilisée, entre autre, une analyse spectrale fondée sur modèle auditif qui tient compte de la notion de pondération sonique et de bandes critiques. Les processus de bas-niveau transmettent leurs données à plusieurs modules de décodage fonctionnant en parallèle (segmentation, reconnaissance globale et analytique). Les résultats sont ensuite transmis aux modules de haut-niveau qui agissent en utilisant des connaissances symboliques (représentations phonologiques, accès lexical). Un moteur d'inférences se charge de prendre une décision finale en comparant les données d'un dictionnaire aux données décodées. L'évaluation du dispositif sur un lexique de 500 mots nous permet de quantifier la pertinence des connaissances, des analyses et des algorithmes employés. C'est aussi le moyen de pouvoir faire évoluer le dispositif en apportant des modifications.