Thèse soutenue

Utilisation et apprentissage de modeles de langage pour la reconnaissance de la parole continue

FR  |  
EN
Auteur / Autrice : Pierre Dupont
Direction : L. MICLET
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1996
Etablissement(s) : Paris, ENST

Résumé

FR

Le présent travail s'intéresse à la modélisation du langage pour la reconnaissance de la parole continue. Cette modélisation a pour objectif le contrôle du décodage acoustique par une information contraignant les séquences de mots à reconnaitre. Dans la première partie, nous définissons le contexte général d'utilisation d'un modelé de langage. Nous y abordons le cadre probabiliste et les aspects algorithmiques de l'utilisation de modèles de markov caches en reconnaissance de la parole continue. Nous détaillons l'algorithme de viterbi et la stratégie de recherche en faisceau qui lui est associée. La seconde partie de notre travail traite d'un type particulier de modèles de langage, ceux bases sur une grammaire hors-contexte probabiliste ou non. Nous proposons une approche originale pour l'intégration d'un tel modèle dans l'algorithme de viterbi. Elle utilise un développement d'une structure récursive qui définit dynamiquement l'espace de recherche du décodage acoustique. A ce propos, nous montrons l'intérêt d'une mise sous forme normale de greibach de la grammaire hors-contexte. Nous étudions également la complexité théorique d'un algorithme de transformation sous cette forme normale. Les performances de notre approche sont évaluées dans différents systèmes de reconnaissance de la parole en mettant l'accent sur sa complexité pratique. Dans la troisième partie, nous nous intéressons à l'apprentissage automatique de modèles de langage définis par le biais d'une grammaire formelle. En particulier, nous nous concentrons sur l'inférence de grammaires régulières à partir d'échantillons positif et négatif d'un langage. Nous proposons une étude théorique détaillée de l'espace de recherche de ce problème et nous démontrons des propriétés originales permettant de guider la construction d'une solution. Nous introduisons également un nouveau point de vue qui consiste à traiter l'inférence régulière comme un problème d'optimisation combinatoire. Dans ce cadre, nous développons un algorithme d'inférence par optimisation génétique. Ensuite, nous étudions l'inférence régulière sur base d'une présentation séquentielle des données d'apprentissage. A cette fin, une extension incrémentale d'un algorithme connu est proposée. Nous en démontrons la convergence et nous étudions sa complexité théorique. Finalement, nous définissons deux protocoles d'évaluation de méthodes d'inférence et nous comparons les différents algorithmes étudiés.