Auto-adaptation et reconnaissance automatique de la parole

par Antoine Laurent

Thèse de doctorat en Informatique

Sous la direction de Paul Deléglise.

Soutenue en 2010

à Le Mans .


  • Résumé

    La première partie de cette thèse présente une méthode d’assistance à la transcription automatique de la parole. Le transcripteur humain dispose de la meilleure hypothèse fournie par le SRAP, et, à chaque correction de sa part, le système propose une nouvelle hypothèse prenant en compte cette correction. Cette dernière est obtenue à partir d’une réévaluation des réseaux de confusion générés par le SRAP. L’utilisation de la méthode de réordonnancement permet d’observer un gain absolu de 3,4% (19,2% à 15,8%) en terme de nombre de mots à corriger (WSR) sur le corpus ESTER 2. Afin de diminuer le taux d’erreur sur les noms propres, une méthode de phonétisation itérative utilisant les données acoustiques à disposition est proposée dans ce manuscrit. L’utilisation de SMT [Laurent 2009] couplée avec la méthode de phonétisation proposée permet d'observer des gains en terme de taux d'erreur mot (WER) et en terme de taux d'erreur noms propres (PNER).

  • Titre traduit

    Auto-adaptation and automatic speech recognition


  • Résumé

    The first part of this thesis presents a computer assisted transcription of speech method. Every time the user corrects a word in the automatic transcription, this correction is immediately taken into account to re-evaluate the transcription of the words following it. The latter is obtained from a reordering of the confusion networks hypothesis generated by the ASR. The use of the reordering method allows an absolute gain of 3. 4 points (19. 2% to 15. 8%) in term of word stroke ratio (WSR) on the ESTER 2 corpus. In order to decrease the proper nouns error rate, an acoustic-based phonetic transcription method is proposed in this manuscript. The use of SMT [Laurent 2009] associated with the proposed method allows a significant reduce in term of word error rate (WER) and in term of proper nouns error rate (PNER).

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (132 p.)
  • Annexes : Bibliogr. p. 119-131

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Le Mans Université (Le Mans). Service commun de documentation.
  • Non disponible pour le PEB
  • Cote : 2010LEMA1009
  • Bibliothèque : Le Mans Université (Le Mans). Service commun de documentation.
  • Non disponible pour le PEB
  • Cote : 2010LEMA1009
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.