Thèse soutenue

Construction de dictionnaires et quantification vectorielle pour les codeurs de parole lsp-celp

FR  |  
EN
Auteur / Autrice : Najib Naja
Direction : Jean-Marc Boucher
Type : Thèse de doctorat
Discipline(s) : Traitement du signal et télécommunications
Date : Soutenance en 1994
Etablissement(s) : Rennes 1

Mots clés

FR

Mots clés contrôlés

Résumé

FR

Cette these est particulierement consacree a l'etude de la quantification vectorielle des paires de raies spectrales (lsp) et a la construction de dictionnaires de formes d'ondes, pour exciter les deux filtres en cascades (filtre long terme et filtre court terme) du codeur predictif excite par codes (celp), plus performants que les dictionnaires gaussiens classiquement utilises. En premier lieu, on aborde le probleme de la modelisation du signal residuel de prediction en vue de construire un dictionnaire de formes d'onde plus performant qu'un dictionnaire gaussien classiquement utilise dans les codeurs de type celp. On a pu verifier en utilisant des statistiques d'ordre superieur que ce signal residuel ne presentait un caractere gaussien que pour 20% des echantillons, a priori situes aux instants de rupture de modelisation. Cela nous a conduit a tester un dictionnaire mixte, constitue d'un dictionnaire gaussien et d'un dictionnaire non-gaussien construit par l'algorithme de la k-moyenne. Nous avons compare les performances obtenues avec cette nouvelle approche, en termes de rapport signal a bruit global, en prenant pour reference un dictionnaire gaussien de meme taille. En second lieu, la propriete d'ordre des parametres 1sp est exploitee en terme de norme euclidienne afin de reduire la complexite de leur quantification vectorielle. La norme euclidienne est utilisee afin de localiser la zone recherche du modele du vecteur a coder avant de lui appliquer des algorithmes de recherche rapide. Cela a permis de rendre possible l'implantation en temps reel d'un quantificateur produit des coefficients lsp sur un processeur de signaux (dsp 56002 de motorola) en moins de 2ms a un debit binaire de 17 bits/trame