Construction de dictionnaires et quantification vectorielle pour les codeurs de parole lsp-celp
Auteur / Autrice : | Najib Naja |
Direction : | Jean-Marc Boucher |
Type : | Thèse de doctorat |
Discipline(s) : | Traitement du signal et télécommunications |
Date : | Soutenance en 1994 |
Etablissement(s) : | Rennes 1 |
Mots clés
Mots clés contrôlés
Résumé
Cette these est particulierement consacree a l'etude de la quantification vectorielle des paires de raies spectrales (lsp) et a la construction de dictionnaires de formes d'ondes, pour exciter les deux filtres en cascades (filtre long terme et filtre court terme) du codeur predictif excite par codes (celp), plus performants que les dictionnaires gaussiens classiquement utilises. En premier lieu, on aborde le probleme de la modelisation du signal residuel de prediction en vue de construire un dictionnaire de formes d'onde plus performant qu'un dictionnaire gaussien classiquement utilise dans les codeurs de type celp. On a pu verifier en utilisant des statistiques d'ordre superieur que ce signal residuel ne presentait un caractere gaussien que pour 20% des echantillons, a priori situes aux instants de rupture de modelisation. Cela nous a conduit a tester un dictionnaire mixte, constitue d'un dictionnaire gaussien et d'un dictionnaire non-gaussien construit par l'algorithme de la k-moyenne. Nous avons compare les performances obtenues avec cette nouvelle approche, en termes de rapport signal a bruit global, en prenant pour reference un dictionnaire gaussien de meme taille. En second lieu, la propriete d'ordre des parametres 1sp est exploitee en terme de norme euclidienne afin de reduire la complexite de leur quantification vectorielle. La norme euclidienne est utilisee afin de localiser la zone recherche du modele du vecteur a coder avant de lui appliquer des algorithmes de recherche rapide. Cela a permis de rendre possible l'implantation en temps reel d'un quantificateur produit des coefficients lsp sur un processeur de signaux (dsp 56002 de motorola) en moins de 2ms a un debit binaire de 17 bits/trame