Thèse soutenue

Un codeur de parole en bande élargie à 16 Kbit/s à base de modèle harmonique
FR
Accès à la thèse
Auteur / Autrice : Anne Amodio
Direction : Gang Feng
Type : Thèse de doctorat
Discipline(s) : Signal, image, parole
Date : Soutenance en 1999
Etablissement(s) : Grenoble INPG

Résumé

FR

Ce travail de these s'inscrit dans le domaine de la compression audio et concerne le developpement d'un codeur de parole pour la bande elargie 50hz-7000hz a partir d'un modele harmonique. Notre travail a consiste en la definition d'un nouveau codeur pour la bande elargie a partir des techniques de codage harmonique, sinusoidale et mbe, utilisees exclusivement sur la bande telephonique. Une fois la structure a base de codage harmonique definie, nous avons travaille sur la quantification des parametres du modele afin d'obtenir un debit egal a 16 kbit/s. La qualite du codeur propose est equivalente a celle du codeur g. 722. Dans sa version a 48 kbit/s. Nous pensons qu'il est possible de reduire le debit aux environs de 13 kbit/s en conservant une qualite equivalente, en travaillant encore sur l'etape de quantification des parametres du modele. Les deux premiers chapitres de ce document sont un etat de l'art sur, respectivement, les codeurs audio en bande elargie et les codeurs de parole en bande telephonique utilisant les techniques sinusoidal, harmonique et mbe. Les chapitres iii et iv concernent deux point cle de la compression audio qui sont la quantification vectorielle et les phenomenes de perception. Les chapitres v, vi et vii, viii presentent le travail complet d'elaboration de notre codeur, depuis la definition de la nouvelle structure a l'evaluation finale, en passant par le choix de techniques de quantification et la procedure d'allocation binaire.