Thèse soutenue

Analyse de scènes auditives computationnelle (casa) : un nouvel outil de marquage du plan temps-fréquence par détection d'harmonicité exploitant une statistique de passages par zéro
FR
Accès à la thèse
Auteur / Autrice : François Gaillard
Direction : Jean-Luc Schwartz
Type : Thèse de doctorat
Discipline(s) : Sciences biologiques
Date : Soutenance en 1999
Etablissement(s) : Grenoble INPG

Résumé

FR

L'analyse de scenes auditives computationnelle (casa) se propose de modeliser notre capacite a structurer notre environnement sonore. Pour ce faire, l'une des approches envisagees consiste a considerer que cette capacite de notre systeme auditif resulte de l'utilisation, en cooperation, de plusieurs images du plan temps-frequence, construites a partir de l'extraction d'indices primitifs des signaux. Dans ce cadre, et au carrefour du traitement du signal, de la physiologie et de la reconnaissance de la parole, ce travail de these presente une methode de marquage du plan temps-frequence basee sur les proprietes harmoniques des sons voises. Cette methode utilise le principe d'une methode ancienne d'extraction de pitch, la methode ppz (i. E. Methode des passages par zero), connue pour sa sensibilite a la presence d'interference. Ce travail de these permet de montrer que cette sensibilite peut etre tournee en avantage pour la detection d'harmonicite en conditions interferantes. En effet, la statistique des passages par zero fournit un indice de fiabilite permettant de classer chaque region du plan temps-frequence en deux categories, selon qu'elle contient, ou non, une source harmonique et dominante. A partir de formalisations theoriques et de simulations, un modele complet de marquage du plan temps-frequence est alors developpe ; ce modele est ensuite evalue en differents paradigmes d'interferences, incluant les paradigmes de doubles voyelles et de signaux bruites, puis sur des signaux a fortes variations prosodiques. Enfin, la plausibilite physiologique de ce modele est discutee.