Séparation spatiale des sources sonores
Auteur / Autrice : | Bin Dong |
Direction : | Jérôme Antoni |
Type : | Thèse de doctorat |
Discipline(s) : | Acoustique |
Date : | Soutenance le 14/04/2014 |
Etablissement(s) : | Lyon, INSA |
Ecole(s) doctorale(s) : | École doctorale Mécanique, Energétique, Génie Civil, Acoustique (Villeurbanne ; 2011-....) |
Partenaire(s) de recherche : | Laboratoire : LVA - Laboratoire Vibrations Acoustique (Lyon, INSA) - Laboratoire Vibrations Acoustique / LVA |
Jury : | Président / Présidente : Charles Pézerat |
Examinateurs / Examinatrices : Jérôme Antoni, Charles Pézerat, Mohamed El Badaoui, Jean-Hugh Thomas, Quentin Leclère | |
Rapporteur / Rapporteuse : Mohamed El Badaoui, Jean-Hugh Thomas |
Mots clés
Résumé
La séparation aveugle de sources est une technique prometteuse pour l'identification, la localisation, et la classification des sources sonores. L'objectif de cette thèse est de proposer des méthodes pour séparer des sources sonores incohérentes qui peuvent se chevaucher à la fois dans les domaines spatial et fréquentiel par l'exploitation de l'information spatiale. De telles méthodes sont d'intérêt dans les applications acoustiques nécessitant l'identification et la classification des sources sonores ayant des origines physiques différentes. Le principe fondamental de toutes les méthodes proposées se décrit en deux étapes, la première étant relative à la reconstruction du champ source (comme par exemple à l'aide de l'holographie acoustique de champ proche) et la seconde à la séparation aveugle de sources. Spécifiquement, l'ensemble complexe des sources est d'abord décomposé en une combinaison linéaire de fonctions de base spatiales dont les coefficients sont définis en rétropropageant les pressions mesurées par un réseau de microphones sur le domaine source. Cela conduit à une formulation similaire, mais pas identique, à la séparation aveugle de sources. Dans la seconde étape, ces coefficients sont séparés en variables latentes décorrélées, affectées à des “sources virtuelles” incohérentes. Il est montré que ces dernières sont définies par une rotation arbitraire. Un ensemble unique de sources sonores est finalement résolu par la recherche de la rotation (par gradient conjugué dans la variété Stiefel des matrices unitaires) qui minimise certains critères spatiaux, tels que la variance spatiale, l'entropie spatiale, ou l'orthogonalité spatiale. Il en résulte la proposition de trois critères de séparation à savoir la “moindre variance spatiale”, la “moindre entropie spatiale”, et la “décorrélation spatiale”, respectivement. De plus, la condition sous laquelle la décorrélation classique (analyse en composantes principales) peut résoudre le problème est établit de une manière rigoureuse. Le même concept d'entropie spatiale, qui est au cœur de cette thèse, est également exploité dans la définition d'un nouveau critère, la courbe en L entropique, qui permet de déterminer le nombre de sources sonores actives sur le domaine source d'intérêt. L'idée consiste à considérer le nombre de sources qui réalise le meilleur compromis entre une faible entropie spatiale (comme prévu à partir de sources compactes) et une faible entropie statistique (comme prévu à partir d'une faible erreur résiduelle).