Holophonie binaurale - Spatialisation sonore sur réseaux de haut-parleurs circumauraux - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2008

Binaural holophony - Sound spatialization over circumaural transducer arrays

Holophonie binaurale - Spatialisation sonore sur réseaux de haut-parleurs circumauraux

Résumé

Virtual reality systems aim to create an artificial space suggested by multiple sensorial informations, including an auditive one. Sound source positioning is an important factor of immersion that improves the realism of a virtual scene. Binaural synthesis is a spatialization technique derived directly from normal hearing. It offers a simple way for positioning a monophonic sound event with only two filters, the HRTFs (Head-Related Transfer Functions), which characterize the acoustic paths from the source location to the ears of a listener. Arrival time and level differences at both tympanic membranes are primordial cues for estimating the lateralization of a sound source, but are not sufficient for achieving the exact localization in elevation. Spectral content of the HRTFs provides cues that permit this discrimination, notably high frequency peaks and notches created by diffraction effects within the pinnae. Major disadvantage of binaural synthesis is that the HRTFs are representative of a corresponding morphology. When using non-personal filters, perceptible artefacts may occur. For high quality binaural synthesis, the HRTFs need to be individualized, matching the morphology of the listener. Typical means for this are to measure or calculate the HRTFs of the listener, but these lengthy and costly methods are not feasible for general public applications. Other ways for individualizing the HRTFs consist of modelling the link between the morphology of an auditor and the associated localization cues, based on anthropometric measurements. However, an accurate estimation of the morphological parameters can only be guaranteed by using accurate and often costly measurement tools, notably for the estimation of pinna-related parameters. This thesis explores a new approach for HRTF individualization, based on a physical separation of the localization cues linked to the head and torso from them related to the pinnae. The head/torso component is numerically modeled while the pinna components are created using a multiple transducer array placed around each pinna. The philosophy of this method consists in trying to excite the correct localization cues provided by the diffraction of the reconstructed wave front on the listener's own pinnae. This new concept, that we will call "binaural holophony" - application of holophonic techniques to binaural synthesis, is developed in this manuscript. Different simulations were conducted assuming ideal conditions, and different optimizations are proposed to improve the reconstruction of the HRTFs when using a realistic number of transducers. This study has conducted to the conception and the evaluation of a spatialization system dedicated to binaural holophony.
Les systèmes de réalité virtuelle ont pour objectif de plonger les utilisateurs dans un espace suggéré artificiellement par des informations multi-sensorielles, auditive entre autres. Le positionnement des sources sonores dans l'espace constitue un facteur important d'immersion et contribue grandement au réalisme d'une scène virtuelle. La synthèse binaurale est la technique de spatialisation sonore qui s'approche le plus de l'écoute naturelle. Elle permet de spatialiser un événement sonore monophonique à l'aide de seulement deux filtres, les HRTF (Head-Related Transfer Functions), caractérisant la propagation acoustique de la source vers les oreilles d'un auditeur. Les différences de temps d'arrivée et de niveau de pression au niveau des tympans sont des indices de localisation primordiaux pour estimer de la latéralité d'une source, mais sont insuffisants pour la situer précisément en élévation. Le contenu spectral des HRTF contient les indices permettant cette discrimination, notamment les pics et creux en hautes fréquences induits par les effets de diffraction au sein des pavillons d'oreille. L'inconvénient majeur de la technique binaurale repose donc sur le fait que les HRTF sont propres à chaque utilisateur, car liés aux déformations subies par l'onde sonore lorsqu'elle rencontre les différentes parties du corps humain. Une écoute avec des filtres non individuels comporte des artéfacts perceptibles. Il est donc nécessaire d'acquérir des HRTF individuelles. La mesure ou le calcul numérique sont des méthodes couramment utilisées pour l'estimation de ces dernières, mais sont trop coûteuse en temps et en moyen pour être employées dans des applications grand public. D'autres procédés de personnalisation des HRTF tentent de modéliser le lien entre la morphologie d'un auditeur et les indices de localisation qui lui sont associés, en se basant sur des mesures anthropométriques. Cependant, l'estimation correcte des paramètres morphologiques ne peut être garantie que via l'utilisation d'outils de mesure robuste et souvent onéreux, notamment pour les dimensions liées aux pavillons d'oreille. Cette thèse propose une nouvelle approche d'individualisation des HRTF, fondée sur une séparation des indices de localisation liés au torse et à la tête de ceux liés aux pavillons. La composante tête/torse est modélisée numériquement alors que la composante pavillonnaire est recrée à l'aide de réseaux de haut-parleurs entourant chacun des pavillons d'oreille de l'auditeur. L'idée de cette méthode est d'essayer d'exciter les véritables indices acoustiques induits par la diffraction du front d'onde reconstruit sur les pavillons. Ce nouveau concept, que nous appellerons " holophonie binaurale ", car dérivé de techniques holophonique et binaurale, est développé dans ce manuscrit : différentes simulations ont été menées dans des cas de figure idéaux, et différentes optimisations sont proposées pour améliorer le fonctionnement du procédé pour un nombre réaliste de transducteurs. Ces études ont conduit à la conception et à l'évaluation d'un prototype de casque multi-haut-parleur dédié.
Fichier principal
Vignette du fichier
These-greff2008.pdf (7.28 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00619404 , version 1 (06-09-2011)

Identifiants

  • HAL Id : tel-00619404 , version 1

Citer

Raphaël Greff. Holophonie binaurale - Spatialisation sonore sur réseaux de haut-parleurs circumauraux. Acoustique [physics.class-ph]. Université Pierre et Marie Curie - Paris VI, 2008. Français. ⟨NNT : ⟩. ⟨tel-00619404⟩
421 Consultations
1205 Téléchargements

Partager

Gmail Facebook X LinkedIn More