Thèse soutenue

Optimisation du son 3D immersif, qualité et transmission
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Abderrahmane Smimite
Direction : Azeddine BeghdadiKen Chen
Type : Thèse de doctorat
Discipline(s) : Signaux et Images
Date : Soutenance le 25/06/2014
Etablissement(s) : Paris 13
Ecole(s) doctorale(s) : École doctorale Galilée (Villetaneuse, Seine-Saint-Denis)
Partenaire(s) de recherche : Laboratoire : Laboratoire de traitement et transport de l'information (Villetaneuse, Seine-Saint-Denis) - Laboratoire informatique de Paris-Nord (Villetaneuse, Seine-Saint-Denis ; 2001-....)
Jury : Président / Présidente : Younès Bennani
Examinateurs / Examinatrices : Pascal Chédeville
Rapporteurs / Rapporteuses : Abdelhakim Saadane, Hossam Afifi

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Cette étude porte sur trois problématiques reliées à l’utilisation du son multicanal 3D dans le contexte des applications Audio Professionnelles. Le système SIRIUS est présenté. Il s’agit d’une technique de transport du son multicanal qui répond aux contraintes de Fiabilité, Synchronisation et Latence des applications professionnelles et garantie un compromis entre ces différents aspects. Le système peut fonctionner sur les infrastructures LAN classiques et coexister avec d’autres types de trafic réseau. Il est aussi basé sur une couche protocolaire n’utilisant que des protocoles standards, ce qui lui procure un certain niveau d’interopérabilité avec des technologies équivalentes. La seconde contribution est la méthodologie AQUA. Il s’agit d’une nouvelle approche pour l’évaluation de la qualité du son multicanal qui propose des outils efficaces pour l’analyse subjective et objective de la qualité. La partie subjective consiste en un nouveau protocol pour les tests d’écoute qui combine l’analyse de l’information perceptive et spatiale. La précision de la localisation est évaluée grâce au suivi des gestes des auditeurs. Notre méthode, basée sur l’utilisation de la Kinect, permet d’obtenir cette information d’une façon rapide et précise. Le protocole utilise notamment l’analyse EEG pour étudier les biais psychologiques et filtrer efficacement les sujets. La partie objective repose sur un moteur binaural qui convertit le flux multicanal en un flux stereo binaural plus simple à analyser et qui préserve l’information spatiale. Le signal audio résultant est analysé par un modèle perceptif et un modèle spatial qui permettent d’estimer une représentation interne équivalente. Les variables la constituant alimentent ensuite un Réseau de Neurones Artificiel qui permet d’obtenir une note objective de qualité. Parallèlement, le modèle psychologique simule le comportement humain en ajustant la note en fonction des notes précédentes. Les performances obtenues montrent que le système peut être utilisé pour prédire la qualité perceptive et spatiale du son multicanal avec un grand niveau de précision et de réalisme. Le dernier axe d’étude porte sur l’optimisation de la qualité d’écoute dans les systèmes audio surround. Etant donné leur problème de Sweet Spot, et la complexité des systèmes suggérant de l’élargir, on propose une technique basée sur le suivi de la position réelle des auditeurs. Le suivi est réalisé d’une façon non-intrusive par l’analyse d’images thermiques. Les canaux audio initiaux sont considérés comme des sources virtuelles et sont re-mixés par VBAP pour simuler leur déplacement vers l’auditeur. Les performances obtenues montrent un suivi efficace et une amélioration de l’expérience d’écoute.