Thèse soutenue

Décomposition de scènes sonores ambisoniques pour navigation en six degrés de liberté

FR  |  
EN
Auteur / Autrice : Mohammed Hafsati
Direction : Rémi GribonvalNicolas Epain
Type : Thèse de doctorat
Discipline(s) : Signal, image, vision
Date : Soutenance le 23/11/2020
Etablissement(s) : Rennes 1
Ecole(s) doctorale(s) : MATHSTIC
Partenaire(s) de recherche : Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) - PANAMA

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Cette thèse s’inscrit dans le contexte multimédia dont le sujet technique est la navigation dans des champs sonores 3D. Contrairement aux contenus de réalité virtuelle, notre application vise les contenus issus de captations réelles. Nous utilisons l’ambisonique comme technologie d’audio 3D. Le problème d’utiliser ce genre de représentation de champ sonore réside dans la difficulté d’avoir 6 degrés de liberté, avec la possibilité de changer de point de vue. Afin de contourner ce problème, nous recommandons de faire une décomposition du format ambisonique en ondes planes. Cela a été déjà proposé dans plusieurs contributions dans l’état de l’art en utilisant des techniques de formation de voies en pleine bande. La particularité d’une de nos méthodes est d’utiliser des techniques de séparations de sources sonores multicanaux, avec laquelle nous cherchons les contributions de chaque source dans chaque canal ambisonique. Cela n’a jamais été utilisé auparavant pour faire de la navigation dans des contenus ambisoniques. Dans cette thèse, nous proposons différentes manières pour faire la séparation de source multicanaux dans le domaine ambisonique.