Thèse soutenue

Mixologie vocale lors d'un cocktail : Combinaison du suivi comportemental et neuronal pour la ségrégation de la parole

FR  |  
EN
Auteur / Autrice : Moïra-Phoebé Huet
Direction : Etienne Parizet
Type : Thèse de doctorat
Discipline(s) : Acoustique
Date : Soutenance le 17/09/2020
Etablissement(s) : Lyon
Ecole(s) doctorale(s) : Ecole doctorale Mécanique, Energétique, Génie Civil, Acoustique (Villeurbanne ; 2011-....)
Partenaire(s) de recherche : établissement opérateur d'inscription : Institut national des sciences appliquées (Lyon ; 1957-....)
Laboratoire : LVA - Laboratoire Vibrations Acoustique (Lyon, INSA) - Laboratoire Vibrations Acoustique / LVA
Jury : Président / Présidente : Daniel Pressnitzer
Examinateurs / Examinatrices : Etienne Parizet, Daniel Pressnitzer, Carolyn McGettigan, Fanny Meunier, Etienne Gaudrain
Rapporteurs / Rapporteuses : Carolyn McGettigan, Fanny Meunier

Résumé

FR  |  
EN

Il n’est pas toujours aisé de suivre une conversation dans un environnement bruyant. Pour parvenir à discriminer deux locuteurs, nous devons mobiliser de nombreux mécanismes perceptifs et cognitifs, ce qui peut parfois entraîner un basculement momentané de notre attention auditive sur les discussions alentour. Dans cette thèse, les processus qui sous-tendent la ségrégation de la parole sont explorés à travers des expériences comportementales et neurophysiologiques. Dans un premier temps, le développement d’une tâche d’intelligibilité – le Long-SWoRD test – est introduit. Ce nouveau protocole permet, tout d’abord, de s’approcher de situations réalistes et, in fine, de bénéficier pour les participants de ressources cognitives, telles que des connaissances linguistiques, pour séparer deux locuteurs. La similarité entre les locuteurs, et donc par extension la difficulté de la tâche, a été contrôlée en manipulant les paramètres des voix. Dans un deuxième temps, les performances des sujets avec cette nouvelle tâche est évaluée à travers trois études comportementales et neurophysiologiques (EEG). Les résultats comportementaux sont cohérents avec la littérature et montrent que la distance entre les voix, les indices de spatialisation, ainsi que les informations sémantiques influencent les performances des participants. Les résultats neurophysiologiques, analysés avec des fonctions de réponse temporelle (TRF), suggèrent que les représentations neuronales des deux locuteurs diffèrent selon la difficulté des conditions d’écoute. Par ailleurs, ces représentations se construisent plus rapidement lorsque les voix sont facilement distinguables. Il est souvent supposé dans la littérature que l’attention des participants reste constamment sur la même voix. Le protocole expérimental présenté dans ce travail permet également d’inférer rétrospectivement à quel moment et quelle voix les participants écoutaient. C’est pourquoi, dans un troisième temps, une analyse combinée de ces informations attentionnelles et des signaux EEG est présentée. Les résultats soulignent que les informations concernant le focus attentionnel peuvent être utilisées avantageusement pour améliorer la représentation neuronale du locuteur sur lequel est porté la concentration dans les situations où les voix sont similaires.