Thèse soutenue

Le contrôle vocal des vocalisations non verbales humaines : une approche par la signalisation trompeuse

FR  |  
EN
Auteur / Autrice : Virgile Daunay
Direction : Katarzyna PisanskiDavid Reby
Type : Thèse de doctorat
Discipline(s) : Sciences de la vie
Date : Soutenance le 28/11/2025
Etablissement(s) : Saint-Etienne, Université Jean Monnet (2025-....)
Ecole(s) doctorale(s) : SIS - Sciences Ingénierie Santé
Partenaire(s) de recherche : Laboratoire : Centre de Recherche en Neurosciences de Lyon (Bron ; Saint-Priest-en-Jarez ; 2011-....)
Jury : Président / Présidente : Pascal Belin
Examinateurs / Examinatrices : Gregory Bryant
Rapporteurs / Rapporteuses : Pascal Belin, Susanne Fuchs
DOI : 10.70675/74766f92z7029z406fzab27z8b0cc6958672

Résumé

FR  |  
EN

Le comportement vocal humain agit au-delà de la parole. Nous produisons des rires joyeux, des gémissements de plaisir, des sons de dégoût et d'autres vocalisations non verbales qui partagent des caractéristiques acoustiques avec celles d'autres animaux. Ces vocalisations spontanées représentent une forme ancienne de communication émotionnelle. Cependant, les humains ont la capacité rare de contrôler ces vocalisations de manière volontaire, en les exprimant indépendamment des stimuli externes et internes. Cette thèse examine comment les pressions évolutives ont favorisé le contrôle vocal en étudiant à la fois les formes acoustiques et la perception des auditeurs.Dans le premier chapitre, une revue exhaustive de la littérature examine les fondements évolutifs du contrôle vocal à travers des perspectives neuronales, acoustiques et comportementales, tant sur la production que sur la perception.Ensuite, trois études empiriques explorent comment les humains utilisent les vocalisations volontaires pour exploiter la perception émotionnelle et sociale des auditeurs. La première étude (chapitre II) démontre comment les locuteurs modulent volontairement le rire pour encoder des contextes tels que l'amusement, le sarcasme ou la nervosité à travers des paramètres acoustiques spécifiques. Les auditeurs reconnaissent les contextes au-delà du hasard, bien qu'il y ait de nombreuses confusions entre contextes similaires. Ces résultats suggèrent que le rire fonctionne comme un signal gradué plutôt que catégorique. L'étude suivante (chapitre III) explore cette gradation à travers des dimensions émotionnelles : la valence, l'intensité (« arousal ») et l'authenticité. Celles-ci sont étroitement liées : les rires plus positifs sont perçus comme plus intenses et authentiques. Néanmoins, la valence est apparue comme une information primaire, en effet les contextes de valence similaire présentent les taux de confusion les plus élevés.S'appuyant sur ces résultats, la troisième étude (chapitre IV) poursuit la question du contrôle vocal au-delà du rire pour tester la part de contrôle des humains dans leurs expressions affectives sincères. Des locuteurs ont produit des vocalisations sincères, atténuées, exagérées ou inversées (plaisir lorsqu'ils étaient dégoûtés et vice versa) en réaction à des odeurs alimentaires. Ils ont réussi à tromper les auditeurs en modulant des paramètres acoustiques. Cependant, les vocalisations inversées, en particulier celles simulant le dégoût, ont été jugées moins authentiques, révélant un contrôle asymétrique entre les états affectifs.Ces résultats mettent en lumière la manière dont les locuteurs peuvent délibérément modifier leurs signaux vocaux selon un gradient émotionnel dans la communication non verbale humaine afin d'influencer les perceptions des auditeurs. La capacité de contrôle vocal transforme ces signaux sincères des états physiologiques en outils malléables pour l'interaction sociale. Aussi, les auditeurs restent sensibles à l'authenticité en détectant les variations acoustiques subtiles par rapport aux productions spontanées. Ces résultats soulignent la course à l'armement évolutive de la communication trompeuse. Plus les locuteurs développent un contrôle vocal pour tromper, plus les auditeurs développent une sensibilité aux variations acoustiques, trahissant le manque d'authenticité.En conclusion, la compréhension de ces mécanismes de contrôle vocal dans les vocalisations non verbales met en lumière non seulement la complexité de la communication humaine à travers le prisme de l'évolution, mais ouvre également des perspectives plus larges : détection et traitement des expressions émotionnelles pathologiques en milieu clinique, détection de « deepfakes » audio, voire compréhension du jeu d'acteur et de sa performance émotionnelle.