Thèse soutenue

Simulation de scènes sonores environnementales : Application à l’analyse sensorielle et l’analyse automatique

FR  |  
EN
Auteur / Autrice : Grégoire Lafay
Direction : Jérôme IdierJean-François PetiotMathieu Lagrange
Type : Thèse de doctorat
Discipline(s) : Automatique et informatique appliquée
Date : Soutenance le 08/12/2016
Etablissement(s) : Ecole centrale de Nantes
Ecole(s) doctorale(s) : Ecole doctorale Sciences et technologie de l'information et mathématiques
Partenaire(s) de recherche : Laboratoire : Institut de recherche en communications et cybernétique (Nantes) (1958-2017)
Jury : Président / Présidente : Alain de Cheveigné
Examinateurs / Examinatrices : Jérôme Idier, Jean-François Petiot, Mathieu Lagrange, Alain de Cheveigné, Bertrand David, Catherine Lavandier, Jean-Julien Aucouturier
Rapporteurs / Rapporteuses : Bertrand David, Catherine Lavandier

Résumé

FR  |  
EN

La présente thèse traite de l'analyse de scènes extraites d'environnements sonores, résultat auditif du mélange de sources émettrices distinctes et concomitantes. Ouvrant le champ des sources et des recherches possibles au-delà des domaines plus spécifiques que sont la parole ou la musique, l'environnement sonore est un objet complexe. Son analyse, le processus par lequel le sujet lui donne sens, porte à la fois sur les données perçues et sur le contexte de perception de ces données.Tant dans le domaine de la perception que de l'apprentissage machine, toute expérience suppose un contrôle fin de l'expérimentateur sur les stimuli proposés. Néanmoins, la nature de l'environnement sonore nécessite de se placer dans un cadre écologique, c'est à dire de recourir à des données réelles, enregistrées, plutôt qu'à des stimuli de synthèse. Conscient de cette problématique, nous proposons un modèle permettant de simuler, à partir d'enregistrements de sons isolés, des scènes sonores dont nous maîtrisons les propriétés structurelles -- intensité, densité et diversité des sources. Appuyé sur les connaissances disponibles sur le système auditif humain, le modèle envisage la scène sonore comme un objet composite, une somme de sons sources.Nous investissons à l'aide de cet outil deux champs d'application. Le premier concerne la perception, et la notion d'agrément perçu dans des environnements urbains. L'usage de données simulées nous permet d'apprécier finement l'impact de chaque source sonore sur celui-ci. Le deuxième concerne la détection automatique d'événements sonores et propose une méthodologie d'évaluation des algorithmes mettant à l'épreuve leurs capacités de généralisation.