Simulation de scènes sonores environnementales : Application à l’analyse sensorielle et l’analyse automatique
Auteur / Autrice : | Grégoire Lafay |
Direction : | Jérôme Idier, Jean-François Petiot, Mathieu Lagrange |
Type : | Thèse de doctorat |
Discipline(s) : | Automatique et informatique appliquée |
Date : | Soutenance le 08/12/2016 |
Etablissement(s) : | Ecole centrale de Nantes |
Ecole(s) doctorale(s) : | Ecole doctorale Sciences et technologie de l'information et mathématiques |
Partenaire(s) de recherche : | Laboratoire : Institut de recherche en communications et cybernétique (Nantes) (1958-2017) |
Jury : | Président / Présidente : Alain de Cheveigné |
Examinateurs / Examinatrices : Jérôme Idier, Jean-François Petiot, Mathieu Lagrange, Alain de Cheveigné, Bertrand David, Catherine Lavandier, Jean-Julien Aucouturier | |
Rapporteurs / Rapporteuses : Bertrand David, Catherine Lavandier |
Mots clés
Résumé
La présente thèse traite de l'analyse de scènes extraites d'environnements sonores, résultat auditif du mélange de sources émettrices distinctes et concomitantes. Ouvrant le champ des sources et des recherches possibles au-delà des domaines plus spécifiques que sont la parole ou la musique, l'environnement sonore est un objet complexe. Son analyse, le processus par lequel le sujet lui donne sens, porte à la fois sur les données perçues et sur le contexte de perception de ces données.Tant dans le domaine de la perception que de l'apprentissage machine, toute expérience suppose un contrôle fin de l'expérimentateur sur les stimuli proposés. Néanmoins, la nature de l'environnement sonore nécessite de se placer dans un cadre écologique, c'est à dire de recourir à des données réelles, enregistrées, plutôt qu'à des stimuli de synthèse. Conscient de cette problématique, nous proposons un modèle permettant de simuler, à partir d'enregistrements de sons isolés, des scènes sonores dont nous maîtrisons les propriétés structurelles -- intensité, densité et diversité des sources. Appuyé sur les connaissances disponibles sur le système auditif humain, le modèle envisage la scène sonore comme un objet composite, une somme de sons sources.Nous investissons à l'aide de cet outil deux champs d'application. Le premier concerne la perception, et la notion d'agrément perçu dans des environnements urbains. L'usage de données simulées nous permet d'apprécier finement l'impact de chaque source sonore sur celui-ci. Le deuxième concerne la détection automatique d'événements sonores et propose une méthodologie d'évaluation des algorithmes mettant à l'épreuve leurs capacités de généralisation.