Capteur polyvalent acoustique pour l'habitat intelligent
Auteur / Autrice : | Ammar Ahmed |
Direction : | Kosai Raoof, Jean-François Diouris, Youssef Serrestou |
Type : | Thèse de doctorat |
Discipline(s) : | Acoustique |
Date : | Soutenance le 04/05/2023 |
Etablissement(s) : | Le Mans |
Ecole(s) doctorale(s) : | Sciences de l'ingénierie et des systèmes (Nantes Université) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'acoustique de l'Université du Mans - Laboratoire d'Acoustique de l'Université du Mans / LAUM |
Jury : | Examinateurs / Examinatrices : Marion Berbineau |
Rapporteurs / Rapporteuses : Emil Novakov, Mounir Sayadi |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Les sons environnementaux proviennent généralement de sources diverses et variées, telles que l’activité humaine, les objets et la nature. La classification automatique de ces sons suscite récemment un grand intérêt grâce à son grand potentiel d’application dans divers domaines, comme l’interaction home-machine, l’habitat intelligent, l’audition robotique, la reconnaissance automatique d’activités, les systèmes de surveillance automatique, etc. Dans le cas d’un habitat intelligent, L’hétérogénéité des événements à surveiller conduit à l’usage d’un grand nombre de capteurs, de différentes natures, ce qui impacte le coût, la consommation énergétique, la complexité d’installation et de gestion ainsi que l’encombrement et le volume de données à traiter. L’objectif de cette thèse est de démontrer que l’utilisation de la classification automatique des sons environnementaux (ECS pour Environmental Sound Classification en anglais), apporte une solution à cette problématique de réduction du nombre et de la diversité des capteurs en remplaçant tout ou une partie de ces capteurs par des capteurs acoustiques. La faisabilité de cette solution a été validée par le développement d’un système, implémenté sur une carte composée d’un microcontrôleur (Cortex M4) à faible empreinte mémoire et à basse consommation et d’un microphone, pour la reconnaissance automatique en temps réel de quatre sons environnementaux (pluie, vent, pas humain et passage de voiture). Pour une meilleure adéquation algorithme-architecture, différentes méthodes d'extraction et de sélection de caractéristiques et différents modèles d'apprentissage automatique ont été étudiés et comparés. Une nouvelle approche d’extraction de caractéristiques à partir du spectrogramme d’amplitude et de fréquence instantanées (SAFI), a été proposée et comparée à l’approche traditionnelle utilisant le spectrogramme de Mel. Pour s’affranchir des limitations de l’approche traditionnelle, liées au fait que les sons environnementaux sont des signaux multi-composantes, non-stationnaire et issus de systèmes non-linéaires, la construction du spectrogramme d’amplitude et de fréquence instantanées est effectuée par décomposition en modes empiriques (EMD) couplée à l’opérateur d’énergie de Teager-Kaiser (TKEO). Pour générer le modèle d’apprentissage, une base de données de sons environnementaux choisis a été construite. Les modèles d’apprentissage retenus sont les réseaux de neurones convolutifs (CNN) et convolutifs profonds (DSCNN), optimisés en termes du nombre de paramètres et de caractéristiques. Cette optimisation est effectuée grâce à une méthode de sélection de caractéristiques par réseau de neurones récurrent (RNN). Ce système de reconnaissance automatique développé a été évalué avec de nouveaux signaux pour une classification en temps réel.