Réseaux neuronaux en graphes inductifs Application à la surveillance Passive Visuelle et Acoustique
Auteur / Autrice : | Wieke Prummel |
Direction : | Thierry Bouwmans, Anastasia Zakharova |
Type : | Thèse de doctorat |
Discipline(s) : | Image, signal et automatique |
Date : | Soutenance le 08/11/2024 |
Etablissement(s) : | La Rochelle |
Ecole(s) doctorale(s) : | École doctorale Euclide (La Rochelle ; 2018-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire Mathématiques, Image et Applications (La Rochelle) - Mathématiques, Image et Applications - EA 3165 |
Jury : | Président / Présidente : Laure Tougne |
Examinateurs / Examinatrices : Thierry Bouwmans, Anastasia Zakharova, Laure Tougne, Enrico Magli, Ezequiel Lopez Rubio, Dorina Thanou, Jhony Heriberto Giraldo Zuluaga, Jenny Benois Pineau | |
Rapporteurs / Rapporteuses : Enrico Magli, Ezequiel Lopez Rubio |
Résumé
Cette thèse propose une approche des réseaux neuronaux en graphe (GNNs) basés sur l'apprentissage inductif pour la vision passive et la surveillance acoustique, visant à créer des solutions déployables pour améliorer les stratégies de conservation. La surveillance visuelle passive (PVM) et la surveillance acoustique passive (PAM) font face à une quantité croissante des données en raison des capteurs haute- qualité. Les méthodes actuelles utilisent principalement l'apprentissage transductif, qui, bien qu'étant plus simple à résoudre, peine avec les données non vues, et il y a un manque de modèles inductifs basés sur les graphes dans l'éco-acoustique. Cette recherche explore donc les performances des méthodes inductives, avec des contributions clés comme GraphIMOS pour la segmentation des objets en mouvement (MOS) dans le PVM, montrant que l'apprentissage inductif peut surpasser les méthodes transductives traditionnelles. Un modèle léger (MOSIG-Net) optimise GraphIMOS avec des techniques comme l’edge dropout, ouvrant la voie à de futures améliorations en apprentissage semi-supervisé. En outre, la thèse présente MOT-GCN, une méthode de suivi multi-objets (MOT) qui améliore la fusion des suiveurs et traite des défis comme les images à faible résolution et les chevauchements d'objets denses, marquant la première méthode inductive de fusion dans ce domaine. Dans PAM, GraphIEAMON améliore significativement la surveillance éco-acoustique, offrant des performances et une interprétabilité supérieure. Ce travail démontre la polyvalence et l'efficacité de l'apprentissage inductif basé sur les graphes pour relever des défis complexes dans la vision par ordinateur et la surveillance de l'environnement.