Incertitudes pour les tâches de régression avec des réseaux de neurones sur graphe. Application à la détection de particules cosmiques
Auteur / Autrice : | Arsène Ferriere |
Direction : | Olivier Martineau-huynh |
Type : | Projet de thèse |
Discipline(s) : | Physique |
Date : | Inscription en doctorat le 06/11/2023 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | Physique en Ile de France |
Partenaire(s) de recherche : | Laboratoire : Laboratoire de Physique Nucléaire et des Hautes Energies |
Mots clés
Mots clés libres
Résumé
Les réseaux de neurones artificiels représentent des fonctions ayant un très grand nombre de paramètres, à la fois différentiables (donc entraînables) ainsi que fortement non linéaires. Cette dernière propriété leur confère un fort pouvoir de représentation, à l'origine de leur utilisation massive, mais elle implique également que les réseaux de neurones sont, par nature, sensibles à de faibles variations des données d'entrée. Ainsi la question de la détermination des incertitudes sur les prédictions des réseaux de neurones est aujourd'hui l'un des enjeux majeurs en machine learning. L'objectif de cette thèse est de travailler sur l'utilisation de réseaux de neurones sur graphes, dans l'optique de pouvoir déterminer des quantités physiques et leurs erreurs, à partir des mesures effectuées avec des réseaux de capteurs distribués spatialement. L'utilisation de réseaux de neurones sur graphes (GNN) se prête particulièrement bien à cette problématique dans la mesure où le réseau de capteurs peut être irrégulier, avec ajout ou suppression de capteurs en fonction du temps. Le cas d'application principal sera le projet GRAND, qui vise à déterminer l'origine des rayons cosmiques d'ultra-haute énergie à l'aide d'un réseau de 200 000 antennes radio déployées. Si la construction de cet instrument est prévue pour les années 2030, le déploiement d'un premier prototype de 300 antennes radio, GRANDProto300, est imminent. Celui-ci sera un banc de test idéal pour développer de nouvelles techniques d'analyse, basées sur l'utilisation de méthodes d'apprentissage automatique, et pour investiguer l'origine des rayons cosmiques dans une gamme d'énergie peu étudiée. Les particules cosmiques induisent dans l'atmosphère des cascades de particules secondaires qui vont générer une émission électromagnétique brève (< 100 ns) que les antennes de GRAND détecteront dans la gamme 50-200 MHz. Il s'agira ainsi, à partir des mesures radio des antennes, de reconstruire les paramètres primaires des particules incidentes (nature, énergie, direction d'arrivée, etc.). Pour estimer ces quantités, il est nécessaire d'exploiter les données de plusieurs antennes qui détectent en coïncidence l'émission radio des particules. Il s'agit ainsi de résoudre un problème inverse par des techniques d'apprentissage machine. Des expériences similaires utilisent déjà des GNN (Choma et al. 2018), mais l'originalité du travail proposé est que les données mesurées sur chaque noeud du graphe seront des séries temporelles. Les méthodes développées à travers l'étude de ce cas d'application physique seront applicables par la suite à d'autres cas d'usages, par exemple en radio-protection ou en sismologie.