Thèse en cours

Incertitudes pour les tâches de régression avec des réseaux de neurones sur graphe. Application à la détection de particules cosmiques

FR  |  
EN
Auteur / Autrice : Arsène Ferriere
Direction : Olivier Martineau-huynh
Type : Projet de thèse
Discipline(s) : Physique
Date : Inscription en doctorat le 06/11/2023
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : Physique en Ile de France
Partenaire(s) de recherche : Laboratoire : Laboratoire de Physique Nucléaire et des Hautes Energies

Résumé

FR  |  
EN

Les réseaux de neurones artificiels représentent des fonctions ayant un très grand nombre de paramètres, à la fois différentiables (donc entraînables) ainsi que fortement non linéaires. Cette dernière propriété leur confère un fort pouvoir de représentation, à l'origine de leur utilisation massive, mais elle implique également que les réseaux de neurones sont, par nature, sensibles à de faibles variations des données d'entrée. Ainsi la question de la détermination des incertitudes sur les prédictions des réseaux de neurones est aujourd'hui l'un des enjeux majeurs en machine learning. L'objectif de cette thèse est de travailler sur l'utilisation de réseaux de neurones sur graphes, dans l'optique de pouvoir déterminer des quantités physiques et leurs erreurs, à partir des mesures effectuées avec des réseaux de capteurs distribués spatialement. L'utilisation de réseaux de neurones sur graphes (GNN) se prête particulièrement bien à cette problématique dans la mesure où le réseau de capteurs peut être irrégulier, avec ajout ou suppression de capteurs en fonction du temps. Le cas d'application principal sera le projet GRAND, qui vise à déterminer l'origine des rayons cosmiques d'ultra-haute énergie à l'aide d'un réseau de 200 000 antennes radio déployées. Si la construction de cet instrument est prévue pour les années 2030, le déploiement d'un premier prototype de 300 antennes radio, GRANDProto300, est imminent. Celui-ci sera un banc de test idéal pour développer de nouvelles techniques d'analyse, basées sur l'utilisation de méthodes d'apprentissage automatique, et pour investiguer l'origine des rayons cosmiques dans une gamme d'énergie peu étudiée. Les particules cosmiques induisent dans l'atmosphère des cascades de particules secondaires qui vont générer une émission électromagnétique brève (< 100 ns) que les antennes de GRAND détecteront dans la gamme 50-200 MHz. Il s'agira ainsi, à partir des mesures radio des antennes, de reconstruire les paramètres primaires des particules incidentes (nature, énergie, direction d'arrivée, etc.). Pour estimer ces quantités, il est nécessaire d'exploiter les données de plusieurs antennes qui détectent en coïncidence l'émission radio des particules. Il s'agit ainsi de résoudre un problème inverse par des techniques d'apprentissage machine. Des expériences similaires utilisent déjà des GNN (Choma et al. 2018), mais l'originalité du travail proposé est que les données mesurées sur chaque noeud du graphe seront des séries temporelles. Les méthodes développées à travers l'étude de ce cas d'application physique seront applicables par la suite à d'autres cas d'usages, par exemple en radio-protection ou en sismologie.