Thèse soutenue

Analyse d'image cherenkov à l'aide de l'apprentissage profond multitâche à partir des données d'un seul télescope

FR  |  
EN
Auteur / Autrice : Mikaël Jacquemont
Direction : Patrick LambertGilles Christian Georges MaurinAlexandre BenoîtThomas Vuillaume
Type : Thèse de doctorat
Discipline(s) : STIC Informatique
Date : Soutenance le 26/11/2020
Etablissement(s) : Chambéry
Ecole(s) doctorale(s) : École doctorale sciences et ingénierie des systèmes, de l'environnement et des organisations (Chambéry ; 2007-2021)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'informatique, systèmes, traitement de l'information et de la connaissance (Annecy) - Laboratoire d'Annecy-le-Vieux de physique des particules
Jury : Président / Présidente : Mathieu de Naurois
Examinateurs / Examinatrices : Jenny Benois Pineau
Rapporteur / Rapporteuse : Abelardo Moralejo Olaizola, Georges Quénot

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

L'astronomie gamma consiste en l'observation des photons les plus énergétiques produits par les phénomènes astrophysiques violents. Leur étude permet de mieux comprendre les lois qui, notamment, gouvernent la création des étoiles et l'évolution des galaxies. Elle permet aussi d'explorer une nouvelle physique. Les télescopes Cherenkov situés sur Terre détectent indirectement les rayons gamma grâce à la gerbe électromagnétique qu'ils génèrent en pénétrant l'atmosphère. L'analyse du rayonnement gamma consiste en sa séparation du bruit de fond, les rayons cosmiques, et la reconstruction de son énergie et de sa direction incidente. Cette analyse est complexe, car les rayons cosmiques peuvent produire des images très similaires à celles des gammas et le rapport signal sur bruit est typiquement inférieur à 1/1000.Le Cherenkov Telescope Array (CTA) constitue la nouvelle génération d'observatoire de l'univers à très haute énergie. Composé de plus de 100 télescopes répartis sur 2 sites, CTA aura une sensibilité 10 fois meilleure que les observatoires actuels tout en améliorant la précision de la reconstruction. En contrepartie, une fois achevé CTA produira une énorme quantité de données (210 Po/an) devant être analysées en temps réel. De plus, toutes les données acquises seront retraitées chaque année afin de bénéficier des améliorations de l'analyse. CTA met à mal les méthodes standard, trop lentes ou manquant de sensibilité à basse énergie. Il est donc nécessaire d'explorer d'autres pistes. S'appuyant sur les récentes avancées des réseaux de neurones artificiels, cette thèse propose une nouvelle approche deep learning pour analyser les données de CTA, en particulier celles du Large-Sized Telescope 1 (LST1), prototype installé sur site.La première contribution de cette thèse est une méthode rendant possible l'application des algorithmes de deep learning aux images ayant des organisations de pixels quelconques. Celle-ci fournit les opérateurs convolution et pooling, déterminants dans les succès des réseaux de neurones. Cette méthode respecte le voisinage réel des pixels, permet d'éviter un prétraitement et une augmentation artificielle de la taille des images. Son intérêt par rapport aux méthodes classiques de ré-échantillonnage est démontré pour les images à pixels hexagonaux du LST1. La deuxième et principale contribution est une architecture multitâche, γ-PhysNet, inspirée de la physique qui réalise la reconstruction complète des évènements gamma. Celle-ci bénéficie d'un mécanisme d'attention la rendant plus robuste aux conditions d'initialisation. Sur les données de simulation utilisées pour préparer les algorithmes d'analyse, γ-PhysNet obtient des résultats significativement meilleurs, tant en sensibilité qu'en résolution spatiale, que la méthode standard combinant une extraction des paramètres Hillas et une analyse multivariée de type Random Forest. Le gain de sensibilité à basse énergie pourrait permettre d'améliorer l'étude des phénomènes transitoires. γ-PhysNet est également 800 fois plus rapide que la méthode la plus performante. Par ailleurs, cette thèse présente une analyse préliminaire du réseau proposé à l'aide d'une méthode d'explicabilité visuelle afin de mieux comprendre son comportement. Enfin, les premières données d'observation du ''Crabe'' prise par le LST1, qui est encore en phase de mise en service, sont analysées avec γ-PhysNet. Cette analyse très préliminaire met en évidence le besoin d'une meilleure adaptation aux données réelles. Enfin, la dernière contribution est un ensemble d'outils facilitant l'utilisation du deep learning avec les données de CTA et assurant la robustesse et la reproductibilité des résultats.