Apprentissage profond bayésien pour les analyses de lentillage faible : séparation de galaxies se recouvrant et estimation de paramètres des galaxies à partir de sources superposées
Auteur / Autrice : | Bastien Arcelin |
Direction : | Éric Aubourg |
Type : | Thèse de doctorat |
Discipline(s) : | Physique de l'Univers |
Date : | Soutenance le 20/09/2021 |
Etablissement(s) : | Université Paris Cité |
Ecole(s) doctorale(s) : | École doctorale Sciences de la terre et de l'environnement et physique de l'univers (Paris ; 2014-....) |
Partenaire(s) de recherche : | Laboratoire : AstroParticule et Cosmologie (Paris ; 2005-....) |
Jury : | Examinateurs / Examinatrices : Éric Aubourg, Shirley Ho, Joe Zuntz, Alan F. Heavens, Simona Mei, Stéphanie Escoffier, Junpeng Lao, Cécile Roucelle |
Rapporteurs / Rapporteuses : Shirley Ho, Joe Zuntz |
Mots clés
Mots clés contrôlés
Résumé
Le lentillage gravitationnel faible est l'une des sondes cosmologiques les plus prometteuses pour contraindre les paramètres de l'énergie noire. Il correspond à la modification de l'image d'une source, induite par la courbure de l'espace-temps, et donc du passage des rayons lumineux, générée par la présence de masse le long de la ligne de visée. Cet effet est très faible et ne peut être détecté qu'en mesurant la corrélation des formes d'un ensemble de sources en arrière-plan. La valeur de cette corrélation donne la mesure du cisaillement gravitationnel. Plusieurs relevés dédiés à son étude vont bientôt démarrer, tels que le Vera Rubin Legacy Survey of Space and Time (LSST), et Euclid. Ces relevés ont été construits avec des exigences particulières, notamment sur le traitement des erreurs systématiques, afin d'atteindre une précision extrême sur les paramètres de l'équation d'état de l'énergie noire. Cette thèse s'est déroulée dans le contexte de la Dark Energy Science Collaboration (DESC), au sein de l'expérience LSST. Elle se focalise sur la problématique de la superposition de sources. Cet effet génère une incertitude systématique dominante dans la mesure du cisaillement gravitationnel. Cette systématique impacte à la fois les mesures de forme et celles du décalage vers le rouge des galaxies, deux mesures nécessaires à l'étude du lentillage gravitationnel faible. Nous proposons deux solutions basées sur les méthodes bayésiennes d'apprentissage profond. La première est un algorithme de séparation de galaxies qui utilise un réseau de neurones génératif appelé autoencodeur variationnel. Ce réseau de neurones permet l'apprentissage d'un prior pour la génération d'images de galaxie isolée. Celui-ci est utilisé dans un second réseau qui fait la séparation de la galaxie centrale sur des images de galaxies simulées. Nous montrons que l'analyse jointe des pixels des données LSST et Euclid permet une diminution de l'erreur médiane de reconstruction des formes des galaxies de 8 à 47%. La superposition de sources étant étroitement liée à l'étape de détection, nous démontrons la robustesse de notre méthode à de petits décentrages. Nous avons aussi testé notre méthode sur des images de vraies galaxies artificiellement superposées, montrant l'intérêt du transfert d'apprentissage à partir d'un réseau de neurones entraîné sur des images de galaxies simulées. Une processus itératif est ensuite mis en place afin de pouvoir séparer toutes les galaxies d'une image en passant par des étapes de détection, classification, et séparation des sources. Enfin, cet algorithme de séparation de galaxies est testé sur des images extraites de la simulation DC2, générée au sein de DESC dans le but de préparer à l'analyse des futures images prises par LSST. Nos résultats montrent une amélioration de 70 à 120% sur l'erreur médiane de reconstruction des formes comparée à la méthode générique utilisée dans la pipeline LSST actuellement. Ensuite, inspirés de cette première méthode, nous proposons un réseau de neurones permettant de faire directement l'estimation des paramètres de forme et de décalage vers le rouge d'une galaxie à partir des images DC2, sans appliquer de méthode de séparation de sources. Nous montrons que ce réseau permet des mesures précises de ces paramètres, même lorsque les sources sont superposées, et comparons ces résultats à ceux obtenus avec séparation de source. Par la suite, nous présentons une première application d'un réseau de neurones bayésien à l'estimation des formes des galaxies. Ce type de réseau permet l'estimation de l'incertitude épistémique qui représente l'incertitude liée à l'échantillon d'entraînement. Celle-ci peut être vue comme un niveau de confiance dans la mesure réalisée par le réseau, une information cruciale à l'utilisation des réseaux de neurones en science et en cosmologie. Elle permet de diminuer l'importance (voir de rejeter) d'une mesure qui a de fortes probabilités d'être erronée dans l'analyse.