Thèse en cours

DÉTECTION ET CARACTÉRISATION DES AMAS DE GALAXIES PAR DEEP LEARNING
FR  |  
EN
Auteur / Autrice : Stefano Gallo
Direction : Marian DouspisNabila Aghanim
Type : Projet de thèse
Discipline(s) : Astronomie et Astrophysique
Date : Inscription en doctorat le 01/10/2021
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : Astronomie et Astrophysique d'Ile de France
Partenaire(s) de recherche : Laboratoire : Institut d'Astrophysique Spatiale
Equipe de recherche : Cosmologie et Extragalactique
référent : Faculté des sciences d'Orsay

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les amas de galaxies sont les plus grands objets gravitationnellement liés de notre Univers et représentent une sonde cosmologique particulièrement puissante. En comptant par exemple le nombre d'amas en fonction du redshift et en le comparant au nombre prédit par les modèles cosmologiques on peut déterminer les parametres cosmologiques, notamment la quantité et la nature de l'énergie noire. Nous avons effectué de telles analyses en utilisant les amas détectés dans le domaine millimétrique (mm) ou en rayons X. D'autres études sont faites à partir des amas détectés en optique. Chaque étude est limitée par le nombre d'amas de galaxies détectés et surtout par l'homogénéité du catalogue utilisé. Dans ce domaine, les relevés de galaxies, tels qu'Euclid, revêtent une place de plus en plus importante car ils ouvrent la possibilité de détecter et de dénombrer les amas jusqu'à des distances très éloignées et donc de contraindre plus fermement le modèle cosmologique. Or malgré le relatif succès des méthodes de détection d'amas [1,2], l'exactitude et la précision des modèles sur lesquels ils se basent est aujourd'hui l'une des limitations principales à la détection optimale des amas de galaxies. En effet, les méthodes les plus avancées pour détecter les amas de galaxies sont basées sur le filtrage des données ou sur des approches bayésiennes tous deux fondés sur des modèles d'amas de galaxies. Ces modèles sont par nature incomplets. En effet, ils sont construits sur la base d'observations d'un nombre très limité d'objets dont la sélection souffre de biais (e.g. amas a coeur froid dans les X) et/ou dont la représentativité statistique est incomplète. Les catalogues d'amas obtenus et utilisés pour les analyses cosmologiques sont d'une part biaisés par le domaine d'observation et d'autre part incomplets. Par exemple, les propriétés des amas de galaxies détectés dans les données du relevé Planck sont très différentes de celle des amas détectés dans le domaine des rayons X. L'enjeu pour les relevés tels Euclid est de s'affranchir des modèles a priori pour détecter le plus d'amas possible et ne pas biaiser les catalogues, voire pour découvrir de nouvelles populations d'amas. Pour cela, l'exploration des données grâce à l'apprentissage automatique (IA) est une approche idéale. Nous proposons donc de développer à partir des outils IA (e.g. Generative Adversarial Networks, Artificial Neural Networks, Random Forests) que nous construisons depuis plusieurs années [3,4,5], une méthode optimale pour la détection d'amas de galaxies basée sur l'apprentissage profond (deep learning). L'apprentissage sera fondé sur des simulations hydrodynamiques en accès libre. Cette phase permettra d'identifier les principales propriétés des amas de galaxies et d'encoder ces informations sans recourir un à un modèle explicite. Dans une seconde étape, il s'agira d'utiliser simultanément les données hétérogènes collectées jusqu'à présent sur des fractions plus ou moins grandes du ciel (photométrie, spectroscopie, optique, X, mm) Ce jeu de données représentera le premier banc de test pour l'utilisation des méthodes d'apprentissage profond développées avec les simulations. Il permettra d'explorer les possibles effets instrumentaux sur la détection. Les catalogues ainsi construits seront comparés à ceux obtenus avec les méthodes de detection standard. Pour finir, la méthode d'apprentissage profond une fois optimisée pourra être appliquée sur les premiere données du relevé Euclid. Les nouveaux produits créés seront mis à disposition notamment par le biais des instances locales (IDOC, CDS-Paris-Saclay).