Détection robuste de sources astronomiques par réseaux de neurones à convolutions

par Maxime Paillassa

Projet de thèse en Astrophysique, Plasmas, nucléaire

Sous la direction de Hervé Bouy et de Emmanuel Bertin.

Thèses en préparation à Bordeaux , dans le cadre de Sciences Physiques et de l'Ingénieur , en partenariat avec Laboratoire d'Astrophysique de Bordeaux (laboratoire) et de Métrologie de l'espace, Astrodynamique, Astrophysique (M2A) (equipe de recherche) depuis le 11-09-2017 .


  • Résumé

    L'exploitation scientifique des images astronomiques se fait majoritairement par l'analyse des catalogues d'objets (sources ponctuelles, galaxies) qui en sont extraits. Pour ce processus de catalogage nous disposons aujourd'hui d'algorithmes automatisés et raisonnablement efficaces à même d'effectuer la détection et la mesure des milliards de sources présentes dans les données. Ces algorithmes reposent largement sur des bases empiriques, notamment pour assurer une certaine robustesse envers les nombreux contaminants (sources voisines, aigrettes de diffraction, reflets optiques, halos, défauts cosmétiques et de transfert de charge, impacts de rayons cosmiques, persistence, motifs électroniques, ...). Cependant leur performance en terme de fiabilité et de complétude, devient désormais insuffisante vis-à-vis des exigences de programmes scientifiques en cours ou en développement (Cosmic-DANCe, Euclid, et relevés associés). Un bond qualitatif est nécessaire, respectant les contraintes de temps de traitement imposées par les volumes de données. Cette thèse se propose d'aborder les problèmes de la détection et la séparation de sources par apprentissage automatique supervisé au moyen de réseaux neuronaux à convolution. Cette approche a prouvé son large potentiel au cours de travaux exploratoires récemment effectués dans notre équipe à l'IAP (Paillassa 2016). Contrairement aux techniques d'apprentissage automatique ayant déjà fait l'objet d'applications en imagerie astronomique, il s'agira ici de définir et générer une méthode d'étiquetage multi-instance des pixels des sources directement à partir d'un set hétérogène d'images multi-canal, en s'appuyant sur l'état de l'art dans le domaine. La gestion du fond de ciel et celui de la grande dynamique des images font partie des difficultés qu'il faudra prendre en compte. L'apprentissage faisant appel à un large volume de simulations d'images et d'image réelles via des outils existants, ce travail de recherche impliquera la mise au point d'une procédure d'augmentation des données adaptée au problème (contenu multiépoque et multicanal) et la manipulation de masses de données d'images dans un environnement de calcul distribué intensif et de processeurs de calcul graphiques (GPU) de dernière génération au LAB (Bordeaux) et à l'IAP (Paris). Le travail sur simulations et données se fera en étroite collaboration avec les équipes de Euclid et CFIS (champs à faible densité), particulièrement à l'IAP et Cosmic-DANCe (haute densité) à Bordeaux. Enfin le dernier aspect de cette thèse concernera la validation statistique des modèles et algorithmes, ainsi que leur application aux images associées au relevés Cosmic-DANCe et CFIS.

  • Titre traduit

    Robust detection of astronomical sources using convolutional neural networks


  • Résumé

    Most scientific results derived from astronomical images are obtained by analyzing catalogs of objects (essentially point sources and galaxies) that are extracted from those images. Automated and reasonably efficient algorithms are now capable of detecting and measuring billions of sources in large imaging surveys. These algorithms are largely empirical, and achieve a certain robustness towards the many contaminants that affect observations (neighboring sources, diffraction spikes, optical reflections, halos, cosmetic and charge transfer defects, cosmic ray hits, persistence, electronic patterns, ...). However, their performance in terms of reliability and completeness is now insufficient with regard to the scientific requirements of current or forthcoming experiments (Cosmic-DANCe, Euclid, and the associated surveys). A qualitative leap is necessary, which must also satisfy the processing time constraints imposed by the large amount of data that must be processed. The goal of this thesis is to address the problem of detecting and deblending sources by means of deep convolutional neural networks. This approach has proved its great potential during recent exploratory work by our team at IAP (Paillassa and Bertin 2016). In contrast to machine learning techniques that have already been applied to astronomical data, the aim here will be to define and apply a multi-instance pixel labeling method directly from a heterogeneous set of multichannel images, relying on state-of-the-art techniques in the field. The sky background and the high dynamic range that characterize astronomical images will have to be taken into account. This research work will require the development of a data augmentation procedure adapted to the problem (multiepoch and multichannel content) and the manipulation of a large volume of image simulations and real observations in an intensive distributed computing environment, using the latest generation graphical computing (GPU) processors at LAB (Bordeaux) and IAP (Paris). The work on simulations and data will be done in close collaboration with the Euclid and CFIS teams at IAP (for low density fields), and Cosmic-DANCe in Bordeaux (high density fields). The final aspect of this thesis will be the statistical validation of the models and algorithms on Euclid and ground image simulations as well as their application to actual Cosmic-DANCe and CFIS survey data.