Thèse soutenue

ExaSKA : Parallélisation sur serveur de calcul intensif pour le radiotelescope exascale SKA

FR  |  
EN
Auteur / Autrice : Nicolas Monnier
Direction : Nicolas GacFrançois OrieuxCyril Tasse
Type : Thèse de doctorat
Discipline(s) : Sciences du traitement du signal et des images
Date : Soutenance le 12/06/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire des signaux et systèmes (Gif-sur-Yvette, Essonne ; 1974-....)
Référent : CentraleSupélec (2015-....)
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….)
Jury : Président / Présidente : Charles Soussen
Examinateurs / Examinatrices : Damien Gratadour, Éric Thiébaut, Martin Schreiber, John W. Romein, Caroline Kulcsár
Rapporteur / Rapporteuse : Damien Gratadour, Éric Thiébaut, Martin Schreiber

Résumé

FR  |  
EN

Les radio interféromètres simulent un grand télescope via un réseau d'antennes. L'imagerie reconstruit une image du ciel observé via les signaux reçus par les antennes, qui sont dans le domaine spatial, mais dont les données, les visibilités, sont situées dans le domaine de Fourier. Ce problème de reconstruction est ''mal-posé'' car les mesures ne couvrent pas l'entièreté du plan de Fourier et sont corrompues par les effets de la propagation des signaux dans l'atmosphère terrestre.Les algorithmes itératifs utilisent de l'information a priori sur le ciel pour la reconstruction, mais nécessitent une interpolation des visibilités sur une grille uniforme pour utiliser des algorithmes de transformée de Fourier rapide. Dans le modèle ''backward'', l'interpolation, appelée gridding, étale les visibilités sur une grille uniforme en utilisant un noyau de convolution. Dans le modèle ''forward'', l'interpolation, appelée degridding, est l'opération adjointe qui regroupe l'information sur une zone centrée sur la position de la visibilité.Le traitement et la conservation des visibilités sont très coûteux en raison du débit de données extrêmement important généré par les radiotélescopes, en particulier avec la nouvelle génération d'interféromètres. La reconstruction d'image est un défi majeur en raison du coût calculatoire élevé des opérateurs d'interpolation, le gridding et degridding, et des algorithmes de reconstruction qui sont un goulot d'étranglement.Cette thèse se concentre sur la réduction du temps de calcul des méthodes d'imagerie en se concentrant sur deux aspects: l'aspect algorithmique et l'implémentation hardware avec une parallélisation à grain fin et à gros grain. Une méthode de réduction du coût calculatoire des opérateurs de gridding et degridding est présentée en les fusionnant en un opérateur unique, nommé Grid to Grid (G2G), qui s'appuie sur la succession des deux opérateurs ainsi que sur l'approximation des coordonnées des visibilités sur la grille de Fourier. Les implémentations CPU et GPU de cette méthode montrent que G2G réduit considérablement le coût calculatoire et l'empreinte mémoire sans pénaliser la qualité de la reconstruction. Le facteur de suréchantillonnage sert d'équilibre entre la réduction du coût calculatoire et la précision de l'interpolation.Une distribution multi-coeur multi-node sur serveur HPC du framework d'imagerie DDFacet est également présentée. La parallélisation est divisée en plusieurs niveaux: une parallélisation multi-cœur pour systèmes à mémoire partagée basée sur l'indépendance des calculs entre les facettes, et une parallélisation multi-nœud pour système à mémoire distribuée basée sur l'indépendance des calculs du gridding et degridding entre les différentes fréquences d'observation. Cette double parallélisation réduit considérablement le temps d'exécution et l'accélération n'est pas linéaire, permettant de choisir un optimum entre l'accélération et les ressources de calculs utilisées.