Thèse soutenue

Modélisation de la voie lactée en 3D par machine learning avec les données infrarouges et Gaia

FR  |  
EN
Auteur / Autrice : David Cornu
Direction : Annie RobinJulien Montillaud
Type : Thèse de doctorat
Discipline(s) : Astrophysique
Date : Soutenance le 29/09/2020
Etablissement(s) : Bourgogne Franche-Comté
Ecole(s) doctorale(s) : École doctorale Carnot-Pasteur (Besançon ; Dijon ; 2012-....)
Partenaire(s) de recherche : Laboratoire : Institut UTINAM (Univers, transport, interfaces, nanostructures, atmosphère et environnement, molécules) (Besançon) - Univers- Transport- Interfaces- Nanostructures- Atmosphère et environnement- Molécules (UMR 6213) / UTINAM
Etablissement de préparation : Université de Franche-Comté (1971-2024)
Jury : Président / Présidente : Raphaël Couturier
Examinateurs / Examinatrices : Annie Robin, Julien Montillaud, Raphaël Couturier, Rosine Lallement, Luis, M Sarro Baro, Douglas, J. Marshall, Sylvain Bontemps, Anne, S.M. Buckner
Rapporteur / Rapporteuse : Rosine Lallement, Luis, M Sarro Baro

Résumé

FR  |  
EN

La structure à grande échelle de la Voie-Lactée (VL) n'est actuellement toujours pas parfaitement contrainte. Contrairement aux autres galaxies, il est difficile d'observer directement sa structure du fait de notre appartenance à celle-ci. La confusion entre les étoiles et l'occultation de la lumière par le milieu interstellaire (MIS) sont les principales sources de difficulté qui empêchent la reconstruction de la structure sous-jacente de la VL. Par ailleurs, de plus en plus de relevés astronomiques de grande ampleur sont disponibles et permettent de surmonter ces difficultés. Le relevé Gaia et ses 1.6 milliards mesures de distances aux étoiles est le nouvel outil de prédilection pour l’étude de la structure de la VL et l’analyse des populations stellaires. Ces nouvelles données peuvent être combinées avec d’autres grands relevés infrarouges (IR) afin d’effectuer des mesures à des distances jusque-là inégalées. Par ailleurs, le nombre d’applications reposant sur des méthodes d’apprentissage machine (AM) s’est envolé ces vingt dernières années et celles-ci sont de plus en plus employées en astronomie. Ces méthodes sont capables d’automatiser la résolution de problèmes complexes ou encore d’extraire efficacement des statistiques sur de grands jeux de données.Dans cette étude, nous commençons par décrire la construction d’un outil de classification par AM utilisé pour améliorer les méthodes classiques de classification des Jeunes Objets Stellaires (JOS). Comme les étoiles naissent dans un environnement interstellaire dense, il est possible d’utiliser les plus jeunes d’entre elles, qui n’ont pas encore eu le temps de s’éloigner de leur lieux de formation, afin d’identifier les structures denses du MIS. La combinaison des JOS et des distances mesurées par Gaia permet alors de reconstruire la structure 3D des nuages denses. Notre méthode de classification par AM est basée sur les réseaux de neurones artificiels et se sert des données du télescope spatial Spitzer pour reconstruire automatiquement la classification des JOS sur la base d’une liste d’exemples. Nous détaillons la construction des jeux de données associés ainsi que l’effet du déséquilibre entre les classes, ce qui permet d’optimiser les prédictions du réseau et d’estimer la précision associée. Cette méthode est capable d’identifier des JOS dans de très grands relevés tout en fournissant une probabilité d’appartenance pour chacun des objets testés. Celle-ci peut alors être utilisée pour retenir les objets les plus fiables afin de reconstruire la structure des nuages.Dans une seconde partie, nous présentons une méthode permettant de reconstruire la distribution 3D de l’extinction dans la VL et reposant sur des réseaux de neurones convolutifs. Cette approche permet de prédire des profils d’extinction sur la base de données IR provenant du relevé 2MASS. Ce réseau est entraîné à l’aide du modèle de la Galaxie de Besançon afin de reproduire la distribution en distance de l’extinction à grande échelle en s’appuyant sur la comparaison entre le modèle et les données observées. Nous avons ainsi reconstruit une grande portion du plan Galactique dans la région du bras de la Carène, et avons montré que notre prédiction est compétitive avec d’autres cartes d’extinction 3D qui font référence. Nos résultats sont notamment capables de prédire des structures spatialement cohérentes, et parviennent à réduire les artefacts fréquents dits ``doigts de Dieu''. Cette méthode est parvenue à résoudre des structures distantes jusqu’à 10 kpc avec une résolution formelle de 100 pc. Notre réseau est également capable de combiner les données 2MASS et Gaia sans avoir recours à une identification croisée. Cela permet d’utiliser automatiquement le jeu de données le plus pertinent en fonction de la distance. Les résultats de cette prédiction combinée sont encourageants et ouvrent la voie à de nouvelles reconstructions du plan Galactique en combinant davantage de jeux de données.