Thèse en cours

Intelligence artificielle avec apprentissage profond pour la découverte de signaux complexes rares dans l'expérience ATLAS au LHC

FR  |  
EN
Auteur / Autrice : Vera Maiboroda
Direction : Frédéric Deliot
Type : Projet de thèse
Discipline(s) : Physique des particules
Date : Inscription en doctorat le 01/10/2021
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Particules, Hadrons, Énergie et Noyau : Instrumentation, Imagerie, Cosmos et Simulat
Partenaire(s) de recherche : Laboratoire : Département de Physique des Particules
référent : Faculté des sciences d'Orsay

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Ce sujet de thèse propose d'appliquer des algorithmes d'intelligence artificielle dans le domaine des données massives de deux manières innovantes en exploitant le grand lot de données collecté par l'expérience ATLAS au grand collisionneur de Hadrons (LHC). Le LHC crée des collisions entre faisceaux de particules à une vitesse proche de celle de la lumière avec une fréquence de 40 millions de fois par seconde, produisant ainsi des quantités considérables de données parmi lesquelles extraire des processus intéressants représente un énorme défi. Ce défi sera encore plus important dans le futur quand le LHC entrera dans sa phase haute luminosité, ayant pour but de collecter 10 fois plus de données que le lot actuel. Le but principal de cette nouvelle phase sera d'étudier avec précisions les petites déviations par rapport aux propriétés attendues de la “pierre angulaire” du modèle standard de la physique des particules: le boson de Higgs. Pour faire face à ces challenges, les algorithmes d'intelligence artificielle appliqués aux données massives joueront un rôle majeur. Ce sujet de thèse propose d'explorer cette voie en exploitant le lot de données unique du LHC collecté par l'expérience ATLAS grâce à des techniques d'apprentissage machine de pointe. Deux approches innovantes basées sur des techniques d'apprentissage profond seront étudiées. D'abord, des techniques d'apprentissage non supervisé seront testées pour reconstruire des états finaux complexes avec une cinématique sous-contrainte. Ensuite, l'apprentissage profond sera testé pour l'extraction de signaux rares. Plus de détails sur ces aspects sont donnés ci-dessous en particulier sur l'intérêt d'utiliser des méthodes numériques modernes. Ces nouveaux développements seront appliqués pour la première fois à la recherche de deux processus rares: la production de quark top en association avec un boson de Higgs (ttH) et la production de quatre quarks top (4-top). Ces deux processus commencent à être étudiés avec les données du LHC mais une compréhension plus précise de leurs propriétés est nécessaire. Étudier les processus ttH et 4-top permettra de faire la lumière sur la vraie nature du couplage entre le boson de Higgs et la particule élémentaire la plus lourde connue actuellement: le quark top. En particulier, les mesures précises du couplage Higgs-top pourraient permettre de révéler de nouvelles sources d'asymétrie entre matière et antimatière, ce qui est une des questions les plus importantes de la physique des particules aujourd'hui. Les processus ttH et 4-top seront extraits à partir d'états finaux avec plusieurs leptons pour bénéficier du bruit de fond réduit dans ces canaux. Cependant la reconstruction de ces états finaux est très compliquée du fait de la présence de plusieurs neutrinos qui échappent à la détection. De plus, ces états finaux incluent un grand nombre de particules, conduisant à des problèmes combinatoires complexes qu'il n'est pas facile de résoudre avec des algorithmes de reconstruction standard. Des stratégies d'apprentissage profond seront mises en place pour construire des estimateurs des quantités physiques intéressantes, en particulier les propriétés cinématiques du boson de Higgs et du quark top. Cela nécessitera d'implémenter et de tester pour la première fois des algorithmes d'apprentissage non supervisé pour la reconstruction d'état final et pourrait donc ouvrir une nouvelle voie pour résoudre ce type de problème. Des observables basés sur la reconstruction partielle ou complète de la cinématique des particules de l'état final offrira des outils pour une meilleure discrimination entre signal et bruit de fond. L'utilisation d'apprentissage profond basée sur ces observables pourra améliorer cette discrimination. Par exemple, des Graph Neural Networks (GNN) pourront être utilisés pour la première fois dans des analyses officielles de physique des particules. L'idée est de décrire les événements de collision par des arbres avec les objets reconstruits comme des nœuds et des connexions bidirectionnelles entre eux. Cette famille d'algorithmes peut également permettre de fournir des multi-classificateurs pour les différents bruits de fond. L'exploration de ces deux nouvelles stratégies pour la reconstruction des événements et leur classification ouvrira la voie pour l'exploitation optimale de l'énorme quantité de données attendue dans la phase du haute luminosité du LHC.