Thèse en cours

Calibrage de l'énergie des jets avec entraînement ML in-situ et identification des anomalies en Physique des Hautes Energies et Finance

FR  |  
EN
Auteur / Autrice : Laura Boggia
Direction : Mélissa Ridel
Type : Projet de thèse
Discipline(s) : Physique de l'Univers
Date : Inscription en doctorat le 03/10/2022
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Sciences de la terre et de l'environnement et physique de l'univers
Partenaire(s) de recherche : Laboratoire : Laboratoire de Physique Nucléaire et des Hautes Energies

Résumé

FR  |  
EN

L'objectif de cette thèse de doctorat est d'automatiser l'apprentissage de modèles de décision en combinant des méthodes statistiques et des méthodes basées sur la connaissance pour des applications dans (i) la physique des hautes énergies pour la reconnaissance des collisions de particules et (ii) le cas commercial de la détection de la fraude pour identifier les modèles créés par l'homme (fraude) dans les transactions financières. Les données disponibles pour la formation dans le cadre de ce projet consisteront en de larges échantillons d'événements simulés et de données expérimentales réelles provenant de l'expérience ATLAS au LHC. Les réseaux de détection impliqués dans l'expérience sont soumis à diverses sources de bruit ou à des fluctuations dans la réponse, qui peuvent déclencher des mesures non désirées ou biaisées. Par conséquent, le premier projet qui correspond à la tâche de qualification de l'ATLAS vise à combiner plusieurs étapes du schéma d'étalonnage actuel, basé soit sur la simulation de Monte Carlo, soit sur des données expérimentales (étalonnage in-situ), avec l'apprentissage automatique. En partant d'un modèle d'apprentissage supervisé fonctionnant uniquement avec des simulations de Monte Carlo, l'objectif est d'injecter des informations supplémentaires provenant de données expérimentales. Il est essentiel d'inclure dans l'étalonnage ce genre d'informations afin de compenser les différences potentielles entre simulation et expérience. Dans la continuation directe de la tâche de qualification, le projet suivant du côté d'ATLAS se concentre sur l'identification d'événements anormaux de dijets entraînant des réponses inhabituelles des jets. En outre, des simulations rapides sont utilisées pour pouvoir ajouter et contrôler de telles anomalies. Ceci est important car cela pourrait permettre d'en savoir plus sur la nature de ces anomalies et leurs causes. Il est également intéressant de voir quelles informations sont nécessaires pour les identifier dès les données brutes où presque aucune caractéristique de haut niveau n'est donnée puisque les contrôles de qualité des données sont effectués avant l'étalonnage du jet. Parallèlement, les techniques mises au point pour la détection des anomalies dans la physique des hautes énergies sont adaptées au cas de la détection des fraudes dans les flux de transactions à grande vitesse, où des problèmes similaires de détection d'anomalies sont présents. Les plateformes de paiement détectent les transactions frauduleuses en temps réel en identifiant les schémas de fraude connus encodés par les experts humains. Elles utilisent également la modélisation prédictive pour identifier des modèles de transaction inédits (et anormaux) susceptibles d'être frauduleux. Les techniques susmentionnées de détection des anomalies seront adaptées au problème de la modélisation prédictive. Ce projet est réalisé en collaboration avec IBM Research, qui fait également partie de ce projet de thèse de doctorat.