Thèse soutenue

Machine learning interprétable pour l'analyse de données à CLAS12

FR  |  
EN
Auteur / Autrice : Noëlie Cherrier
Direction : Franck Sabatié
Type : Thèse de doctorat
Discipline(s) : Physique hadronique
Date : Soutenance le 01/03/2021
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Particules, hadrons, énergie et noyau : instrumentation, imagerie, cosmos et simulation (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Département de physique nucléaire (Gif-sur-Yvette, Essonne) - Département de métrologie, instrumentation et information (Gif-sur-Yvette, Essonne ; 2008-....)
Référent : Faculté des sciences d'Orsay
Jury : Président / Présidente : David Rousseau
Examinateurs / Examinatrices : Christophe Denis, David Ireland, Michael Mayo
Rapporteur / Rapporteuse : Christophe Denis, David Ireland

Résumé

FR  |  
EN

L’intelligence artificielle rencontre un succès indéniable dans de nombreuses applications, surtout depuis l’essor de l’apprentissage profond. Cependant, certaines de ces applications nécessitent une étude et une validation du raisonnement du modèle induit. C’est le cas en physique expérimentale : les performances des modèles sur les données réelles doivent être connues et maîtrisées, et leur raisonnement expliqué afin de permettre une validation par les pairs. Dans le cas particulier de l’expérience CLAS12 au Jefferson Laboratory, un faisceau d’électrons est envoyé sur une cible de protons afin d’en sonder la structure interne. Pour pouvoir accéder à certaines fonctions de structure du proton, un sous-ensemble des données récoltées doit être isolé correspondant à une réaction exclusive : la diffusion Compton profondément virtuelle. C’est sur la sélection de ces événements que porte cette thèse. Pour améliorer les techniques classiques d’analyse en physique, une approche utilisant des modèles de machine learning intrinsèquement interprétables, dits également transparents, est proposée. De cette façon, le fonctionnement du modèle peut être plus facilement compris et les erreurs de sélection maîtrisées et minimisées.