Thèse soutenue

Intelligence artificielle et contrôle des plasmas de fusion : application au tokamak WEST

FR  |  
EN
Auteur / Autrice : Samy Kerboua-Benlarbi
Direction : Blaise FaugerasRémy Nouailletas
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 05/11/2024
Etablissement(s) : Université Côte d'Azur
Ecole(s) doctorale(s) : École doctorale Sciences fondamentales et appliquées
Partenaire(s) de recherche : Laboratoire : Laboratoire J.-A. Dieudonné (Nice)
Jury : Président / Présidente : Laurent Lefèvre
Examinateurs / Examinatrices : Blaise Faugeras, Rémy Nouailletas, Laurent Lefèvre, Federico Felici, Sylvain Lamprier, Olivier Sauter
Rapporteurs / Rapporteuses : Federico Felici, Sylvain Lamprier

Résumé

FR  |  
EN

La fusion dans un plasma magnétiquement confiné relève encore du domaine de la recherche fondamentale : en plus de la nécessaire progression de nos connaissances théoriques, l'opération des tokamaks actuels reste délicate, car elle nécessite un effort humain substantiel à chaque fois qu'un nouveau scénario expérimental est mis au point. En outre, la combinaison habituelle de rétroactions linéaires et de contrôle en boucle ouverte, n'est pas suffisamment robuste quant au comportement non linéaire des dynamiques du plasma. L'approche en question n'est donc pas compatible avec la fiabilité d'un futur réacteur, et un meilleur contrôle du plasma est nécessaire par le biais d'algorithmes de contrôle utilisant des connaissances plus théoriques ou empiriques. Récemment, l'apprentissage par renforcement a démontré son utilité dans de nombreux domaines, notamment le contrôle des tokamaks. Par essai-erreur, un agent interagit sur un environnement, pour apprendre une politique décisionnelle maximisant une récompense formalisant les tâches à accomplir. Une fois associé aux réseaux de neurones, l'apprentissage par renforcement profond devient un candidat pertinent pour répondre à ces situations en grande dimension, aux nombreuses incertitudes, et non linéaires. Ces travaux visent à appliquer et étendre ces méthodes au tokamak WEST, au travers du développement d'une plateforme logicielle pour entraîner un agent sur code d'équilibre à frontière libre, qui simule l'équilibre magnétique et l'évolution des profils au cœur du plasma. Le contrôle magnétique par rétroaction de la forme, de la position et du courant du plasma est alors réalisé sur plusieurs scénarios de contrôle, avec des temps d'entraînements considérablement réduits grâce à l'utilisation de l'apprentissage par curriculum. Plusieurs procédures sont discutées, non seulement pour améliorer la généralisation au sein du domaine opérationnel du système de contrôle temps-réel de WEST, mais aussi pour explorer la robustesse des agents appris par renforcement face aux perturbations et aux incertitudes du plasma. Les résultats obtenus offrent de nombreuses perspectives en faveur de l'apprentissage par renforcement et de l'intelligence artificielle pour une utilisation routinière dans les opérations d'un dispositif de fusion magnétiquement confiné. Les liens inhérents établis entre l'apprentissage par renforcement et le contrôle classique sont étayés, et pourraient conduire à une meilleure interprétabilité des réseaux de neurones en tant que politiques puissantes et robustes, potentiellement capables de gérer un plus grand nombre d'actionneurs et d'objectifs pendant de longues décharges de plasma.