Thèse en cours

Optimisation stochastique et apprentissage par renforcement pour la résilience des infrastructures en réseau face au changement climatique
FR  |  
EN
Auteur / Autrice : Pascal Quach
Direction : Yiping Fang
Type : Projet de thèse
Discipline(s) : Génie industriel
Date : Inscription en doctorat le 01/11/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale INTERFACES : approches interdisciplinaires, fondements, applications et innovation
Partenaire(s) de recherche : Laboratoire : Laboratoire Génie Industriel
référent : CentraleSupélec

Résumé

FR  |  
EN

Les IN (par exemple, les réseaux électriques et les réseaux de télécommunications) constituent l'épine dorsale du fonctionnement de nos sociétés modernes. Cependant, la vulnérabilité inhérente découlant des forces croissantes de la complexité, du vieillissement et du couplage des systèmes, entrelacée avec un paysage de risques exogènes de plus en plus compliqué et incertain, en particulier en raison du changement climatique mondial, pousse les systèmes au bord de défaillances catastrophiques. Ainsi, le concept de résilience, défini comme la capacité d'un système à résister, à s'adapter et à se remettre des perturbations, est apparu comme un nouveau paradigme au cours de la dernière décennie et a été considérablement mis en avant par les chercheurs, les praticiens et les décideurs. La résilience est un concept multiphase, et par conséquent, les modèles prescriptifs pour l'amélioration de la résilience de l'IN doivent prendre en compte différentes étapes : i) ex-ante, y compris la planification stratégique et la préparation à court terme, et ii) ex-post, y compris l'intervention d'urgence et la planification du relèvement. Un problème crucial des méthodes ex-ante pour l'amélioration de la résilience NI est qu'une décision (d'un ensemble d'actions, telles que les extensions, les protections et la mise à niveau du système) doit souvent être identifiée à partir d'un grand nombre d'alternatives dans une profonde incertitude des perturbations futures. Ce projet abordera ce problème en proposant des méthodes prescriptives ex-ante robustes (par exemple, l'optimisation) qui intègrent toutes les informations disponibles mais ambiguës sur l'incertitude des événements climatiques perturbateurs. En outre, les modèles normatifs ex-post visent à faciliter les efforts de réponse et de récupération de NI après un événement perturbateur, par exemple, la reconfiguration de la structure dans les réseaux de distribution d'énergie et la planification et l'acheminement post-catastrophe des équipes de réparation, où des décisions efficaces doivent être prises. aussi rapidement que possible dans des environnements post-catastrophe hautement critiques et dynamiques. Améliorer la résilience de NI grâce à des opérations ex post efficaces nécessite généralement de résoudre des problèmes d'optimisation combinatoire à grande échelle, souvent dans des espaces stochastiques. La littérature actuelle recourt principalement à des modèles d'optimisation mathématiques qui luttent à la fois contre l'incertitude et la malédiction de la dimensionnalité, ce qui pose un défi important pour les appliquer aux NI à grande échelle du monde réel. Ce projet exploitera des approches sans modèle et basées sur l'apprentissage telles que l'apprentissage par renforcement (profond) qui ont été reconnus comme un cadre prometteur pour résoudre les problèmes de prise de décision avec des espaces d'état-action de grande dimension. Les problèmes difficiles tels que la «sélection de domaine» et l'écart «simulation-réalité» seront soigneusement abordés dans le projet lors de la conception d'architectures RL / DeepRL efficaces et efficaces pour les systèmes NI du monde réel. Vous travaillerez au sein d'un projet hautement interdisciplinaire, à l'intersection de la recherche opérationnelle (optimisation stochastique et robuste), de l'apprentissage automatique (apprentissage par renforcement) et de l'ingénierie, où vous développerez de nouvelles méthodes de modélisation, d'optimisation sous incertitude et d'apprentissage par renforcement. pour la résilience NI. Plus précisément, vous participerez à (i) Caractériser et comptabiliser les futurs événements à risque climatique associés à la planification et à l'exploitation des systèmes NI (en mettant l'accent sur les réseaux électriques et les réseaux de télécommunication) ; (ii) Développer des méthodes robustes (de distribution) de pointe pour tenir compte de l'incertitude profonde dans les modèles d'optimisation de la résilience ex ante ; (iii) Développer des méthodes de pointe basées sur l'apprentissage par renforcement pour résoudre les problèmes de planification de la réponse et du rétablissement ex post pour l'amélioration de la résilience du système. À cette fin, vous aurez accès à des capacités de calcul de pointe et vous serez en contact avec des experts de premier plan à CentraleSupélec, à l'Université Paris Saclay et à l'international.