Thèse soutenue

Abstractions basées sur les données pour l'apprentissage sécurisé de systèmes non-linéaires

FR  |  
EN
Auteur / Autrice : Anas Makdesi
Direction : Antoine GirardLaurent Fribourg
Type : Thèse de doctorat
Discipline(s) : Automatique
Date : Soutenance le 07/12/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire des signaux et systèmes (Gif-sur-Yvette, Essonne ; 1974-....)
référent : CentraleSupélec (2015-....)
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Jury : Président / Présidente : Sorin Olaru
Examinateurs / Examinatrices : Nacim Ramdani, Manuel Mazo, Sylvie Putot, Sadegh Soudjani
Rapporteurs / Rapporteuses : Nacim Ramdani, Manuel Mazo

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Les méthodes de contrôle traditionnelles pour les systèmes non linéaires reposent fortement sur des modèles mathématiques précis, qui peuvent être difficiles, voire impossibles à obtenir dans certaines applications réelles. Pour résoudre ce problème, des techniques de contrôle basées sur les données ont émergé comme des alternatives prometteuses, utilisant des données d'entrée-sortie pour apprendre des politiques de contrôle directement à partir du comportement du système. Cependant, la sûreté reste une préoccupation essentielle dans le contrôle basé sur les données, car des modèles erronés peuvent avoir des conséquences catastrophiques. Ce travail propose une nouvelle approche basée sur les données pour contrôler les systèmes non linéaires, en mettant l'accent sur la sûreté pendant le processus d'apprentissage. L'approche proposée utilise des sur-approximations de la dynamique du système, qui fournissent des représentations conservatives mais sûres du comportement du système. Ces sur-approximations sont apprises à partir de données d'entrée-sortie et sont ensuite utilisées pour construire des abstractions à états finis, qui capturent la dynamique essentielle du système sous une forme compacte et analysable. Cette abstraction est ensuite utilisée pour la synthèse du contrôleur, garantissant que le contrôleur maintient les propriétés et spécifications désirées tout au long du fonctionnement du système. Une approche à deux modèles est introduite, où des modèles distincts sont construits pour la vérification de la sûreté et l'optimisation des performances. Le modèle de vérification de la sûreté est utilisé pour garantir que le contrôleur appris adhère aux contraintes de sûreté, tandis que le modèle d'optimisation des performances se concentre sur l'obtention des mesures de performance souhaitées. Cette séparation des préoccupations garantit que la sécurité est priorisée sans compromettre les performances. L'approche proposée est rigoureusement analysée pour une large classe de systèmes non linéaires, y compris les systèmes monotones et les systèmes avec des fonctions dérivées bornées. Ces analyses fournissent des garanties théoriques pour la sûreté des contrôleurs appris et établissent la robustesse de la méthodologie de conception proposée. L'efficacité des méthodes proposées est démontrée par une validation expérimentale approfondie sur divers systèmes non linéaires réels, notamment le contrôle de vitesse, la planification de trajectoires et les systèmes chaotiques (système de Lorenz). Ces expériences démontrent systématiquement la capacité de l'approche proposée à atteindre des performances satisfaisantes tout en maintenant une stricte adhésion aux contraintes de sûreté.