Obtenir un contrôle fiable : robustesse et stabilité des systèmes non linéaires grâce aux lois des commandes basée sur les DNNs
Auteur / Autrice : | Samuele Zoboli |
Direction : | Vincent Andrieu, Jilles Steeve Dibangoye, Daniele Astolfi |
Type : | Thèse de doctorat |
Discipline(s) : | Automatique |
Date : | Soutenance le 28/09/2023 |
Etablissement(s) : | Lyon 1 |
Ecole(s) doctorale(s) : | École doctorale Électronique, électrotechnique, automatique (Lyon) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Automatique, de Génie des Procédés et de génie Pharmaceutique (Lyon) |
Jury : | Président / Présidente : Bernhard Maschke |
Examinateurs / Examinatrices : Vincent Andrieu, Marc Jungers, Christopher Michael Kellett, Maryam Kamgarpour, Sophie Cerf | |
Rapporteur / Rapporteuse : Marc Jungers, Christopher Michael Kellett |
Mots clés
Mots clés contrôlés
Résumé
Cette thèse se concentre sur l'intégration des garanties de robustesse et de stabilité dans les contrôleurs de rétroaction modélisés par des réseaux de neurones profonds (DNNs), parfois nommés contrôleurs neuronaux. L'objectif principal est de combiner les outils d'apprentissage automatique et les approches de la théorie du contrôle pour dériver des contrôleurs neuronaux avec des garanties théoriques. Dans la première partie du manuscrit, nous étudions comment la théorie du contrôle peut être utilisée pour équiper les approches d'apprentissage de contrôleurs avec des garanties de stabilité et de robustesse. Une question clé est le défi de comprendre si ces lois de contrôle, entraînée dans des environnements simulés, peuvent fournir des garanties de stabilité et les maintenir dans des scénarios du monde réel. Par conséquent, la première partie de ce manuscrit se concentre sur les systèmes non linéaires à temps discret. Le premier chapitre étudie la robustesse aux incertitudes du modèle. Nous établissons des conditions pour le transfert des propriétés de stabilité basées uniquement sur les normes des erreurs entre modèles. Nous montrons que l'existence et la stabilité des points d'équilibre pour un système nominal impliquent l'existence et la stabilité des points d'équilibre pour des systèmes similaires. Nous justifions ainsi l'utilisation de simulateurs pour l’entraînement de contrôleurs neuronaux destinés à des scénarios réels. Ces résultats motivent aussi l'utilisation d'intégrateurs pour améliorer la robustesse des contrôleurs à temps discret, pour lesquels il n'existe actuellement aucune justification formelle. Dans le deuxième chapitre, nous étudions comment les propriétés de stabilité peuvent être intégrées dans les lois de rétroaction basées sur les DNNs. Nous proposons une méthodologie qui intègre des garanties de stabilité locale dans ces contrôleurs, indépendamment de leur algorithme d'apprentissage ou du temps. En combinant des lois de contrôle locales avec des DNNs, notre approche permet de développer des contrôleurs neuronaux robustes et stabilisantes. Dans le troisième chapitre, nous passons de l'étude de la stabilité robuste des points d'équilibre à celle des trajectoires. Plus précisément, nous examinons le concept de stabilité incrémentale pour les systèmes non linéaires à temps discret. Nous présentons des contrôleurs basés sur la théorie de la contraction en temps discret et nous les appliquons au problème de la synchronisation multi-agents. En établissant un lien entre les contrôleurs proposés et la solution d'un problème d'optimisation, nous ouvrons la voie à la dérivation de contrôleurs neuronales qui garantissent une convergence robuste vers des trajectoires uniques. La deuxième partie du manuscrit explore la direction inverse en étudiant comment les outils d'apprentissage automatique peuvent aider à l'application des contrôleurs dérivés de la théorie du contrôle, sans compromettre leurs propriétés. Nous nous concentrons sur la dérivation de contrôleurs neuronaux contractants pour les systèmes non linéaires à temps continu. Nous regardons les contrôleurs basés sur des métriques Riemanniennes car leur calcul analytique est généralement difficile. Dans le quatrième chapitre de cette thèse, nous étudions comment les contrôleurs basés sur les DNNs peuvent aider à surmonter cet obstacle de calcul. Nous dérivons de nouvelles lois analytiques qui peuvent être directement approximées avec des DNNs. Enfin, le chapitre 5 introduit le concept de k-contraction en tant que généralisation de la notion de contraction. L'objectif est de fournir une meilleure compréhension géométrique des propriétés exhibées par une dynamique contractive. Nous proposons un remaniement des définitions existantes, adapté spécifiquement à des fins de contrôle. Ce faisant, nous faisons un pas vers le développement de contrôleurs (éventuellement basés sur des DNNs) qui peuvent appliquer un riche ensemble de comportements en boucle fermée.