Thèse soutenue

Data-driven control for complex structures and systems with guarantees

FR  |  
EN
Auteur / Autrice : Daniel Xavier Martín
Direction : Ludovic ChamoinLaurent Fribourg
Type : Thèse de doctorat
Discipline(s) : Mécanique des solides et des structures
Date : Soutenance le 15/12/2025
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences Mécaniques et Energétiques, Matériaux et Géosciences
Partenaire(s) de recherche : Laboratoire : Laboratoire de mécanique Paris-Saclay (Gif-sur-Yvette, Essonne ; 2022-....)
Référent : Ecole Normale Supérieure Paris-Saclay
graduate school : Université Paris-Saclay. Graduate School Sciences de l'ingénierie et des systèmes (2020-....)
Jury : Président / Présidente : Gaël Chevallier
Examinateurs / Examinatrices : Luc Jaulin, Nazih Mechbal, Sylvie Putot
Rapporteurs / Rapporteuses : Luc Jaulin, Nazih Mechbal
DOI : 10.70675/935027a3zafc3z47a5za2d3z96436e045967

Résumé

FR  |  
EN

Le contrôle prédictif (Model Predictive Control) constitue un cadre puissant pour la commande de systèmes non linéaires sous contraintes. Cependant, sa dépendance à la résolution répétée de problèmes d'optimisation peut rendre son utilisation en temps réel prohibitive. Cette limitation est particulièrement critique dans les applications industrielles où les décisions doivent être prises en quelques millisecondes, et où les délais de calcul compromettent les performances et la sécurité. Cette thèse explore l'apprentissage de lois de commande afin de réduire le coût de calcul dans les applications temps réel. Le contrôleur est modélisé par un réseau de neurones multicouche (feedforward) qui associe l'état courant et la référence à une action de commande. Des paradigmes d'apprentissage supervisé et non supervisé sont considérés pour approximer la loi de retour du MPC, déplaçant ainsi la complexité computationnelle de la résolution en ligne d'un problème d'optimisation vers l'entraînement hors ligne d'un réseau de neurones. Comme les stratégies fondées sur les données n'intègrent pas automatiquement la prise en compte des contraintes, un filtre en une étape est introduit afin de garantir leur satisfaction en corrigeant minimalement la sortie du réseau. Un second axe méthodologique vise à quantifier l'erreur d'approximation. Des bornes de généralisation basées sur la complexité de Rademacher sont établies pour les politiques neuronales apprises par supervision. Par ailleurs, la convergence de l'erreur d'entraînement est analysée pour des réseaux sous-paramétrés, à l'aide du formalisme du Neural Tangent Kernel. L'ensemble des développements numériques est validé par des simulations en boucle fermée sur deux cas tests représentatifs (oscillateur de Van der Pol et banc à quatre réservoirs), ainsi que sur deux applications industrielles : le forgeage et le contrôle de turbines d'éoliennes. Ces résultats définissent un cadre de commande fondé sur les données, capable de réduire le coût de calcul en ligne tout en fournissant des éclairages théoriques pour l'obtention de garanties futures en commande temps réel.