Thèse en cours

Vers des algorithmes de commande et d'estimation robustes associant modèles dynamiques incertains et apprentissage par renforcement

FR  |  
EN
Auteur / Autrice : Josué Nkaya-nkaya
Direction : Christophe CombastelJérôme Cieslak
Type : Projet de thèse
Discipline(s) : Automatique, Productique, Signal et Image, Ingénierie cognitique
Date : Inscription en doctorat le 05/10/2023
Etablissement(s) : Bordeaux
Ecole(s) doctorale(s) : École doctorale des sciences physiques et de l’ingénieur (Talence, Gironde ; 1995-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire de l'Intégration du Matériau au Système
Equipe de recherche : Approche Robuste et Intégrée de l'Automatique (ARIA)

Résumé

FR  |  
EN

Ce travail de thèse vise à développer une méthodologie et des algorithmes pour vérifier de manière robuste des propriétés de sécurité/sûreté dans des boucles de perception et de commande intégrant de l'apprentissage par renforcement. Cet apprentissage aura pour objectif d'améliorer les performances dynamiques dans des environnements changeants et mal connus, en prenant comme référence des techniques robustes/ensemblistes à base de modèles incertains de l'Automatique. Une mise en œuvre conjointe et aussi intégrée que possible (hybridation) d'approches dites « à base de modèle » et « sans modèle » sera étudiée, tout en veillant à préserver la possibilité de vérifier des propriétés de sécurité/sûreté utiles en vue de certifications. Il s'agira notamment de proposer des architectures de perception et de commande reposant sur une complémentarité entre i) et ii) : i) Modélisation dynamique incertaine et synthèse robuste/résiliente à différents types de perturbations et anomalies (défauts, attaques), afin de garantir la couverture de tests de conformité à des objectifs de performance donnés (ex : stabilité, précision, consommation). ii) L'intégration de méthodes d'apprentissage basées sur des jeux de données, d'abord exploités hors ligne, avant une vérification de propriétés (notamment celles liées à la robustesse) des algorithmes ensuite implémentés en ligne.