Thèse en cours

Connexions entre apprentissage par renforcement et contrôle

FR  |  
EN
Auteur / Autrice : Lucas Weber
Direction : Laurent Massoulié
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/09/2021
Etablissement(s) : Université Paris sciences et lettres
Ecole(s) doctorale(s) : École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....)
Partenaire(s) de recherche : Laboratoire : DIENS - Département d'informatique de l'École normale supérieure
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....)

Résumé

FR  |  
EN

L'objectif de cette thèse est de proposer de nouveaux modèles d'algorithmes d'apprentissage par renforcement inspirés par des outils de la théorie du contrôle. Pour appliquer ces idées au monde réel, de nombreuses questions ouvertes doivent être traitées. Différentes pistes pourront être suivies : - Exploiter une connaissance partielle de la dynamique du système et/ou de sa politique optimale - Dynamique contrainte - Apprentissage par renforcement et commande prédictive