Connexions entre apprentissage par renforcement et contrôle
FR |
EN
Auteur / Autrice : | Lucas Weber |
Direction : | Laurent Massoulié |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 01/09/2021 |
Etablissement(s) : | Université Paris sciences et lettres |
Ecole(s) doctorale(s) : | École doctorale Sciences mathématiques de Paris centre (Paris ; 2000-....) |
Partenaire(s) de recherche : | Laboratoire : DIENS - Département d'informatique de l'École normale supérieure |
établissement opérateur d'inscription : École normale supérieure (Paris ; 1985-....) |
Mots clés
FR |
EN
Résumé
FR |
EN
L'objectif de cette thèse est de proposer de nouveaux modèles d'algorithmes d'apprentissage par renforcement inspirés par des outils de la théorie du contrôle. Pour appliquer ces idées au monde réel, de nombreuses questions ouvertes doivent être traitées. Différentes pistes pourront être suivies : - Exploiter une connaissance partielle de la dynamique du système et/ou de sa politique optimale - Dynamique contrainte - Apprentissage par renforcement et commande prédictive