Méthodes Bayésiennes Efficaces Pour les Bandits Structurés en Grandes Dimensions.
FR |
EN
Auteur / Autrice : | Raymond Zhang |
Direction : | Sheng Yang |
Type : | Projet de thèse |
Discipline(s) : | Informatique mathématique |
Date : | Inscription en doctorat le 01/12/2022 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication |
Partenaire(s) de recherche : | Laboratoire : Laboratoire des Signaux et Systèmes |
Référent : CentraleSupélec |
Mots clés
FR |
EN
Mots clés libres
Résumé
FR |
EN
Le but de cette thèse est de proposer des algorithmes bayésiens efficaces en grandes dimensions pour les bandits structurés. Plusieurs questions importantes et non-triviales se posent pour résoudre ce problème: (i) Existe-il des moyens simples de prévoir dans quels cas l'échantillonnage de Thompson souffre du fléau de la dimension ? (ii) Est-il possible d'ajuster la distribution a priori afin de remédier à ce problème ? (iii) Existe-il des algorithmes de bandit bayésiens ne souffrant jamais du fléau de la dimension ? (iv) Comment généraliser ces résultats à l'apprentissage par renforcement ?