Thèse en cours

Méthodes Bayésiennes Efficaces Pour les Bandits Structurés en Grandes Dimensions.

FR  |  
EN
Auteur / Autrice : Raymond Zhang
Direction : Sheng Yang
Type : Projet de thèse
Discipline(s) : Informatique mathématique
Date : Inscription en doctorat le 01/12/2022
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication
Partenaire(s) de recherche : Laboratoire : Laboratoire des Signaux et Systèmes
Référent : CentraleSupélec

Résumé

FR  |  
EN

Le but de cette thèse est de proposer des algorithmes bayésiens efficaces en grandes dimensions pour les bandits structurés. Plusieurs questions importantes et non-triviales se posent pour résoudre ce problème: (i) Existe-il des moyens simples de prévoir dans quels cas l'échantillonnage de Thompson souffre du fléau de la dimension ? (ii) Est-il possible d'ajuster la distribution a priori afin de remédier à ce problème ? (iii) Existe-il des algorithmes de bandit bayésiens ne souffrant jamais du fléau de la dimension ? (iv) Comment généraliser ces résultats à l'apprentissage par renforcement ?