Marc Abeille
IdRefMots clés
FR |
EN
Apprentissage par renforcement (intelligence artificielle)
Algorithme Thompson sampling
Bandits multi-Bras
Bandits linéaires
Contrôle des systèmes linéaires quadratiques
Apprentissage automatique
Prise de décision (statistique)
Limite diffusive
Contrôle stochastique
Apprentissage par renforcement
Enchères séquentielles
Equations de Hamilton - Jacobi Bellman
Optimiste devant l'incertain
Markov, Spectre de
Processus stochastiques
Hamilton-Jacobi, Équations de
Bandits multi-bras
Statistique non paramétrique
Problème du bandit manchot