Claire Vernade
Mots clés
FR |
EN
Apprentissage par renforcement (intelligence artificielle)
Problème du bandit manchot
Processus de Markov
Apprentissage automatique
Machines à sous
Prise de décision (statistique)
Apprentissage séquentiel
Problèmes de bandits
Identification de meilleur bras
Statistiques séquentielles
Apprentissage statistique
Intelligence artificielle
Systèmes de recommandation
Bandits Manchots
Modèles mathématiques
Bandit combinatoire
Régions de confiance
Efficience computationnelle
Optimisation combinatoire
Algorithmes à régions de confiance