Michal Valko
IdRefMots clés
FR |
EN
Apprentissage automatique
Apprentissage par renforcement (intelligence artificielle)
Matrices aléatoires
Échantillonnage (statistique)
Apprentissage séquentiel
Prise de décision (statistique)
Prédiction séquentielle
Réseaux neuronaux (informatique)
Minimisation du risque empirique
Ordonnancement
Bandit manchot
Apprentissage par renforcement
Processus ponctuels déterminantaux
Echantillonnage
Simulation
Méthodes Monte Carlo
Processus ponctuels
Monte-Carlo, Méthode de
Algorithmes en ligne
Jeux de bandits