Gergely Neu
IdRefMots clés
FR |
EN
Apprentissage par renforcement (intelligence artificielle)
Minimisation du risque empirique
Ordonnancement
Bandit manchot
Apprentissage par renforcement
Apprentissage automatique
Jeux à champ moyen
Jeux non coopératifs (mathématiques)
Intelligence artificielle répartie
Programmation dynamique
Itération (mathématiques)
Processus décisionnels de Markov relationnels