Nicolas Gutowski
IdRefMots clés
FR |
EN
Systèmes de recommandation (informatique)
Apprentissage par renforcement (intelligence artificielle)
Bandit manchot (mathématiques)
Contexte
Diversité
Précision individuelle
Recommandations à multiple éléments
Fonctions de récompenses
Sélection d'algorithme
Optimisation multicritère
Problème du bandit manchot
Système de recommandation
Évaluation hors ligne
Modèle de mémoire
POMDP
Objectif à long terme
Processus décisionnels de Markov relationnels
Qualité de l'enseignement
Mémoire
Apprentissage interactif