Ciara Pike-Burke
IdRefMots clés
FR |
EN
Apprentissage automatique en ligne
Bandit manchot (mathématiques)
Réseaux de graphes
Apprentissage automatique collaboratif
Estimation moyenne
Apprentissage par renforcement (intelligence artificielle)
Réseaux d'ordinateurs
Processus de Décision Markoviens
Identification de la meilleure politique
Exploration sans récompense
Apprentissage par Renforcement
Exploration pure
Processus décisionnels de Markov relationnels
Prise de décision -- Modèles mathématiques