Niao He
Mots clés
FR |
EN
Optimisation
Apprentissage par renforcement
Méthodes de policy-gradient
Méthodes du second d'ordre stochastiques
Processus stochastiques
Analyse stochastique
Ordres stochastiques
Apprentissage par renforcement (intelligence artificielle)
Approximation stochastique
Méthodes à gradient adaptatives avec momentum
Evitement de pièges
Méthodes acteur-critique
Systèmes dynamiques
Apprentissage
Réseaux
Optimisation convexe
Apprentissage automatique
Calcul adaptatif