Techniques d'apprentissage automatique pour les jeux à champ moyen
Auteur / Autrice : | Mouhcine Assouli |
Direction : | Francisco José Silva alvarez, Badr Missaoui |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques et applications |
Date : | Inscription en doctorat le 29/11/2023 |
Etablissement(s) : | Limoges en cotutelle avec Université Mohammed VI Polytechnique |
Ecole(s) doctorale(s) : | Sciences et Ingénierie |
Partenaire(s) de recherche : | Laboratoire : XLIM |
Equipe de recherche : XLIM MATHIS - Mathématiques & Sécurité de l'information |
Mots clés
Résumé
- Résolution de problèmes de jeux à champ moyen déterministes en grande dimension. Ici, l'idée principale est de discrétiser seulement en temps, évitant ainsi la discrétisation en espace, source de la málediction de la dimension. La résolution du système en temps discret s'effectuera par la méthode de la partie fictive, classique en théorie de jeux, et des méthodes de simulation de trajectoires de type Monte-Carlo. - Approximation des solutions sans information préalable sur la dynamique et la fonction de coût. Cette situation, très relevante du point de vue pratique, peut-être décrite comme la théorie de l'Apprentissage par Renforcement, un des thèmes majeurs de l'Apprentissage Automatique, dans le contexte des jeux à champ moyen. Notre stratégie sera d'utiliser les techniques d'Apprentissage par Renforcement couplées avec la méthode de la partie fictive afin de résoudre la discrétisation décrite au paragraphe précédent.