Apprentissage et évolution en présence de bruit et d'incertitude
Auteur / Autrice : | Pierre-Louis Cauvin |
Direction : | Panayotis Mertikopoulos, Jerome Malick |
Type : | Projet de thèse |
Discipline(s) : | Mathématiques Appliquées |
Date : | Inscription en doctorat le 01/05/2024 |
Etablissement(s) : | Université Grenoble Alpes |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique de Grenoble |
Mots clés
Résumé
Une question centrale dans l'étude des dynamiques de jeux est de se demander si le résultat d'un processus d'apprentissage ou d'évolution est aussi justifiable d'un point de vue rationnel en particulier, si le processus mène vers un équilibre de Nash ou tout autre concept rationnellement acceptable. Plus spécifiquement, en présence de bruit et d'incertitudes, les joueurs d'un jeu n'ont pas forcément l'entière connaissance de sa structure. Mais les participants sont tout de même sensés s'adapter en accumulant des informations empiriques sur les avantages relatifs des différentes stratégies pures à leur disposition. Cela constitue le principe même de l'apprentissage en théorie des jeux, et met en avant l'une des questions les plus importantes du domaine : 'Est-ce qu'apprendre à l'aide d'observations empiriques mène à un équilibre de Nash ? Et, si c'est le cas, à quelle vitesse ?' La recherche contemporaine en théorie des jeux s'est principalement concentrée sur l'analyse de propriétés de stabilité et d'instabilité pour différents types d'équilibres par rapport à des algorithmes populaires d'apprentissage. En particulier, il a été montré que les équilibres stricts de Nash apparaissent comme les seuls points limites stables de l'apprentissage régularisé en présence de bruit. Les principaux objectifs de cette thèse consistent à aller plus loin que l'analyse qualitative de la stabilité asymptotique (stochastique) des équilibres stricts de Nash, et de : (a) Déterminer les propriétés structurelles et/ou variationnelles des ensembles limites de processus d'apprentissage régularisé et évolutionnaires dans les jeux (en temps continu et discret). (b) Développer une théorie unificatrice pour étudier des propriétés similaires de stabilité et de convergence dans des problèmes d'équilibre plus généraux (avec ou sans structure convexe, en fonction des applications). (c) Etudier les propriétés de convergence ergodique (telles que les mesures invariantes) de jeux et de problèmes avec des ensembles intérieurs évolutionnairement stables (ou tout autre concept d'équilibre fragile ne restant pas asymptotiquement stable en présence de bruit).