Analyse de la meilleure dynamique de réponse dans les jeux potentiels
Auteur / Autrice : | Stéphane Durand |
Direction : | Bruno Gaujal, Federica Garin |
Type : | Thèse de doctorat |
Discipline(s) : | Mathématiques et informatique |
Date : | Soutenance le 11/12/2018 |
Etablissement(s) : | Université Grenoble Alpes (ComUE) |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, sciences et technologies de l'information, informatique (Grenoble ; 1995-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'informatique de Grenoble (2007-....) - Grenoble Images parole signal automatique (2007-....) |
Jury : | Président / Présidente : Denis Trystram |
Examinateurs / Examinatrices : Olivier Brun, Johanne Cohen | |
Rapporteur / Rapporteuse : Giacomo Como, Jean Mairesse |
Mots clés
Résumé
Dans le contexte de la théorie des jeux, les équilibres de Nash, ie les états dans lesquels aucun joueur ne peut augmenter son utilité en changeant sa stratégie unilatéralement, sont une des formes principales de solutions des jeux. Ils sont les états les plus probables rencontrés lors de l’évolution des systèmes, des points de stabilité, et sont l'objet de nombreuse propriétés utiles ( le prix de l'anarchie bornant la distance à un optimum du jeu, par exemple). La classe des jeux de potentiels est une large sous classe des jeux incluant entre autre tous les jeux de congestions, et permettant de modéliser un grand nombre de problèmes. dans cette classe, il est difficile de trouver un équilibre de Nash: ce problème est PLS -complet, PLS étant une classe de complexité située entre P et NP. La dynamique de meilleure réponse, un algorithme glouton assez simple utilisé initialement comme outil de preuve pour montrer l'existence d'équilibre de Nash dans tous jeux, admet une complexité en pire cas exponentielle en le nombre de joueurs. En conséquence, cette dynamique n'est pas considérée un outil efficace pour obtenir un équilibre. Dans cette thèse, nous allons montrer que cet algorithme est efficace et robuste, selon le critère de l'analyse en moyenne. Dans le cas le plus simple, on obtient une borne linéaire sur le temps moyen avant convergence, a l'aide d'une approximation par une chaîne de Markov qui peut être résolue analytiquement. Cette approche montre que la dynamique de meilleure réponse reste efficace pour des conditions d'utilisation beaucoup plus générales. Cela inclus les systèmes distribués (des joueurs indépendants, chacun ayant peu de connaissances sur les états des autres) avec une borne en O(n log n), ainsi que les systèmes dans lesquels les joueurs ne connaissent pas leurs utilités avec une borne du même ordre. Cette approche montre également comment profiter d'une structure de type réseau pour obtenir une complexité fonction du nombre de voisins au lieu du nombre de joueurs .