Des programmes mathématiques pour les processus décisionnels de Markoff décentralisés et partiellement observés
Auteur / Autrice : | Raghav Aras |
Direction : | François Charpillet, Alain Dutech |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 23/10/2008 |
Etablissement(s) : | Nancy 1 |
Ecole(s) doctorale(s) : | IAEM - Ecole Doctorale Informatique, Automatique, Électronique - Électrotechnique, Mathématiques |
Partenaire(s) de recherche : | Laboratoire : Laboratoire lorrain de recherche en Informatique et ses Applications |
Equipe de recherche : MAIA | |
Jury : | Président / Présidente : Philippe Mathieu |
Examinateurs / Examinatrices : François Charpillet, Alain Dutech, Philippe Mathieu, Shlomo Zilberstein, Nadine Piat, René Schott | |
Rapporteurs / Rapporteuses : Shlomo Zilberstein, Nadine Piat |
Mots clés
Résumé
Nous étudions le problème du contrôle optimale décentralisé d'un processus de Markoff partiellement observé sur un horizon fini. Mathématiquement, ce problème se défini comme un DEC-POMDP. Plusieurs problèmes des domaines de l'intélligence artificielles et recherche opérationelles se formalisent comme des DEC-POMDPs. Résoudre un DEC-POMDP dans une mannière exacte est un problème difficile (NEXP-dur). Pourtant, des algorithmes exactes sont importants du point de vue des algorithmes approximés pour résoudre des problèmes pratiques. Les algorithmes existants sont nettement inefficace même pour des DEC-POMDP d'une très petite taille. Dans cette thèse, nous proposons une nouvelle approche basée sur la programmation mathématique. En utilisant la forme séquentielle d'une politique, nous montrons que ce problème peut être formalisé comme un programme non-linéaire. De plus, nous montrons comment transformer ce programme nonl-linéaire un des programmes linéaire avec des variables bivalents et continus (0-1 MIPs). L'éxpérience computationelle sur quatres problèmes DEC-POMDP standards montrent que notre approche trouve une politique optimale beaucoup plus rapidement que des approches existantes. Le temps réduit des heures aux seconds ou minutes.