Système délibératif d'un robot autonome : planification probabiliste hiérarchique basée sur des motivations et prise en compte de ressources
Auteur / Autrice : | Raphaël Gottstein |
Direction : | Raja Chatila |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 13/07/2017 |
Etablissement(s) : | Paris 6 |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris (1992-...) |
Partenaire(s) de recherche : | Laboratoire : Institut des systèmes intelligents et de robotique (Paris ; 2009-....) |
Jury : | Président / Présidente : Catherine Pelachaud |
Examinateurs / Examinatrices : François Charpillet, Catherine Tessier | |
Rapporteurs / Rapporteuses : Rachid Alami, Abdel-Illah Mouaddib |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Si les travaux menés dans le domaine des sciences de la décision ont permis de résoudre des problèmes variés, la capacité pour un agent à être autonome dans le choix de ses objectifs reste un problème difficile à traiter. Cette capacité est pourtant indispensable à l'autonomie dans son environnement pour un agent. Cette thèse a pour objectif de permettre à un robot de planifier ses actions pour de multiples objectifs contradictoires, dans un environement probabiliste et avec des ressources. La première contribution de ce travail est la proposition d'un nouveau modèle pour les objectifs, la motivation, constitué à partir d'un automate. Celui-ci décrit l'évolution de chaque objectif à l'aide d'états et de transitions correspondant à la réalisation de tâches, et définit les gains de récompenses. La deuxième contribution concerne une méthode de planification utilisant les motivations. Cette méthode est hiérarchique, proposant de résoudre la réalisation des tâches déterminantes pour les motivations dans un premier temps. En exploitant le contexte spécifique de chaque tâche, nous pouvons calculer rapidement leur politique et calculer leur modèle d'exécution, que nous appelons macro-action. Nous utilisons ensuite ces macro-actions dans un processus de planification local de haut-niveau, permettant de retourner un plan conditionnel des macro-actions à exécuter, que nous appelons agenda des macro-actions. Pour résoudre un problème dans sa longueur, nous proposons d'incluer ce système de planification dans une architecture délibérative qui permettra de contrôler l'exécution des agenda et d'en produire de nouveaux.