Apprentissage de Modèles Hiérarchiques par Démonstration pour la Planification et l'Action Délibérée
Auteur / Autrice : | Philippe Hérail |
Direction : | Simon Lacroix, Arthur Bit-Monnot |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique et Robotique |
Date : | Soutenance le 12/06/2024 |
Etablissement(s) : | Université de Toulouse (2023-....) |
Ecole(s) doctorale(s) : | École doctorale Systèmes (Toulouse ; 1999-....) |
Partenaire(s) de recherche : | Laboratoire : LAAS - Laboratoire d'Analyse et d'Architecture des Systèmes - Laboratoire d'analyse et d'architecture des systèmes / LAAS |
établissement délivrant conjointement le doctorat : Institut national des sciences appliquées (Toulouse ; 1961-....) | |
Jury : | Président / Présidente : Thierry Siméon |
Examinateurs / Examinatrices : Jane Jean Kiam | |
Rapporteur / Rapporteuse : Damien Pellier, Dana Nau |
Mots clés
Résumé
Le développement d'agents autonomes, en particulier d'agents physiques tels que les robots, nécessite des architectures complexes fonctionnant à différents niveaux d'abstraction. Compte tenu de la complexité des environnements réels, l'élaboration manuelle des modèles utilisés pour les différents niveaux devient rapidement difficile. Ces dernières années, de plus en plus de travaux se sont concentrés sur l'apprentissage de modèles au niveau sensorimoteur, c'est-à-dire pour la perception et les capacités motrices de base.L'apprentissage de modèles de plus haut niveau permettant les fonctions délibératives n'a pas bénéficié de la même attention.Parmi ces modèles de haut niveau, nous nous intéresserons aux réseaux de tâches hiérarchiques (Hierarchical Task Networks, HTN), qui constituent un formalisme de planification communément utilisé dans de nombreuses applications pratiques, des jeux vidéo aux robots. Actuellement, la conception de modèles HTN reste une tâche essentiellement manuelle, qui nécessite une expertise à la fois du domaine d'application et des systèmes utilisés pour la planification hiérarchique. Bien que certaines approches existent pour l'apprentissage des HTN, elles souffrent de certaines limitations, principalement au niveau de la structure des domaines qui peuvent être appris ou des annotations requises au niveau des données d'entrée.Dans cette thèse, nous proposerons une technique d'apprentissage pour des HTN à plusieurs niveaux hiérarchiques avec un minimum d'annotation des données d'entrée. Pour cela, nous proposerons deux contributions principales : une procédure d'apprentissage des structures HTN à partir de démonstrations et une procédure d'apprentissage de leurs paramètres à partir de ces démonstrations.L'approche d'apprentissage des structures s'appuiera sur des techniques d'extraction de motifs fréquents pour détecter des blocs intéressants à abstraire dans les démonstrations. Nous associerons cette extraction à un algorithme d'apprentissage de HTN existant. La qualité d'une structure HTN donnée sera évaluée, au cours de la recherche, au moyen d'une nouvelle métrique basée sur le principe de la longueur de description minimale (Minimum Description Length, MDL), qui servira de substitut à une couteuse évaluation des performances de planification.En outre, nous proposons une nouvelle méthode d'identification d'un ensemble pertinent de paramètres pour les HTN, reposant sur une approche MAX-SMT, qui peut être appliquée à la plupart des modèles HTN. L'association de nos contributions pour l'apprentissage d'une structure de modèle HTN et l'identification de ses paramètres nous permet de produire des modèles HTN complets que nous évaluons sur des domaines standard de la communauté de planification hiérarchique.