Thèse soutenue

Apprentissage de Modèles Hiérarchiques par Démonstration pour la Planification et l'Action Délibérée

FR  |  
EN
Auteur / Autrice : Philippe Hérail
Direction : Simon LacroixArthur Bit-Monnot
Type : Thèse de doctorat
Discipline(s) : Informatique et Robotique
Date : Soutenance le 12/06/2024
Etablissement(s) : Université de Toulouse (2023-....)
Ecole(s) doctorale(s) : École doctorale Systèmes (Toulouse ; 1999-....)
Partenaire(s) de recherche : Laboratoire : LAAS - Laboratoire d'Analyse et d'Architecture des Systèmes - Laboratoire d'analyse et d'architecture des systèmes / LAAS
établissement délivrant conjointement le doctorat : Institut national des sciences appliquées (Toulouse ; 1961-....)
Jury : Président / Présidente : Thierry Siméon
Examinateurs / Examinatrices : Jane Jean Kiam
Rapporteur / Rapporteuse : Damien Pellier, Dana Nau

Résumé

FR  |  
EN

Le développement d'agents autonomes, en particulier d'agents physiques tels que les robots, nécessite des architectures complexes fonctionnant à différents niveaux d'abstraction. Compte tenu de la complexité des environnements réels, l'élaboration manuelle des modèles utilisés pour les différents niveaux devient rapidement difficile. Ces dernières années, de plus en plus de travaux se sont concentrés sur l'apprentissage de modèles au niveau sensorimoteur, c'est-à-dire pour la perception et les capacités motrices de base.L'apprentissage de modèles de plus haut niveau permettant les fonctions délibératives n'a pas bénéficié de la même attention.Parmi ces modèles de haut niveau, nous nous intéresserons aux réseaux de tâches hiérarchiques (Hierarchical Task Networks, HTN), qui constituent un formalisme de planification communément utilisé dans de nombreuses applications pratiques, des jeux vidéo aux robots. Actuellement, la conception de modèles HTN reste une tâche essentiellement manuelle, qui nécessite une expertise à la fois du domaine d'application et des systèmes utilisés pour la planification hiérarchique. Bien que certaines approches existent pour l'apprentissage des HTN, elles souffrent de certaines limitations, principalement au niveau de la structure des domaines qui peuvent être appris ou des annotations requises au niveau des données d'entrée.Dans cette thèse, nous proposerons une technique d'apprentissage pour des HTN à plusieurs niveaux hiérarchiques avec un minimum d'annotation des données d'entrée. Pour cela, nous proposerons deux contributions principales : une procédure d'apprentissage des structures HTN à partir de démonstrations et une procédure d'apprentissage de leurs paramètres à partir de ces démonstrations.L'approche d'apprentissage des structures s'appuiera sur des techniques d'extraction de motifs fréquents pour détecter des blocs intéressants à abstraire dans les démonstrations. Nous associerons cette extraction à un algorithme d'apprentissage de HTN existant. La qualité d'une structure HTN donnée sera évaluée, au cours de la recherche, au moyen d'une nouvelle métrique basée sur le principe de la longueur de description minimale (Minimum Description Length, MDL), qui servira de substitut à une couteuse évaluation des performances de planification.En outre, nous proposons une nouvelle méthode d'identification d'un ensemble pertinent de paramètres pour les HTN, reposant sur une approche MAX-SMT, qui peut être appliquée à la plupart des modèles HTN. L'association de nos contributions pour l'apprentissage d'une structure de modèle HTN et l'identification de ses paramètres nous permet de produire des modèles HTN complets que nous évaluons sur des domaines standard de la communauté de planification hiérarchique.