Vers le passage à l'échelle de l'allocation en ligne multi-agents multi-tâches
Auteur / Autrice : | Déborah Conforto nedelmann |
Direction : | Jérôme Lacan, Caroline Ponzoni carvalho chanel |
Type : | Projet de thèse |
Discipline(s) : | Robotique et Informatique |
Date : | Inscription en doctorat le Soutenance le 26/11/2024 |
Etablissement(s) : | Toulouse, ISAE |
Ecole(s) doctorale(s) : | École doctorale Systèmes |
Partenaire(s) de recherche : | Laboratoire : ISAE-ONERA DECISIO DECIsion, Supervision et Interaction pour l'Opération de systèmes complexes |
Jury : | Président / Présidente : Gauthier Picard |
Examinateurs / Examinatrices : Jérôme Lacan, Jean-Paul Jamont, Olivier Simonin, Caroline Ponzoni carvalho chanel, Aurélie Beynier | |
Rapporteur / Rapporteuse : Jean-Paul Jamont, Aurélie Beynier |
Mots clés
Résumé
Cette thèse s'inscrit dans le contexte de l'allocation en ligne multi-agents multi-tâches, dont le but est de coordonner efficacement un ensemble d'agents (ressources) afin de distribuer des tâches entre eux. À titre d'exemple d'application, nous pouvons citer les cas où des clients font des requêtes à un fournisseur de services qui cherchera la meilleure répartition des tâches parmi son ensemble d'agents : des taxis répondant à la demande des clients ou des robots assurant la distribution de colis. Contrairement au cadre hors ligne, qui suppose une connaissance totale du problème d'allocation à résoudre avant le début de lallocation, dans le cadre en ligne, les tâches arrivent au cours du temps et doivent être allouées de manière dynamique. Ce cadre d'optimisation en ligne présente plusieurs défis. Tout d'abord, l'allocation répétée des tâches aux agents est un problème NP-difficile, dont une solution doit être trouvée en un temps limité, parfois très court. Ensuite, la connaissance sur l'arrivée de futures tâches (par exemple, moment d'arrivée et localisation) est en général modeste, ce qui rend difficile le raisonnement sur le long terme (cest-à-dire optimiser le positionnement des agents pour la planification à plus long terme). Enfin, la taille du problème à traiter en termes d'agents et de tâches peut être importante, particulièrement dans un cadre réaliste où la recherche dune solution en temps limité peut être parfois compromise. Dans ce contexte, cette thèse propose différentes contributions. Tout d'abord, cette thèse propose une approche proactive qui permet d'anticiper la disponibilité des agents dans un futur proche afin d'obtenir une coordination efficace (cest-à-dire minimisant la distance parcourue par les agents et le temps qu'ils restent désuvrés). Cette approche proactive a été comparée à une approche réactive classique. Les résultats obtenus dans deux problèmes de référence, l'un synthétique et l'autre basé sur des données réelles, montrent que la méthode proactive permet d'obtenir de meilleurs résultats en termes de coûts et de nombre de tâches allouées aux agents par rapport à une approche réactive, tout en diminuant le temps d'inactivité des ressources. Malgré les résultats encourageants obtenus, la méthode proposée présente des limitations de scalabilité dans notre problème de référence basé sur des données réelles. Pour pallier cette limitation, cette thèse propose une deuxième approche qui développe une méta-heuristique d'allocation multi-agent multi-tâche, appelée SKATE - Successive Rank-based Task Assignment for Proactive Online Planning, permettant le passage à l'échelle. SKATE permet de traiter des problèmes avec des milliers d'agents et de tâches en obtenant des solutions efficaces en temps limité. SKATE présente de bons résultats en termes de coût des solutions trouvées pour un tel ordre de grandeur d'agents et de tâches, comparé à des méthodes classiques de la littérature, telles qu'un algorithme génétique ou la programmation linéaire en nombres entiers. Grâce à ces résultats, cette thèse a pu envisager deux extensions à SKATE. La première extension permet d'optimiser non seulement les assignations de tâches, mais aussi le nombre d'agents à considérer. Pour cela, cette thèse développe deux méthodes qui permettent d'optimiser à la fois le nombre d'agents (économie de ressources pour le fournisseur de services) tout en garantissant la satisfaction des utilisateurs (temps d'attente avant réalisation d'une tâche). La deuxième extension couple SKATE avec des outils de calcul vérifiable, permettant d'une part aux agents de vérifier que l'assignation des tâches a été correctement effectuée par le serveur central, et d'autre part de contrer des attaques cyber-physiques qu'un réseau d'agents mobiles pourrait subir dans des environnements hostiles, par exemple.