Contribution à la commande dans un système multiagent : Application à la gestion des conflits entre les piétons et les véhicules autonomes et connectés dans les zones industrielles.
Auteur / Autrice : | Meng Zhang |
Direction : | Abdel Jalil Abbas-Turki, Abder Koukam |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 09/12/2022 |
Etablissement(s) : | Bourgogne Franche-Comté |
Ecole(s) doctorale(s) : | École doctorale Sciences pour l'ingénieur et microtechniques (Besançon ; 1991-....) |
Partenaire(s) de recherche : | Laboratoire : Connaissance et Intelligence Artificielle Distribuées (CIAD) (Dijon) - Connaissance et Intelligence Artificielle Distribuées [Dijon] / CIAD |
Etablissement de préparation : Université de technologie de Belfort-Montbéliard (1999-....) | |
Jury : | Président / Présidente : Stéphane Galland |
Examinateurs / Examinatrices : Abdel Jalil Abbas-Turki, Abder Koukam, René Mandiau, Cyril Fonlupt, Mohamed Quafafou | |
Rapporteur / Rapporteuse : René Mandiau, Cyril Fonlupt |
Mots clés
Résumé
Les conflits entre les véhicules autonomes et connectés (VAC) et les piétons nécessitent de nouvelles approches d’interaction. Parmi ces approches, l'affichage de l’intention du véhicule est actuellement un sujet de nombreux travaux de recherches. L'impact du comportement des véhicules sur le comportement des piétons a été largement étudié. Des résultats fructueux ont été obtenus. Cependant, à notre connaissance, aucun profil de vitesse adéquat n'a été proposé. Aussi, la plupart des travaux sont limités au scénario du conflit unique (un véhicule-un piéton).Cette thèse part du scénario de conflit unique et traite le piéton et le véhicule comme des agents. Un modèle mathématique du conflit est construit en utilisant les réseaux de Petri. Le principe du minimum de Pontryagin a été utilisé pour déduire les trajectoires optimales des deux agents, à savoir celle du véhicule et celle du piéton. Les simulations numériques montrent un gain significatif du temps d'intersection en utilisant des profils optimaux de vitesse.Pour des raisons évidentes de sécurité, la thèse propose un état optimal du VAC. Cet état permet au véhicule de pouvoir s’arrêter en cas de comportement imprévu du piéton. Il permet aussi de récupérer partiellement la distance perdue, lors du céder le passage. Le VAC se comporte en deux phases. En premier, il invite le piéton à passer en décélérant et en affichant son intention. Ensuite, il atteint l'état optimal à la sortie du piéton. Pour atteindre l'état optimal, la thèse propose une méthode d'apprentissage par renforcement profond (ARP) pour contrôler le VAC. Des tests en environnement virtuel immersif montrent que l'agent ARP peut contrôler le VAC pour être au plus près de l'état optimal. Aussi, des comparaisons avec la commande prédictive ont été réalisées. La commande à base de l'ARP est plus performante dans de nombreux scénarios.Enfin, la thèse étend le scénario aux traversées piétonnes de plusieurs voies. Elle propose un algorithme pour calculer l'ordre optimal de passage entre les VACs et les piétons et établit un modèle coopératif. Les résultats expérimentaux montrent que l'ordre de passage optimal améliore l'efficacité du trafic, tandis que le contrôleur ARP réduit le temps perdu par les VAC. La simulation montre que l'approche proposée permet aux VAC et aux piétons de gagner, respectivement, en moyenne 42% et 59% du temps de traversée. Ces résultats encourageants ouvrent de nouvelles perspectives de recherches sur les profils de vitesse des VACs pour la gestion des traversées piétonnes dans les zones industrielles.