De lorganisation dun système multi-agent de cyberdéfense
| Auteur / Autrice : | Julien Soule |
| Direction : | Jean-Paul Jamont, Michel Occello |
| Type : | Projet de thèse |
| Discipline(s) : | Informatique |
| Date : | Inscription en doctorat le Soutenance le 17/11/2025 |
| Etablissement(s) : | Université Grenoble Alpes |
| Ecole(s) doctorale(s) : | École doctorale mathématiques, sciences et technologies de l'information, informatique |
| Partenaire(s) de recherche : | Laboratoire : Laboratoire de conception et d'intégration des systèmes |
| Equipe de recherche : CO4SYS | |
| Jury : | Président / Présidente : Aurelie Beynier |
| Examinateurs / Examinatrices : Jean-paul Jamont, Michel Occello, Laurent Vercouter, Laeticia Matignon, Gauthier Picard, Oum-el-kheir Aktouf, Flavien Balbo | |
| Rapporteurs / Rapporteuses : Laurent Vercouter, Gauthier Picard |
Mots clés
Résumé
Face à la complexité croissante des menaces en Cybersécurité, les approches centralisées montrent leurs limites pour protéger efficacement des systèmes distribués et dynamiques. Cette thèse explore une approche distribuée fondée sur des SMA, capables de détecter, répondre et s'adapter collectivement à des attaques autonomes et évolutives. L'objectif central est de guider la conception organisationnelle d'un SMA pour la cyberdéfense. Les approches actuelles montrent un compromis difficile entre contrôle (avec les modèles symboliques) et performance (avec les approches par apprentissage). Pour dépasser cette tension, la thèse propose une méthode hybride combinant un modèle organisationnel symbolique et MARL. La clé de cette méthode consiste à reformuler la conception d'un SMA comme un problème d'optimisation sous contraintes, dans lequel la politique conjointe des agents est apprise tout en respectant des contraintes organisationnelles exprimant les exigences du concepteur. Cette approche requiert à la fois une modélisation fidèle de l'environnement et une capacité à analyser et contrôler les comportements obtenus. La méthode s'organise en quatre phases : (i) modélisation de l'environnement cible à l'aide de techniques de type World Models, pour obtenir une version simulée utilisable à l'entraînement ; (ii) entraînement des agents via MARL, avec intégration de contraintes issues du modèle organisationnel MOISE+ ; (iii) analyse des politiques apprises, en extrayant rôles et objectifs implicites via des méthodes non supervisées sur les trajectoires ; (iv) transfert des résultats dans l'environnement réel, avec mise à jour continue des modèles et politiques à partir des données collectées sur le terrain. Un outil logiciel, a été développé pour mettre en uvre cette méthode, et appliqué à trois cas d'usage : un essaim de drones, une infrastructure d'entreprise et une architecture de micro-services. Les résultats montrent une amélioration en termes de résilience, d'adaptabilité et d'autonomie par rapport aux approches centralisées. Enfin, la thèse ouvre plusieurs pistes de recherche, notamment pour améliorer la modélisation de l'environnement avec des connaissances expertes, renforcer la robustesse de l'apprentissage dans des environnements dynamiques, et automatiser l'analyse organisationnelle à l'aide de représentations latentes.