Thèse en cours

De l’organisation d’un système multi-agent de cyberdéfense

FR  |  
EN

Accès à la thèse

AttentionLa soutenance a eu lieu le 17/11/2025. Le document qui a justifié du diplôme est en cours de traitement par l'établissement de soutenance.
Auteur / Autrice : Julien Soule
Direction : Jean-Paul JamontMichel Occello
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le
Soutenance le 17/11/2025
Etablissement(s) : Université Grenoble Alpes
Ecole(s) doctorale(s) : École doctorale mathématiques, sciences et technologies de l'information, informatique
Partenaire(s) de recherche : Laboratoire : Laboratoire de conception et d'intégration des systèmes
Equipe de recherche : CO4SYS
Jury : Président / Présidente : Aurelie Beynier
Examinateurs / Examinatrices : Jean-paul Jamont, Michel Occello, Laurent Vercouter, Laeticia Matignon, Gauthier Picard, Oum-el-kheir Aktouf, Flavien Balbo
Rapporteurs / Rapporteuses : Laurent Vercouter, Gauthier Picard

Résumé

FR  |  
EN

Face à la complexité croissante des menaces en Cybersécurité, les approches centralisées montrent leurs limites pour protéger efficacement des systèmes distribués et dynamiques. Cette thèse explore une approche distribuée fondée sur des SMA, capables de détecter, répondre et s'adapter collectivement à des attaques autonomes et évolutives. L'objectif central est de guider la conception organisationnelle d'un SMA pour la cyberdéfense. Les approches actuelles montrent un compromis difficile entre contrôle (avec les modèles symboliques) et performance (avec les approches par apprentissage). Pour dépasser cette tension, la thèse propose une méthode hybride combinant un modèle organisationnel symbolique et MARL. La clé de cette méthode consiste à reformuler la conception d'un SMA comme un problème d'optimisation sous contraintes, dans lequel la politique conjointe des agents est apprise tout en respectant des contraintes organisationnelles exprimant les exigences du concepteur. Cette approche requiert à la fois une modélisation fidèle de l'environnement et une capacité à analyser et contrôler les comportements obtenus. La méthode s'organise en quatre phases : (i) modélisation de l'environnement cible à l'aide de techniques de type World Models, pour obtenir une version simulée utilisable à l'entraînement ; (ii) entraînement des agents via MARL, avec intégration de contraintes issues du modèle organisationnel MOISE+ ; (iii) analyse des politiques apprises, en extrayant rôles et objectifs implicites via des méthodes non supervisées sur les trajectoires ; (iv) transfert des résultats dans l'environnement réel, avec mise à jour continue des modèles et politiques à partir des données collectées sur le terrain. Un outil logiciel, a été développé pour mettre en œuvre cette méthode, et appliqué à trois cas d'usage : un essaim de drones, une infrastructure d'entreprise et une architecture de micro-services. Les résultats montrent une amélioration en termes de résilience, d'adaptabilité et d'autonomie par rapport aux approches centralisées. Enfin, la thèse ouvre plusieurs pistes de recherche, notamment pour améliorer la modélisation de l'environnement avec des connaissances expertes, renforcer la robustesse de l'apprentissage dans des environnements dynamiques, et automatiser l'analyse organisationnelle à l'aide de représentations latentes.