Thèse en cours

Intelligence artificielle explicable et grands modèles de langage pour l'auto-rétablissement des réseaux O-RAN : détection d'anomalies, analyse des causes profondes et remédiation fondée sur les connaissances

FR  |  
EN
Auteur / Autrice : Oluwatimileyin Adedigba
Direction : Lina Mroueh
Type : Projet de thèse
Discipline(s) : Sciences et technologies de l'information et de la communication
Date : Inscription en doctorat le 01/04/2026
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique, Signal et Image, Télécom et Électronique
Equipe de recherche : Electronics, Communications & Security

Résumé

FR  |  
EN

Cette thèse traite du défi consistant à permettre un auto-rétablissement fiable dans les réseaux d'accès radio ouverts (O-RAN), un paradigme clé dans l'évolution vers des systèmes de communication autonomes, définis par logiciel et pilotés par l'intelligence artificielle. Bien que les recherches actuelles aient réalisé des avancées significatives en matière de détection d'anomalies, d'explicabilité et de gestion de réseau assistée par l'IA, ces composantes demeurent largement fragmentées. En particulier, les approches existantes détectent souvent les anomalies sans fournir d'analyse des causes profondes exploitable ni de stratégies de remédiation directement utilisables par les opérateurs, ce qui limite leur déploiement dans des environnements télécom réels. L'objectif de cette recherche est de concevoir et de mettre en œuvre un cadre intégré, explicable et fondé sur les connaissances pour l'auto-rétablissement des réseaux O-RAN. L'approche proposée combine des modèles avancés de détection d'anomalies, des techniques d'intelligence artificielle explicable (XAI) et des grands modèles de langage (LLM) au sein d'une architecture unifiée en boucle fermée. L'ambition est de dépasser les approches isolées de détection ou d'explication pour aboutir à une chaîne complète capable d'identifier, d'interpréter et de résoudre les anomalies réseau de manière fiable et transparente. Le premier composant du cadre se concentre sur la détection d'anomalies dans les données de télémétrie réseau, incluant des indicateurs clés de performance (KPI) sous forme de séries temporelles ainsi que, le cas échéant, des informations topologiques. Selon la structure des données, l'étude explorera des modèles temporels tels que les autoencodeurs, les architectures de type Transformer et les modèles spatio-temporels basés sur des graphes. Ces modèles visent à identifier avec précision les comportements anormaux dans des environnements O-RAN complexes et dynamiques. Le deuxième composant introduit des mécanismes d'explicabilité afin d'améliorer l'interprétabilité des résultats de détection. À l'aide de méthodes XAI de pointe telles que SHAP et les gradients intégrés, le système produira des explications multi-niveaux mettant en évidence les caractéristiques clés, les motifs temporels et les entités réseau responsables des anomalies. Cette étape garantit que les résultats ne sont pas seulement précis, mais également compréhensibles et exploitables. S'appuyant sur ces explications, le troisième composant se concentre sur l'analyse des causes profondes en intégrant des connaissances métier, telles que les contraintes d'architecture réseau, les dictionnaires d'alarmes et les règles de diagnostic. Ce processus génère des hypothèses hiérarchisées des causes potentielles, comblant ainsi l'écart entre les sorties techniques des modèles et la prise de décision opérationnelle. Le quatrième composant mobilise les grands modèles de langage comme couche de raisonnement et d'interaction. Plutôt que d'effectuer une analyse brute des données, les LLM sont utilisés pour synthétiser les scores d'anomalie, les explications et les connaissances métier extraites en rapports cohérents et lisibles par les opérateurs. Ces rapports incluent des analyses structurées des causes profondes, des recommandations de remédiation classées, ainsi que des justifications fondées sur la documentation pertinente, suivant un paradigme de génération augmentée par récupération. Enfin, le cadre intègre un module de remédiation proposant des actions correctives minimales, sûres et conformes aux politiques. Cette étape met l'accent sur une intelligence actionnable, garantissant que les recommandations sont réalisables, auditables et compatibles avec les contraintes opérationnelles. L'évaluation expérimentale reposera sur des jeux de données publics O-RAN, notamment SpotLight et ColO-RAN, permettant une évaluation reproductible des performances de détection, de la qualité des explications et des capacités d'auto-rétablissement en boucle fermée. En intégrant détection, explicabilité, raisonnement et remédiation au sein d'une architecture unique, cette thèse vise à faire progresser l'état de l'art en gestion autonome des réseaux et à contribuer au développement de mécanismes d'auto-rétablissement fiables, interprétables et pilotés par l'intelligence artificielle pour les réseaux de communication de nouvelle génération.