Thèse soutenue

Pipelines d'extraction de métriques pour la supervision du trafic réseau sous contraintes système

FR  |  
EN
Auteur / Autrice : Johann Hugon
Direction : Francesco Bronzino
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 15/12/2025
Etablissement(s) : Lyon, École normale supérieure
Ecole(s) doctorale(s) : École doctorale InfoMaths (Lyon ; 2009-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire de l'informatique du parallélisme (Lyon ; 1988-....)
Jury : Président / Présidente : Cristel Pelsser
Examinateurs / Examinatrices : Francesco Bronzino, Chadi Barakat, Kandaraj Piamrat, Anthony Claude Busson, Kevin Vermeulen
Rapporteurs / Rapporteuses : Chadi Barakat, Kandaraj Piamrat

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Le machine learning est largement utilisé dans la littérature académique et présente souvent d'excellentes performances sur le papier. Cependant, de nombreuses méthodes sous-performent lors de leur déploiement dans le monde réel. Dans le monde des réseaux, cela est principalement dû à la pratique courante d'ignorer la phase de récolte de données et de l'extraction des métriques de l'évaluation des modèles. Les modèles de machine learning sont donc évalués sur des jeux de données parfaits, ce qui entraine une détérioration de leurs performances (précision) lorsque les métriques sont altérées ou incomplètes. Cette dégradation est entrainée par la perte de paquets ou une limitation des ressources de calcul causées par l'incapacité du système d'extraire les métriques en temps réel, à la vitesse du lien. Dans le cas concret de la supervision du trafic réseau, opérateur et chercheur ont besoin d'outils capables de leur fournir des aperçus de l'état du réseau en temps réel.Ces outils doivent trouver le point d'équilibre de la complexité des calculs réalisés pour pouvoir supporter la vitesse du lien. Ils font également face à de fortes contraintes en termes de disponibilité des données à un instant t, ce qui peut être fortement limité par la mémoire ou les capacités de calcul du système. Ces limitations liées au monde réel ont un impact important sur la fiabilité et le passage à l'échelle des solutions de supervision utilisant du machine learning. Dans cette thèse, nous approchons le problème du déploiement de solutions de supervision de trafic réseau utilisant du machine learning dans des environnements réalistes en concevant des méthodes d'extraction de métriques respectant les contraintes systèmes et capables de passer à l'échelle. Nous nous intéressons particulièrement à rendre l'extraction de métriques compatible avec les réseaux à haute vitesse en prenant en compte la perte de paquets et les ressources de calcul limitées.