Pipelines d'extraction de métriques pour la supervision du trafic réseau sous contraintes système
| Auteur / Autrice : | Johann Hugon |
| Direction : | Francesco Bronzino |
| Type : | Thèse de doctorat |
| Discipline(s) : | Informatique |
| Date : | Soutenance le 15/12/2025 |
| Etablissement(s) : | Lyon, École normale supérieure |
| Ecole(s) doctorale(s) : | École doctorale InfoMaths (Lyon ; 2009-....) |
| Partenaire(s) de recherche : | Laboratoire : Laboratoire de l'informatique du parallélisme (Lyon ; 1988-....) |
| Jury : | Président / Présidente : Cristel Pelsser |
| Examinateurs / Examinatrices : Francesco Bronzino, Chadi Barakat, Kandaraj Piamrat, Anthony Claude Busson, Kevin Vermeulen | |
| Rapporteurs / Rapporteuses : Chadi Barakat, Kandaraj Piamrat |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Le machine learning est largement utilisé dans la littérature académique et présente souvent d'excellentes performances sur le papier. Cependant, de nombreuses méthodes sous-performent lors de leur déploiement dans le monde réel. Dans le monde des réseaux, cela est principalement dû à la pratique courante d'ignorer la phase de récolte de données et de l'extraction des métriques de l'évaluation des modèles. Les modèles de machine learning sont donc évalués sur des jeux de données parfaits, ce qui entraine une détérioration de leurs performances (précision) lorsque les métriques sont altérées ou incomplètes. Cette dégradation est entrainée par la perte de paquets ou une limitation des ressources de calcul causées par l'incapacité du système d'extraire les métriques en temps réel, à la vitesse du lien. Dans le cas concret de la supervision du trafic réseau, opérateur et chercheur ont besoin d'outils capables de leur fournir des aperçus de l'état du réseau en temps réel.Ces outils doivent trouver le point d'équilibre de la complexité des calculs réalisés pour pouvoir supporter la vitesse du lien. Ils font également face à de fortes contraintes en termes de disponibilité des données à un instant t, ce qui peut être fortement limité par la mémoire ou les capacités de calcul du système. Ces limitations liées au monde réel ont un impact important sur la fiabilité et le passage à l'échelle des solutions de supervision utilisant du machine learning. Dans cette thèse, nous approchons le problème du déploiement de solutions de supervision de trafic réseau utilisant du machine learning dans des environnements réalistes en concevant des méthodes d'extraction de métriques respectant les contraintes systèmes et capables de passer à l'échelle. Nous nous intéressons particulièrement à rendre l'extraction de métriques compatible avec les réseaux à haute vitesse en prenant en compte la perte de paquets et les ressources de calcul limitées.