Thèse soutenue

Analyse des mesures de délai réseau : Méthodes de data mining pour la complétion et la segmentation

FR  |  
EN
Auteur / Autrice : Sanaa Ghandi
Direction : Sandrine VatonThierry Chonavel
Type : Thèse de doctorat
Discipline(s) : Télécommunication
Date : Soutenance le 15/12/2023
Etablissement(s) : Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire
Ecole(s) doctorale(s) : École doctorale Sciences pour l'ingénieur et le numérique
Partenaire(s) de recherche : Laboratoire : Equipe Math & Net - Département Informatique - Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance
Jury : Président / Présidente : Tijani Chahed
Examinateurs / Examinatrices : Sandrine Vaton, Thierry Chonavel, Jean-Louis Rougier, Yezekael Hayel, Alexandre Reiffers-Masson, Kevin Vermeulen
Rapporteurs / Rapporteuses : Jean-Louis Rougier, Yezekael Hayel

Résumé

FR  |  
EN

La croissance exponentielle d'Internet nécessite une supervision régulière des métriques réseau. Cette thèse se concentre sur les délais aller-retour et la possibilité de résoudre les problèmes de données manquantes et de segmentation multivariée. La première contribution comprend l'orchestration de campagnes de mesure des délais, ainsi que le développement d'un simulateur qui génère des traces de délais de bout en bout. La deuxième contribution de cette thèse est l’introduction de deux méthodes de complétion de données manquantes. La première méthode repose sur la factorisation de matrices non négatives et la seconde utilise le filtrage collaboratif neuronal. Testées sur des données synthétiques et réelles, ces méthodes démontrent leur efficacité et précision. La troisième contribution de cette thèse porte sur la segmentation multivariée des délais. Cette approche repose sur le regroupement hiérarchique et se déroule en deux étapes. Dans un premier temps, il s'agit de regrouper les séries de délais afin d'obtenir des séries présentant des variations similaires et synchrones. Ensuite, on segmente de manière conjointe les séries groupées. On utilise le regroupement hiérarchique suivi d'un post-traitement à l'aide de l'algorithme de Viterbi qui vise à lisser le résultat de la segmentation. Cette méthode a été testée sur des traces de délais réels et les résultats indiquent que cette méthode se rapproche de l'état de l'art en matière de segmentation tout en réduisant de manière significative la rapidité et les coûts de calcul.