Analyse du trafic réseau grâce à l'apprentissage automatique
Auteur / Autrice : | Ons Aouedi |
Direction : | Benoît Parrein, Kandaraj Piamrat |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 02/12/2022 |
Etablissement(s) : | Nantes Université |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire des Sciences du Numérique de Nantes |
Jury : | Président / Présidente : Yassine Hadjadj Aoul |
Examinateurs / Examinatrices : Yusheng Ji | |
Rapporteur / Rapporteuse : Adlen Ksentini, Sonia Ben Mokhtar |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
L’Internet des Objets entraînent par son nombre de terminaux une explosion du trafic de données. Pour augmenter la qualité globale de réseau, il est possible d’analyser intelligemment le trafic réseau afin de détecter d’éventuel comportement suspect ou malveillant. Les modèles d’apprentissage automatique et d’apprentissage profond permettent de traiter ce très grand volume de données. Néanmoins, il existe certaines limites dans la littérature, notamment la confidentialité des données, le surapprentissage (manques de diversité dans les données) ou tout simplement le manque de jeu de données labellisées. Dans cette thèse, nous proposons de nouveaux modèles s’appuyant sur l’apprentissage automatique et l’apprentissage profond afin de traiter une grande quantité de données tout en préservant la confidentialité. Notre première approche utilise un modèle d’ensemble. Les résultats montrent une diminution du surapprentissage, tout en augmentant de 10% la précision comparé à des modèles de l’état de l’art. Notre seconde contribution s’attache aux problèmes de disponibilité des données labellisées. Nous proposons un modèle d’apprentissage semisupervisé capable d’améliorer la précision de 11% par rapport à un modèle supervisé équivalent. Enfin, nous proposons un système de détection d’attaque s’appuyant sur l’apprentissage fédéré. Nommé FLUIDS, il permet de réduire la surcharge réseau de 75% tout en préservant de très haute performance et la confidentialité.