Métrologie de l'internet du futur : caractérisation, quantification et prédiction de la qualité de la navigation web
Auteur / Autrice : | Antoine Saverimoutou |
Direction : | Sandrine Vaton, Bertrand Mathieu |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 15/05/2020 |
Etablissement(s) : | Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes) |
Partenaire(s) de recherche : | Laboratoire : Lab-STICC_IMTA_CID_TOMS - Département Informatique - Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance (Brest ; 2012-....) |
Entreprise : Orange (Firme) | |
Jury : | Président / Présidente : Toufik Ahmed |
Examinateurs / Examinatrices : Sandrine Vaton, Bertrand Mathieu, Raouf Boutaba, Cristel Pelsser, Pedro Casas Hernandez, Olivier Fourmaux | |
Rapporteurs / Rapporteuses : Raouf Boutaba, Cristel Pelsser |
Résumé
La navigation Web est l'un des principaux services de l’Internet où un large éventail d'acteurs est impliqué et évolue de manière constante. Les nouveaux protocoles de l’Internet, les réseaux de diffusion de contenu (CDN) ou encore les évolutions des différents navigateurs Web sont destinés à améliorer les temps de chargement des pages. Pour mieux comprendre la Qualité d'Expérience (QoE) perçue par les utilisateurs, il est donc essentiel d’identifier comment le contenu des pages est constitué et délivré et de fournir une métrique de QoE pertinente. Dans cette thèse, nous avons conçu un nouvel outil, Web View, destiné à effectuer des sessions de navigation Web automatisées et mesurant de nombreuses informations liées à l’écosystème du Web. Nous avons aussi défini une nouvelle métrique Web, le Time for Full Visual Rendering (TFVR). À partir de plus de 18 trillions de mesures effectuées pendant 2,5 ans sur les 10,000 sites Web les plus visités (selon la classification Alexa), nous avons utilisé des techniques statistiques pour identifier les paramètres clés qualifiant et quantifiant la qualité de la navigation Web. Cet ensemble de facteurs a été confirmé par un processus d'apprentissage automatique, donnant en sortie un ensemble de règles pour prédire les temps de chargement des pages Web. Pour les pages Web où des fluctuations dans les temps de chargement sont fréquentes, nous avons utilisé des modèles de chaines de Markov cachées suivant un processus de Dirichlet hiérarchique (HDP-HMM) pour enrichir notre modèle et ainsi augmenter le taux de prédiction correspondant. L'évaluation de notre modèle basé sur un arbre de décision sur des sites Web jamais mesurés montre que nous pouvons prédire correctement la qualité de la navigation Web. Ces travaux visent ainsi à permettre aux opérateurs de réseaux et aux fournisseurs de services d’augmenter la Qualité de Service (QoS) offerte à leurs clients.