Thèse soutenue

Métrologie de l'internet du futur : caractérisation, quantification et prédiction de la qualité de la navigation web

FR  |  
EN
Auteur / Autrice : Antoine Saverimoutou
Direction : Sandrine VatonBertrand Mathieu
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 15/05/2020
Etablissement(s) : Ecole nationale supérieure Mines-Télécom Atlantique Bretagne Pays de la Loire
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : Laboratoire : Lab-STICC_IMTA_CID_TOMS - Département Informatique - Laboratoire en sciences et techniques de l'information, de la communication et de la connaissance (Brest ; 2012-....)
Entreprise : Orange (Firme)
Jury : Président / Présidente : Toufik Ahmed
Examinateurs / Examinatrices : Sandrine Vaton, Bertrand Mathieu, Raouf Boutaba, Cristel Pelsser, Pedro Casas Hernandez, Olivier Fourmaux
Rapporteurs / Rapporteuses : Raouf Boutaba, Cristel Pelsser

Résumé

FR  |  
EN

La navigation Web est l'un des principaux services de l’Internet où un large éventail d'acteurs est impliqué et évolue de manière constante. Les nouveaux protocoles de l’Internet, les réseaux de diffusion de contenu (CDN) ou encore les évolutions des différents navigateurs Web sont destinés à améliorer les temps de chargement des pages. Pour mieux comprendre la Qualité d'Expérience (QoE) perçue par les utilisateurs, il est donc essentiel d’identifier comment le contenu des pages est constitué et délivré et de fournir une métrique de QoE pertinente. Dans cette thèse, nous avons conçu un nouvel outil, Web View, destiné à effectuer des sessions de navigation Web automatisées et mesurant de nombreuses informations liées à l’écosystème du Web. Nous avons aussi défini une nouvelle métrique Web, le Time for Full Visual Rendering (TFVR). À partir de plus de 18 trillions de mesures effectuées pendant 2,5 ans sur les 10,000 sites Web les plus visités (selon la classification Alexa), nous avons utilisé des techniques statistiques pour identifier les paramètres clés qualifiant et quantifiant la qualité de la navigation Web. Cet ensemble de facteurs a été confirmé par un processus d'apprentissage automatique, donnant en sortie un ensemble de règles pour prédire les temps de chargement des pages Web. Pour les pages Web où des fluctuations dans les temps de chargement sont fréquentes, nous avons utilisé des modèles de chaines de Markov cachées suivant un processus de Dirichlet hiérarchique (HDP-HMM) pour enrichir notre modèle et ainsi augmenter le taux de prédiction correspondant. L'évaluation de notre modèle basé sur un arbre de décision sur des sites Web jamais mesurés montre que nous pouvons prédire correctement la qualité de la navigation Web. Ces travaux visent ainsi à permettre aux opérateurs de réseaux et aux fournisseurs de services d’augmenter la Qualité de Service (QoS) offerte à leurs clients.