Thèse soutenue

Optimisation basée sur l'apprentissage des systèmes de streaming hybrides cdn/v2v

FR  |  
EN
Auteur / Autrice : Zhejiayu Ma
Direction : Guillaume Urvoy-KellerFrédéric Giroire
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 20/12/2022
Etablissement(s) : Université Côte d'Azur
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Informatique, signaux et systèmes (Sophia Antipolis, Alpes-Maritimes)
Jury : Président / Présidente : Pietro Michiardi
Examinateurs / Examinatrices : Guillaume Urvoy-Keller, Frédéric Giroire, Pietro Michiardi, Géraldine Texier, Yassine Hadjadj Aoul, Soufiane Rouibia, Isabelle Chrisment
Rapporteurs / Rapporteuses : Géraldine Texier, Yassine Hadjadj Aoul

Résumé

FR  |  
EN

Le streaming est une industrie en plein essor alors que sa production et sa consommation deviennent plus simples que jamais. Avec un accès réseau amélioré grâce à la 5G, même les téléphones portables peuvent désormais être utilisés pour des diffusions en direct de vidéos en haute qualité. Les systèmes de streaming utilisent souvent des réseaux CDN (Content Delivery Network) pour diffuser le flux sur plusieurs zones géographiques. Cependant, le coût des services CDN, ou de la location de serveurs, s'élève rapidement à mesure que l'audience augmente. Pour réduire les coûts, l'approche viewer-to-viewer (V2V) a été introduite dans la diffusion en direct et over-the-top (OTT) en s'appuyant sur la technologie WebRTC. En effet, WebRTC permet l'échange de données directement entre navigateurs, ouvrant la voie vers le déploiement des systèmes hybrides mélangeant V2V et CDN. Grâce à WebRTC, les échanges V2V peuvent décharger une fraction importante du trafic des serveurs CDN, réduisant ainsi le coût d'exploitation.Dans la première partie de la thèse, nous abordons le problème de la sélection des voisins dans un système hybride CDN/V2V. La plupart des systèmes existants traitent ce problème en utilisant des heuristiques simples, par exemple favoriser les homologues du même FAI ou de régions géographiques proches. Nous avons analysé neuf mois de logs de fonctionnement d'un système commercial existant et montré la sous-optimalité de ces stratégies. Pour améliorer les performances, nous avons proposé des méthodes basées sur l'apprentissage qui permettent au tracker de prédire le débit entre deux hôtes. Il permet une sélection de voisins basée sur les données historiques des débits observés. Grâce à une analyse à large échelle hors ligne, nous montrons que des modèles de réseaux neuronaux peuvent simultanément améliorer le débit, réduire la latence entre les hôtes (un facteur important dans les diffusions live) et diminuer le taux de perte des segments de vidéo, une perte étant définie comme le fait que le segment n'est pas reçu avant l'expiration du timer qui renvoie le client vers le CDN (afin de garantir une bonne qualité de service). Dans la deuxième partie de la thèse, nous validons la solution proposée à l'aide d'une approche de tests A/B sur un système commercial en production. Nos campagnes de tests ont duré deux mois. Nous avons comparé neuf modèles et stratégies de sélection de voisins différents, y compris la sélection aléatoire de voisins, les méthodes classiques basées sur la localité et plusieurs modèles basés sur des réseaux de neurones. Les résultats des tests A/B montrent qu'un modèle de réseau de neurones adéquat peut considérablement améliorer les métriques clés du système -fraction de la vidéo servie en V2V, débit, délai et taux de perte- par rapport aux méthodes traditionnelles basées sur la localité.Les deux premières parties de la thèse visent à optimiser la sélection de voisins côté serveur avec le but de trouver un bon voisinage parmi des milliers de candidats possibles. Dans la dernière partie, nous cherchons à optimiser le comportement du client. Dans un réseau V2V basé sur WebRTC, certains utilisateurs mettent en cache les segments de vidéo sur leurs appareils, et d'autres attendent et récupèrent les segments de leurs voisins. Un paramètre clef côté client est le temps d'attente avant de se rabattre sur le CDN. Nous avons formulé le contrôle du temps d'attente comme un problème d'apprentissage par renforcement et proposé comme solution un algorithme de Q-learning (QWC). Nous avons effectué des expériences sur Grid5000, puis validé nos résultats en production avec 7-tests A/B quotidiens. QWC améliore la qualité d'expérience globale du streaming en minimisant la probabilité de famine du tampon vidéo, en améliorant la qualité vidéo (les clients peuvent visionner des qualités plus élevées), le tout sans compromettre la fraction de trafic reçu en mode V2V.