Thèse soutenue

Modèles de régression linéaire fonctionnelle pour données hétérogènes : Application à la prédiction de la QoE du streaming video et de la VoIP

FR  |  
EN
Auteur / Autrice : Jean Steve Tamo Tchomgui
Direction : Julien JacquesStéphane Chrétien
Type : Thèse de doctorat
Discipline(s) : Mathématiques
Date : Soutenance le 02/12/2024
Etablissement(s) : Lyon 2
Ecole(s) doctorale(s) : École doctorale InfoMaths (Lyon ; 2009-....)
Partenaire(s) de recherche : Laboratoire : Entrepôts, Représentation et Ingénierie des Connaissances
Jury : Président / Présidente : Faicel Chamroukhi
Examinateurs / Examinatrices : Emilie Devijver, Sofiene Jelassi
Rapporteurs / Rapporteuses : Faicel Chamroukhi, Sophie Dabo-Niang

Résumé

FR  |  
EN

L'expansion rapide des moyens de communication via internet cette dernière décennie et la compétitivité des entreprises dans ce secteur ont renforcé l'importance de la qualité de l'expérience (QoE en anglais) dans l'évaluation des performances et de la qualité d'un réseau. La QoE est une mesure subjective qui reflète la perception globale de la qualité d'un service par l'utilisateur. Elle est influencée par une myriade de facteurs dont les plus importantes sont les conditions du réseau, les caractéristiques du contenu et les préférences individuelles de l'utilisateur. Pour des services telles que la voix sur IP (VoIP en anglais) ou la lecture en continu des vidéos (streaming) par exemple, mesurer la QoE nécessite de disposer d'informations au niveau des applications (résolution, qualité de diffusion, temps d'interruption, écho, qualité vocale, ...) qui ne sont généralement pas à la disposition des opérateurs réseaux à moins qu'ils soient également fournisseurs de contenus ou aient des accords avec ces derniers. En l'absence de tels accords, une mesure de la QoE devient difficile compte tenu de sa nature subjective. De nombreux travaux de recherches antérieures ont exploré diverses approches de la prédiction de la QoE, notamment via des études subjectives sur les utilisateurs. Ces derniers ont l'inconvénient d'être coûteuses, lourdes en temps et difficile à automatiser. D'autres travaux faisant intervenir des modèles statistiques ont pallier ces insuffisances en tirant parti de la puissance des données et des techniques d'apprentissage automatique. Toutefois les modèles traditionnels de prédiction de la QoE, qui reposent souvent sur des observations discrètes, ne parviennent souvent pas à saisir la nature complexe, multidimensionnelle et dynamique des facteurs influençant la QoE. Cette thèse vise à répondre à ces limitations en employant de nouvelles méthodologies statistiques dans le cadre innovant et en plein expansion de l'Analyse des données fonctionnelles (ADF). L'ADF aussi connue sous le terme de FDA en anglais, est un cadre méthodologique destiné à traiter et analyser des données qui sont de nature fonctionnelle, c'est-à-dire des données qui sont observées sur un ensemble continu comme le temps, l'espace, ou d'autres dimensions. Dans ce cadre, les observations ne sont pas simplement des points discrets comme réalisations de variables aléatoire réelles, mais des fonctions entières comme réalisations d'une fonction aléatoire. L'un des principaux défis de notre problématique réside dans le fait que la QoE en tant que variable réponse et les facteurs qui l'influencent (c'est-à-dire les paramètres des réseaux en tant que covariables) sont enregistrés au fil du temps. Dans ce contexte, nous sommes dans le cadre d'une régression d'une variable réponse fonctionnelle impliquant des covariables fonctionnelles. Pour étudier la relation entre la QoE notée Y(t) et les covariables notées X(t) = (X1(t),...,Xp(t)), une première approche va être de considérer deux types de modèles régression linéaire abordés dans les travaux de Ramsay et Silverman (2005)En pratique, la différence entre ces deux modèles résident dans l'interprétation de la variable réponse Y(t) qui est à effet instantané dans le modèles concurrent ou à effet cumulatif des effets passés jusqu'au temps présent dans le modèle integral. Le cadre des modèles de mélanges qui permet de partitionner l'espace des données en sous espaces plus homogènes est adapté pour pallier au problème d'hétérogénéité. Le contexte de modélisation prédictive dans lequel nous sommes nous conduit au mélange d'expert (MoE en anglais) où chaque ''expert'' se spécialise pour prédire la QoE dans une région homogène de l'espace des données et une fonction d'activation détermine quel expert est le plus pertinent pour une donnée spécifique. En combinant l'ADF et le mélange d'experts, nous obtenons un modèle robuste avec une grande flexibilité permettant une prédiction plus fiable de la QoE.