Knowledge extraction from huge volume of heterogeneous data for an automated radio network management

par Yosra Ben slimen

Thèse de doctorat en Informatique

Sous la direction de Julien Jacques.

Soutenue le 25-06-2018

à Lyon , dans le cadre de École doctorale en Informatique et Mathématiques de Lyon , en partenariat avec Entrepôts, Représentation et Ingénierie des Connaissances (équipe de recherche) et de Université Lumière (Lyon) (établissement opérateur d'inscription) .

Le président du jury était Sabine Loudcher Rabaseda.

Le jury était composé de Christine Keribin, Vincent Lemaire, Alef Feki.

Les rapporteurs étaient Mohamed Nadif, Faicel Chamroukhi.

  • Titre traduit

    Extraction de connaissances à partir d’un grand volume de données hétérogènes pour une gestion automatique de réseaux mobiles


  • Résumé

    En vue d’aider les opérateurs mobiles avec la gestion de leurs réseaux d’accès radio, trois modèles sont proposés. Le premier modèle est une approche supervisée pour une prévention des anomalies. Son objectif est de détecter les dysfonctionnements futurs d’un ensemble de cellules en observant les indicateurs clés de performance considérés comme des données fonctionnelles. Par conséquent, en alertant les ingénieurs et les réseaux auto-organisés, les opérateurs mobiles peuvent être sauvés d’une dégradation de performance de leurs réseaux. Le modèle a prouvé son efficacité avec une application sur données réelles qui vise à détecter la dégradation de capacité, les problèmes d’accessibilités et les coupures d’appel dans des réseaux LTE.A cause de la diversité des technologies mobiles, le volume de données qui doivent être quotidiennement observées par les opérateurs mobiles devient énorme. Ce grand volume a devenu un obstacle pour la gestion des réseaux mobiles. Le second modèle vise à fournir une représentation simplifiée des indicateurs clés de performance pour une analyse plus facile. Du coup, un modèle de classification croisée pour données fonctionnelles est proposé. L’algorithme est basé sur un modèle de blocs latents dont chaque courbe est identifiée par ses composantes principales fonctionnelles. Ces dernières sont modélisées par une distribution Gaussienne dont les paramètres sont spécifiques à chaque bloc. Les paramètres sont estimés par un algorithme EM stochastique avec un échantillonnage de Gibbs. Ce modèle est le premier modèle de classification croisée pour données fonctionnelles et il a prouvé son efficacité sur des données simulées et aussi sur une application réelle qui vise à aider dans l’optimisation de la topologie des réseaux mobiles 4G.Le troisième modèle vise à résumer l’information issue des indicateurs clés de performance et aussi des alarmes réseaux. Un modèle de classification croisée des données mixtes : fonctionnelles et binaires est alors proposé. L’approche est basé sur un modèle de blocs latents et trois algorithmes sont comparés pour son inférence : EM stochastique avec un échantillonneur de Gibbs, EM de classification et EM variationnelle. Le modèle proposé est le premier algorithme de classification croisée pour données fonctionnelles et binaires. Il a prouvé son efficacité sur des données simulées et sur des données réelles extraites à partir de plusieurs réseaux mobiles 4G.


  • Résumé

    In order to help the mobile operators with the management of their radio access networks, three models are proposed. The first model is a supervised approach for mobile anomalies prevention. Its objective is to detect future malfunctions of a set of cells, by only observing key performance indicators (KPIs) that are considered as functional data. Thus, by alerting the engineers as well as self-organizing networks, mobile operators can be saved from a certain performance degradation. The model has proven its efficiency with an application on real data that aims to detect capacity degradation, accessibility and call drops anomalies for LTE networks.Due to the diversity of mobile network technologies, the volume of data that has to be observed by mobile operators in a daily basis became enormous. This huge volume became an obstacle to mobile networks management. The second model aims to provide a simplified representation of KPIs for an easier analysis. Hence, a model-based co-clustering algorithm for functional data is proposed. The algorithm relies on the latent block model in which each curve is identified by its functional principal components that are modeled by a multivariate Gaussian distribution whose parameters are block-specific. These latter are estimated by a stochastic EM algorithm embedding a Gibbs sampling. This model is the first co-clustering approach for functional data and it has proven its efficiency on simulated data and on a real data application that helps to optimize the topology of 4G mobile networks.The third model aims to resume the information of data issued from KPIs and also alarms. A model-based co-clustering algorithm for mixed data, functional and binary, is therefore proposed. The approach relies on the latent block model, and three algorithms are compared for its inference: stochastic EM within Gibbs sampling, classification EM and variational EM. The proposed model is the first co-clustering algorithm for mixed data that deals with functional and binary features. It has proven its efficiency on simulated data and on real data extracted from live 4G mobile networks.

Consulter en bibliothèque

La version de soutenance existe

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Lumière (Bron). Service commun de la documentation. Bibliothèque universitaire.
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.