Cubes émergents pour l'analyse des renversements de tendance dans les base de données multidimensionnelles

par Sébastien Nedjar

Thèse de doctorat en Informatique

Sous la direction de Lotfi Lakhal et de Alain Casali.

Soutenue en 2009

à Aix-Marseille 2 .


  • Résumé

    Découvrir des renversements de tendances entre deux cubes de données offre aux utilisateurs une connaissance nouvelle et intéressante lors des fluctuations de l’univers réel modélisé : quelles sont les nouveautés ? Quelle tendance apparaît ou disparaît ? Nous introduisons le nouveau concept de Cube Emergent. Il capture les renversements de tendances en mettant en oeuvre une contrainte d’émergence (conjonction de contrainte monotones et antimonotones). Les bordures, classiques en fouille de données, sont reprises pour le Cube Emergent. Dans un second temps, nous proposons un nouveau couple de bordures pour optimiser à la fois l'espace de stockage et le temps de calcul. Cette nouvelle représentation fournit une caractérisation simple de la taille du Cube Emergent aussi bien que des outils de classification et de navigation dans les cubes. La connexion entre les bordures classiques et celles proposées est formellement établie en utilisant le concept de cube transversal. Connaître la taille du Cube Emergent est d’un grand intérêt, en particulier pour ajuster au mieux la contrainte d’émergence sous-jacente. Cette problématique est traitée en étudiant une borne supérieure et en caractérisant la taille exacte du Cube Emergent. Deux stratégies sont proposées pour estimer rapidement cette taille : la première est basée sur une estimation analytique, sans acc`es à la base de données, la seconde s’appuie sur un comptage probabiliste utilisant les bordures proposées comme entrée de l’algorithme proche de l’optimal HYPERLOGLOG. Grâce à la particuli`ere efficacité de cet algorithme, plusieurs itérations peuvent être réalisées pour calibrer au mieux la contrainte d’émergence. De plus, des nouvelles représentations réduites et sans perte d’information du Cube Emergent sont proposées en utilisant le concept de fermeture cubique

  • Titre traduit

    Emerging cubes for trend reversals analysis in OLAP databases


  • Résumé

    Discovering trend reversals between two data cubes provides users with a novel and interesting knowledge when the real world context fluctuates : what is new? Which trends appear or emerge? Which tendencies are immersing or disappear? With the concept of Emerging Cube, we capture such trend reversals by enforcing an emergence constraint. We resume the classical borders fot eh Emerging Cube and introduce a new one which optimiszes both storage space and computation time, provides a simple characterization of the size Emerging Cubes, as well as classification and cube navigation tools. We soundly state the connection between the classical and proposed borders by using cube transversals. Knowing the size of Emerging Cubes without computing them is of great interest in particular for adjusting at best the underlying emergence constraint. We address the issue by studying an upper bound and characterization the exact size of Ermerging Cubes. We propose two strategies for quickly estimate their size : one based on analytical estimation, without database access, and one based on probabilistic counting using the proposed borders as the input of the near-optimal algorithm HyperLogLog. Due to the efficiency of the estimation algorithm various iterations can be performed to calibrate at the best the emergence constraint. Moreover, we propose reduced and lossless representations of the Emerging Cube by using the concept of cube closure. Finally we perform experiments for different data distributions in order to measure on one hand the size on the introduced condensed and concise representations and on the other hand the performance (accuracy and computation time) of the proposed estimation method

Autres versions

Cette thèse a donné lieu à une publication

Cubes émergents pour l'analyse des renversements de tendance dans les base de données multidimensionnelles


Cette thèse a donné lieu à une publication en 2010 par [CCSD] à Villeurbanne

Cubes émergents pour l'analyse des renversements de tendance dans les base de données multidimensionnelles

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (224 p.)
  • Annexes : Bibliogr. p.214-223

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Aix-Marseille (Marseille. Luminy). Service commun de la documentation. Bibliothèque de sciences.
  • Disponible pour le PEB
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.

Consulter en bibliothèque

Cette thèse a donné lieu à une publication

Informations

  • Sous le titre : Cubes émergents pour l'analyse des renversements de tendance dans les base de données multidimensionnelles
  • Annexes : Bibliogr. p.214-223
La version de soutenance de cette thèse existe aussi sous forme papier.

Où se trouve cette thèse\u00a0?

Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.