Extension du modèle multidimensionnel aux faits qualitatifs. Application à l'analyse en ligne des gênes des chantiers urbains
Auteur / Autrice : | Fatiha Amanzougarene |
Direction : | Karine Bennis-Zeitouni, Mohamed Chachoua |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2014 |
Etablissement(s) : | Versailles-St Quentin en Yvelines |
Ecole(s) doctorale(s) : | Ecole doctorale sciences et technologies de Versailles (2010-2015) |
Partenaire(s) de recherche : | Equipe de recherche : Laboratoire Parallélisme, Réseaux, Systèmes, Modélisation (PRISM) |
Jury : | Président / Présidente : Anne Laurent |
Rapporteurs / Rapporteuses : Mohand Saïd Hacid, Mohamed Quafafou |
Mots clés
Résumé
Les entrepôts de données et les systèmes OLAP constituent les principaux éléments d’un système d’information décisionnel. Ces dernières années, plusieurs travaux ont été menés, afin d’étendre les concepts des entrepôts de données classiques pour traiter de nouveaux types de données, dites complexes (texte, multimédia, géographique, etc. ). Dans cette thèse, nous nous sommes intéressés à la problématique de l’intégration de l’information qualitative dans l’analyse multidimensionnelle. Nos travaux sont guidés par une étude de cas sur les gênes des chantiers urbains. Après avoir défini la notion de gêne et déterminé les différents facteurs qui interviennent dans son évaluation, nous avons mis en évidence le besoin d'un modèle de représentation qualitative s’appuyant sur des règles et des connaissances expertes. Or, l'analyse multidimensionnelle dans les entrepôts de données traditionnels ne considère que des mesures quantitatives. Notre principale contribution est donc d'étendre le modèle multidimensionnel aux mesures qualitatives exprimées sous forme de termes linguistiques. Partant du constat que les connaissances expertes sont parfois incomplètes, notre deuxième contribution est de proposer une méthode originale de reconstruction de données manquantes dans le contexte des entrepôts de données. Ce modèle consiste à combiner la technique des k-plus proches voisins (KPPV) avec la programmation par contraintes pour assurer une meilleure prédiction des valeurs manquantes dans une table de faits d’un entrepôt de données classique ou qualitatif