Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS
Auteur / Autrice : | John Samuel |
Direction : | Farouk Toumani, Christophe Rey |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 06/10/2014 |
Etablissement(s) : | Clermont-Ferrand 2 |
Ecole(s) doctorale(s) : | École doctorale des sciences pour l'ingénieur (Clermont-Ferrand) |
Partenaire(s) de recherche : | Equipe de recherche : Laboratoire d'Informatique, de Modélisation et d'Optimisation des Systèmes |
Jury : | Président / Présidente : Omar Boucelma |
Examinateurs / Examinatrices : Farouk Toumani, Christophe Rey, Emmanuel Coquery | |
Rapporteurs / Rapporteuses : Omar Boucelma, Jérôme Darmont |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Cette thèse traite de l’établissement d’une plateforme logicielle nommée DaWeS permettant le déploiement et la gestion en ligne d’entrepôts de données alimentés par des données provenant de services web et personnalisés à destination des petites et moyennes entreprises. Ce travail s’articule autour du développement et de l’expérimentation de DaWeS. L’idée principale implémentée dans DaWeS est l’utilisation d’une approche virtuelle d’intégration de données (la médiation) en tant queprocessus ETL (extraction, transformation et chargement des données) pour les entrepôts de données gérés par DaWeS. A cette fin, un algorithme classique de réécriture de requêtes (l’algorithme inverse-rules) a été adapté et testé. Une étude théorique sur la sémantique des requêtes conjonctives et datalog exprimées avec des relations munies de limitations d’accès (correspondant aux services web) a été menée. Cette dernière permet l’obtention de bornes supérieures sur les nombres d’appels aux services web requis dans l’évaluation de telles requêtes. Des expérimentations ont été menées sur des services web réels dans trois domaines : le marketing en ligne, la gestion de projets et les services d’aide aux utilisateurs. Une première série de tests aléatoires a été effectuée pour tester le passage à l’échelle.