Thèse soutenue

Déduire des Basic Graph Patterns depuis les Logs des fournisseurs du Linked Data
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Georges Nassopoulos
Direction : Pascal MolliPatricia Serrano AlvaradoEmmanuel Desmontils
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance le 22/05/2017
Etablissement(s) : Nantes
Ecole(s) doctorale(s) : École doctorale Mathématiques et sciences et technologies de l'information et de la communication (Rennes)
Partenaire(s) de recherche : COMUE : Université Bretagne Loire (2016-2019)
Laboratoire : Laboratoire des Sciences du Numérique de Nantes
Jury : Président / Présidente : Philippe Lamarre
Examinateurs / Examinatrices : Pascale Kuntz-Cosperec, Claudia Lucia Roncancio
Rapporteurs / Rapporteuses : Olivier Curé

Mots clés

FR

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

Conformément aux principes de Linked Data, les fournisseurs de données ont publié des milliards de faits en tant que données RDF. Exécuter les requêtes SPARQL sur les endpoints SPARQL ou les serveurs Triple Pattern Fragments (TPF) permet de consommer facilement des données du Linked Data. Cependant, le traitement des requêtes SPARQL fédérées, tout comme le traitement des requêtes TPF, décompose la requête initiale en de nombreuses sous-requêtes. Les fournisseurs de données ne voient alors que les sous-requêtes et la requête initiale n’est connue que des utilisateurs finaux. La connaissance des requêtes exécutées est fondamentale pour les fournisseurs, afin d’assurer un contrôle de l’utilisation des données, d’optimiser le coût des réponses aux requêtes, de justifier un retour sur investissements, d’améliorer l’expérience utilisateur ou de créer des modèles commerciaux à partir de tendances d’utilisation. Dans cette thèse, nous nous concentrons sur l’analyse des logs d’exécution des serveurs TPF et des endpoints SPARQL pour extraire les Basic Graph Patterns (BGP) des requêtes SPARQL exécutées. Le principal défi pour l’extraction des BGPs est l’exécution simultanée des requêtes SPARQL. Nous proposons deux algorithmes : LIFT et FETA. Sous certaines conditions, nous constatons que LIFT et FETA sont capables d’extraire des BGPs avec une bonne précision et un bon rappel.