Thèse soutenue

Comment interroger un graphe de connaissance décentralisé en ligne ?

FR  |  
EN
Auteur / Autrice : Julien Aimonier-Davat
Direction : Hala SkafPascal Molli
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 11/12/2023
Etablissement(s) : Nantes Université
Ecole(s) doctorale(s) : École doctorale Mathématiques et Sciences et Technologies du numérique, de l’Information et de la Communication (Nantes ; 2022-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire des Sciences du Numérique de Nantes
Jury : Président / Présidente : Arnaud Soulet
Examinateurs / Examinatrices : Frédérique Laforest, Mathieu d' Aquin, Mounira Harzallah, Luis Galárraga Del Prado
Rapporteur / Rapporteuse : Frédérique Laforest, Mathieu d' Aquin

Mots clés

FR  |  
EN

Mots clés contrôlés

Résumé

FR  |  
EN

Dans l’état actuel du Web sémantique, le développement d’applications intelligentes reposant sur un graphe de connaissances dé- centralisé accessible en ligne demeure un rêve lointain. D’une part, les SPARQL end- points publics font face à de graves problèmes d’accessibilité. De l’autre, les moteurs de requête fédérée, qui permettent aux utilisateurs d’interroger de manière transparente plusieurs SPARQL endpoints, ne passent pas à l’échelle. Ainsi, des milliards de triples RDF sont disponibles mais restent inaccessibles. Bien que diverses solutions aient été proposées, elles présentent toutes des problèmes de performance importants. Dans cette thèse, nous proposons différentes solutions pour sur- monter ces limitations. Pour commencer, nous étendons le modèle de la préemption Web afin de fournir un service de requête SPARQL public, fiable, et efficace. Ensuite, nous proposons un nouvel algorithme d’optimisation pour les requêtes SPARQL conjonctives qui contiennent des filtres et des expressions property path. Enfin, nous proposons un nouveau moteur de requête fédérée capable d’interroger efficacement une fédération de serveurs SPARQL de la taille du Linked Open Data Cloud.