Comment interroger un graphe de connaissance décentralisé en ligne ?
Auteur / Autrice : | Julien Aimonier-Davat |
Direction : | Hala Skaf, Pascal Molli |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 11/12/2023 |
Etablissement(s) : | Nantes Université |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et Sciences et Technologies du numérique, de l’Information et de la Communication (Nantes ; 2022-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire des Sciences du Numérique de Nantes |
Jury : | Président / Présidente : Arnaud Soulet |
Examinateurs / Examinatrices : Frédérique Laforest, Mathieu d' Aquin, Mounira Harzallah, Luis Galárraga Del Prado | |
Rapporteur / Rapporteuse : Frédérique Laforest, Mathieu d' Aquin |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Dans l’état actuel du Web sémantique, le développement d’applications intelligentes reposant sur un graphe de connaissances dé- centralisé accessible en ligne demeure un rêve lointain. D’une part, les SPARQL end- points publics font face à de graves problèmes d’accessibilité. De l’autre, les moteurs de requête fédérée, qui permettent aux utilisateurs d’interroger de manière transparente plusieurs SPARQL endpoints, ne passent pas à l’échelle. Ainsi, des milliards de triples RDF sont disponibles mais restent inaccessibles. Bien que diverses solutions aient été proposées, elles présentent toutes des problèmes de performance importants. Dans cette thèse, nous proposons différentes solutions pour sur- monter ces limitations. Pour commencer, nous étendons le modèle de la préemption Web afin de fournir un service de requête SPARQL public, fiable, et efficace. Ensuite, nous proposons un nouvel algorithme d’optimisation pour les requêtes SPARQL conjonctives qui contiennent des filtres et des expressions property path. Enfin, nous proposons un nouveau moteur de requête fédérée capable d’interroger efficacement une fédération de serveurs SPARQL de la taille du Linked Open Data Cloud.