Thèse soutenue

Identité dans les graphes de connaissances RDF : propagation des propriétés entre entités contextuellement identiques

FR  |  
EN
Auteur / Autrice : Pierre-Henri Paris
Direction : Samira Si-Said CherfiFayçal Hamdi
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 17/06/2020
Etablissement(s) : Sorbonne université
Ecole(s) doctorale(s) : École doctorale Informatique, télécommunications et électronique de Paris
Partenaire(s) de recherche : Laboratoire : Centre d'études et de recherche en informatique et communications (Paris)
Jury : Président / Présidente : Bernd Amann
Examinateurs / Examinatrices : Catherine Faron, Cecilia Zanni-Merk, Dimitris Kotzinos
Rapporteurs / Rapporteuses : Nathalie Pernelle, Mathieu d' Aquin

Résumé

FR  |  
EN

En raison du grand nombre de graphes de connaissances et, surtout, de leurs interconnexions encore plus nombreuses à l'aide de la propriété owl:sameas, il est devenu de plus en plus évident que cette propriété est souvent mal utilisée. En effet, les entités liées par la propriété owl:sameas doivent être identiques dans tous les contextes possibles et imaginables. Dans les faits, ceci n'est pas toujours le cas et induit une détérioration de la qualité des données. L'identité doit être considérée comme étant dépendante d'un contexte. Nous avons donc proposé une étude à large échelle sur la présence de la sémantique dans les graphes de connaissances, puisque certaines caractéristiques sémantiques permettent justement de déduire des liens d'identités. Cette étude nous a amenés naturellement à construire une ontologie permettant de donner la teneur en sémantique d'un graphe de connaissances. Nous avons aussi proposé une approche de liage de données fondée à la fois sur la logique permise par les définitions sémantiques, et à la fois sur la prédominance de certaines propriétés pour caractériser la relation d'identité entre deux entités. Nous nous sommes aussi intéressés à la complétude et avons proposé une approche permettant de générer un schéma conceptuel afin de mesurer la complétude d'une entité. Pour finir, à l'aide des travaux précédents, nous avons proposé une approche fondée sur les plongements de phrases permettant de calculer les propriétés pouvant être propagées dans un contexte précis. Ceci permet l'expansion de requêtes SPARQL et, in fine, d'augmenter la complétude des résultats de la requête.