Identité dans les graphes de connaissances RDF : propagation des propriétés entre entités contextuellement identiques
Auteur / Autrice : | Pierre-Henri Paris |
Direction : | Samira Si-Said Cherfi, Fayçal Hamdi |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 17/06/2020 |
Etablissement(s) : | Sorbonne université |
Ecole(s) doctorale(s) : | École doctorale Informatique, télécommunications et électronique de Paris (1992-...) |
Partenaire(s) de recherche : | Laboratoire : Centre d'études et de recherche en informatique et communications (Paris) |
Jury : | Président / Présidente : Bernd Amann |
Examinateurs / Examinatrices : Catherine Faron, Cecilia Zanni-Merk, Dimitris Kotzinos | |
Rapporteurs / Rapporteuses : Nathalie Pernelle, Mathieu d' Aquin |
Mots clés
Résumé
En raison du grand nombre de graphes de connaissances et, surtout, de leurs interconnexions encore plus nombreuses à l'aide de la propriété owl:sameas, il est devenu de plus en plus évident que cette propriété est souvent mal utilisée. En effet, les entités liées par la propriété owl:sameas doivent être identiques dans tous les contextes possibles et imaginables. Dans les faits, ceci n'est pas toujours le cas et induit une détérioration de la qualité des données. L'identité doit être considérée comme étant dépendante d'un contexte. Nous avons donc proposé une étude à large échelle sur la présence de la sémantique dans les graphes de connaissances, puisque certaines caractéristiques sémantiques permettent justement de déduire des liens d'identités. Cette étude nous a amenés naturellement à construire une ontologie permettant de donner la teneur en sémantique d'un graphe de connaissances. Nous avons aussi proposé une approche de liage de données fondée à la fois sur la logique permise par les définitions sémantiques, et à la fois sur la prédominance de certaines propriétés pour caractériser la relation d'identité entre deux entités. Nous nous sommes aussi intéressés à la complétude et avons proposé une approche permettant de générer un schéma conceptuel afin de mesurer la complétude d'une entité. Pour finir, à l'aide des travaux précédents, nous avons proposé une approche fondée sur les plongements de phrases permettant de calculer les propriétés pouvant être propagées dans un contexte précis. Ceci permet l'expansion de requêtes SPARQL et, in fine, d'augmenter la complétude des résultats de la requête.