Extraction de connaissances à partir d'ontologies de grandes tailles
Auteur / Autrice : | Hui Yang |
Direction : | Nicole Bidoit-Tollu, Yue Ma |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 16/05/2023 |
Etablissement(s) : | université Paris-Saclay |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....) |
Référent : Faculté des sciences d'Orsay | |
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….) | |
Jury : | Président / Présidente : Marie-Christine Rousset |
Examinateurs / Examinatrices : François Goasdoué, Meghyn Bienvenu, Michaël Thomazo, Marie-Laure Mugnier | |
Rapporteur / Rapporteuse : François Goasdoué, Meghyn Bienvenu |
Mots clés
Mots clés contrôlés
Mots clés libres
Résumé
Parce que les ontologies du monde réel, largement utilisées en pratique, sont souvent complexes et très volumineuses, concevoir des outils permettant aux utilisateurs de se concentrer sur des sous-ontologies correspondant à leurs centres d'intérêts est devenu un défi majeur. Dans ce contexte, ce travail étudie trois approches différentes pour extraire des connaissances à partir de grandes ontologies : (1) Les justifications qui sont des sous-ontologies minimales de l'ontologie d'origine permettant de dériver une conclusion spécifique ; (2) Les modules déductifs qui sont des sous-ontologies de l'ontologie d'origine et qui préservent toutes les implications relatives à un vocabulaire donné, ce vocabulaire traduisant l'intérêt de l'utilisateur ; et (3) Modules généraux qui sont de nouvelles ontologies (pas nécessairement des sous-ontologies) dont l'ensemble des implications relatives à un vocabulaire donné est identique à celui de l'ontologie d'origine. Pour le calcul de justifications et de modules déductifs, cette thèse propose de nouvelles méthodes basées sur la résolution. Ce sont des méthodes qui procèdent en deux étapes : (i) le codage de la dérivation des justifications, resp. des modules déductifs sous forme de clauses Horn ; (ii) le calcul des justifications, resp. des modules déductifs, par résolution sur les clauses de Horn obtenues. Pour encoder la dérivation des justifications, nous exploitons une représentation par graphe des ontologies et introduisons un système de règles d'inférence qui sont plus compactes que les règles des systèmes connus. Pour coder la dérivation des modules déductifs, nous introduisons une nouvelle notion, appelée forêt, qui est une représentation par graphe qui quant à elle capture toutes les implications logiques relatives à un vocabulaire donné. Pour le calcul des modules généraux, nous étudions une nouvelle méthode basée sur la résolution, inspirée de l'approche existante pour le calcul des interpolants uniformes. Cette méthode est, en général, plus efficace et produit des ontologies de meilleure qualité. Enfin, dans cette thèse, toutes nos approches sont évaluées en implémentant des prototypes qui servent à tester des ontologies du monde réel de grande taille. Les résultats expérimentaux sont comparés avec ceux des méthodes existantes les plus efficaces et permettent de valider l'efficacité et la qualité de nos méthodes.