Thèse soutenue

Extraction de connaissances à partir d'ontologies de grandes tailles

FR  |  
EN
Auteur / Autrice : Hui Yang
Direction : Nicole Bidoit-TolluYue Ma
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 16/05/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire interdisciplinaire des sciences du numérique (Orsay, Essonne ; 2021-....)
Référent : Faculté des sciences d'Orsay
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-….)
Jury : Président / Présidente : Marie-Christine Rousset
Examinateurs / Examinatrices : François Goasdoué, Meghyn Bienvenu, Michaël Thomazo, Marie-Laure Mugnier
Rapporteur / Rapporteuse : François Goasdoué, Meghyn Bienvenu

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Parce que les ontologies du monde réel, largement utilisées en pratique, sont souvent complexes et très volumineuses, concevoir des outils permettant aux utilisateurs de se concentrer sur des sous-ontologies correspondant à leurs centres d'intérêts est devenu un défi majeur. Dans ce contexte, ce travail étudie trois approches différentes pour extraire des connaissances à partir de grandes ontologies : (1) Les justifications qui sont des sous-ontologies minimales de l'ontologie d'origine permettant de dériver une conclusion spécifique ; (2) Les modules déductifs qui sont des sous-ontologies de l'ontologie d'origine et qui préservent toutes les implications relatives à un vocabulaire donné, ce vocabulaire traduisant l'intérêt de l'utilisateur ; et (3) Modules généraux qui sont de nouvelles ontologies (pas nécessairement des sous-ontologies) dont l'ensemble des implications relatives à un vocabulaire donné est identique à celui de l'ontologie d'origine. Pour le calcul de justifications et de modules déductifs, cette thèse propose de nouvelles méthodes basées sur la résolution. Ce sont des méthodes qui procèdent en deux étapes : (i) le codage de la dérivation des justifications, resp. des modules déductifs sous forme de clauses Horn ; (ii) le calcul des justifications, resp. des modules déductifs, par résolution sur les clauses de Horn obtenues. Pour encoder la dérivation des justifications, nous exploitons une représentation par graphe des ontologies et introduisons un système de règles d'inférence qui sont plus compactes que les règles des systèmes connus. Pour coder la dérivation des modules déductifs, nous introduisons une nouvelle notion, appelée forêt, qui est une représentation par graphe qui quant à elle capture toutes les implications logiques relatives à un vocabulaire donné. Pour le calcul des modules généraux, nous étudions une nouvelle méthode basée sur la résolution, inspirée de l'approche existante pour le calcul des interpolants uniformes. Cette méthode est, en général, plus efficace et produit des ontologies de meilleure qualité. Enfin, dans cette thèse, toutes nos approches sont évaluées en implémentant des prototypes qui servent à tester des ontologies du monde réel de grande taille. Les résultats expérimentaux sont comparés avec ceux des méthodes existantes les plus efficaces et permettent de valider l'efficacité et la qualité de nos méthodes.