Thèse soutenue

Fouille du Web sémantique à la recherche d'axiomes OWL

FR  |  
EN
Auteur / Autrice : Thu Huong Nguyen
Direction : Andrea Tettamanzi
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 02/07/2021
Etablissement(s) : Université Côte d'Azur
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Nice ; 1992-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire Informatique, signaux et systèmes (Sophia Antipolis, Alpes-Maritimes) - Institut national de recherche en informatique et en automatique (France). Unité de recherche (Sophia Antipolis, Alpes-Maritimes)
Jury : Président / Présidente : Fabien Gandon
Examinateurs / Examinatrices : Andrea Tettamanzi, Fabien Gandon, Leonardo Vanneschi, Karim Tabia, Nathalie Hernandez, Catherine Faron
Rapporteurs / Rapporteuses : Leonardo Vanneschi, Karim Tabia

Résumé

FR  |  
EN

À l'ère du Web Sémantique, les données liées ouvertes (LOD) en sort l'implémentation la plus réussie qui contient actuellement des milliards de triplets RDF (Resource Data Framework) dérivés de sources multiples, distribuées et hétérogènes. Le rôle d'un schéma sémantique général, représenté comme une ontologie, est essentiel pour assurer l'exactitude et la cohérence du LOD et permettre d'inférer des connaissances implicites par le raisonnement. La croissance du LOD a créé une opportunité pour la découverte de connaissances ontologiques à partir de ses données RDF brutes elles-mêmes pour enrichir les bases de connaissances pertinentes. Dans ce travail, nous visons à découvrir des connaissances au niveau des schémas sous forme d'axiomes encodés en OWL (Ontology Web Language) à partir de données RDF. Les approches de génération automatisée d'axiomes à partir de faits RDF enregistrés sur le Web peuvent être considérées comme un cas de raisonnement inductif et d'apprentissage d'ontologie. Les instances, représentées par des triplets RDF, jouent le rôle d'observations spécifiques, dont les axiomes peuvent être extraits par généralisation.Partant du principe que la découverte de nouvelles connaissances est essentiellement un processus évolutif, dans lequel les hypothèses sont générées par un mécanisme heuristique puis testées par rapport à l'évidence disponible, de sorte que seules les meilleures hypothèses survivent, nous proposons un modèle appliquant l'évolution grammaticale, un type d'algorithme évolutionnaire, pour extraire les axiomes OWL d'un référentiel de données RDF. En outre, nous spécialisons le modèle pour le problème spécifique d'apprentissage d'axiomes de disjonction de classes OWL, ainsi que pour les expériences effectuées sur DBpedia, l'un des exemples les plus proéminents du LOD.De plus, nous utilisons différentes fonctions de notation des axiomes basées sur la théorie des possibilités, qui sont bien adaptées au scénario d'hypothèse du monde ouvert du LOD, pour évaluer la qualité des axiomes découverts. Plus précisément, nous avons proposé un ensemble de mesures pour construire des fonctions objectif basées respectivement sur des modèles à objectif unique et multi-objectifs.Enfin, afin de la valider, la performance de notre approche est évaluée par rapport à des benchmarks, subjectif et objectif, et est également comparée aux principaux systèmes de l'état de l'art.