Découverte évolutive de connaissance à partir de graphe de données RDF
Auteur / Autrice : | Rémi Felin |
Direction : | Andrea Tettamanzi, Catherine Faron |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 13/09/2021 |
Etablissement(s) : | Université Côte d'Azur |
Ecole(s) doctorale(s) : | École doctorale Sciences et technologies de l'information et de la communication |
Partenaire(s) de recherche : | Laboratoire : I3S - Informatique, Signaux et Systèmes de Sophia-Antipolis |
Mots clés
Résumé
Les graphes de connaissances sont des collections de descriptions interconnectées d'entités (objets, événements ou concepts). Ils mettent les données en contexte par le biais de liens et de métadonnées sémantiques et fournissent ainsi un cadre pour l'intégration, l'unification, l'analyse et le partage des données. Un certain nombre d'utilisations et d'applications spécifiques reposent sur les graphes de connaissances. Citons par exemple les services à forte intensité de données et d'informations, tels que la réutilisation intelligente de contenus et de paquets, la recommandation de contenus réactifs et contextuels, la découverte de médicaments alimentée par des graphes de connaissances, la recherche sémantique, l'information sur le marché des investissements, la découverte d'informations dans les documents réglementaires, l'analyse avancée de la sécurité des médicaments, etc. La manière de construire des graphes de connaissances riches en informations factuelles provenant de diverses sources est relativement bien comprise. Ce qui est plus difficile et plus coûteux, c'est de doter ces graphes de connaissances d'un schéma et d'une sémantique, constitués de règles, de contraintes et de relations (en résumé, d'axiomes) qui permettent de vérifier leur cohérence et de déduire des connaissances implicites par raisonnement. Une approche de ce problème qui a donné des résultats prometteurs [4] utilise l'évolution grammaticale, un type d'algorithme évolutionnaire, et la théorie des possibilités, basée sur l'idée que la découverte d'axiomes est essentiellement un processus évolutionnaire, dans lequel les axiomes candidats sont générés par un mécanisme heuristique et ensuite testés contre les preuves disponibles [5], selon l'hypothèse du monde ouvert, de sorte que seuls les meilleurs candidats survivent. Cette approche s'est avérée capable de découvrir efficacement des axiomes de subsomption et de disjonction de classes [3], impliquant des expressions de classes atomiques et complexes [1,2], à partir d'énormes graphes de connaissances. L'objectif principal de cette thèse est d'étendre cette méthode pour permettre la découverte de types supplémentaires d'axiomes (par exemple, les axiomes d'équivalence, les axiomes de domaine/plage de propriétés, les axiomes de clés, etc.) et de s'attaquer à la question encore ouverte de l'utilisation efficace des services de raisonnement disponibles, qui peuvent être notoirement coûteux en termes de ressources informatiques, dans ce contexte.