Modélisation, création et analyse de métadonnées dans les lacs de données
Auteur / Autrice : | Rajae El-idrissi |
Direction : | Jérôme Darmont, Sabine Loudcher |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 01/10/2023 |
Etablissement(s) : | Lyon 2 |
Ecole(s) doctorale(s) : | InfoMaths - Informatique et Mathématiques de Lyon |
Partenaire(s) de recherche : | Laboratoire : ERIC |
Mots clés
Résumé
À l'intersection de plusieurs domaines (données massives, apprentissage automatique, Web de données, graphes), l'objectif de la thèse sera de permettre la création assistée ou semi-automatique de métadonnées au moment de l'insertion de nouvelles entités de données dans un lac et ce grâce à l'extraction automatique d'informations depuis les données « primaires » par des méthodes d'intelligence artificielle ; la complétion de métadonnées par celles issues du Web de données et d'ontologies de domaine ; la création de liens entre les entités de données du lac modélisées en graphes ; une évaluation des possibilités et des performances des modèles et des langages de métadonnées utilisés dans le domaine des lacs de données comparée à celles des standards du Web sémantique ; l'interrogation des données du lac à l'aide de requêtes formulées sur les métadonnées ; l'industrialisation des systèmes de gestion de métadonnées pour différents projets de recherche. Cette thèse comprendra trois grand niveaux de réalisation : un niveau conceptuel ou théorique pour concevoir les différentes propositions, un niveau technique pour l'implémentation informatique des solutions et un niveau applicatif avec la mise en uvre des propositions dans plusieurs projets de recherche en Humanités numériques du laboratoire ERIC.