Thèse en cours

Gestion des connaissances, des contraintes et des données hétérogènes et incertaines

FR  |  
EN
Auteur / Autrice : Arthur Marzinkowski
Direction : Salem BenferhatAnastasia Paparrizou
Type : Projet de thèse
Discipline(s) : Informatique et applications
Date : Inscription en doctorat le 01/10/2022
Etablissement(s) : Artois
Ecole(s) doctorale(s) : Sciences, Technologie, Santé
Partenaire(s) de recherche : Laboratoire : CRIL - Centre de recherche en informatique de Lens

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Cette thèse concerne la représentation et le traitement des données, des connaissances et des contraintes hétérogènes et incertaines. L'hétérogénéité renvoie d'abord à des informations de nature différente. Par exemple, certaines données peuvent être structurées et faciles à interroger. D'autres données peuvent-être non structurées et difficilement exploitables. Des exemples de données non structurées sont les images, les rapports, les cartes de réseaux (par exemple urbains) analogiques ou numérisées. L'hétérogénéité désigne également les différentes imperfections liées à l'information : données factuelles incertaines, données incomplètes, contraintes flexibles, informations potentiellement contradictoires, etc. Cette thèse est définie dans ce contexte de la gestion des informations et des données hétérogènes. Elle concerne dans un premier temps l'extraction, la completion (à partir de données et d'informations multi-sources), l'interprétation et l'annotation automatique des données non structurées. L'objectif est de combiner les techniques d'apprentissage automatique (Machine Learning) avec des approches basées sur les connaissances, les contraintes et les ontologies afin de représenter les données non structurées (par exemple des images) dans un format facilement exploitable par les méthodes d'Intelligence Artificielle (par exemple sous forme de bases de données). Le deuxième objectif de la thèse concerne la définition des langages formels (modèles logiques et graphiques) pour représenter les différentes formes de données et de connaissances. Un accent sera mis sur des langages, dits 'traitables', spécialement conçus pour les applications traitant d'une grande quantité de données et dans lesquelles l'interrogation est une tâche de raisonnement importante [1]. Le dernier objectif de la thèse concerne la définition des mécanismes efficaces d'interrogation et d'inférence pour d'une part répondre aux requêtes sur la base des informations hétérogènes et pour d'autre part raisonner sur des données spatiales sous contraintes [4]. Dans un contexte d'informations hétérogènes, une question importante concerne la gestion des informations 'conflictuelles'. Le problème de gestion des conflits a reçu une attention considérable dans la littérature et reste un problème ouvert en Intelligence artificielle. Différentes attitudes peuvent être suivies en présence de conflits dans les bases de connaissances. Le but est d'étendre les mécanismes de sélection de réparations préférées [2], définies dans le cadre des ontologies légères, aux données hétérogènes et en présence d'incertitude et de contraintes flexibles. Les modèles et les algorithmes développés dans cette thèse seront validés sur des données des réseaux urbains (riches en informations hétérogènes) [3]. References [1] Sihem Belabbes, Salem Benferhat, and Jan Chomicki. Handling inconsistency in partially preordered ontologies: the elect method. J. Log. Comput., 31(5):1356–1388, 2021. [2] Salem Benferhat, Zied Bouraoui, and Karim Tabia. How to select one preferred assertional-based repair from inconsistent and prioritized dl-lite knowledge bases? In Qiang Yang and Michael J. Wooldridge, editors, Proceedings of the Twenty-Fourth International Joint Conference on Artificial Intelligence, IJCAI 2015, Buenos Aires, Argentina, July 25-31, 2015, pages 1450–1456. AAAI Press, 2015. [3] N. Chahinian, C. Delenne, B. Commandr´e, M. Derras, L. Deruelle, and JS. Bailly. Automatic mapping of urban wastewater networks based on manhole cover locations. Computers, Environment and Urban Systems, 78:101370, 2019. [4] Michael Sioutis, Anastasia Paparrizou, and Tomi Janhunen. On neighbourhood singleton-style consistencies for qualitative spatial and temporal reasoning. Inf. Comput., 280:104638, 2021.