Thèse soutenue

Techniques coopératives pour l'exploitation des bases de connaissances et passage à l'échelle

FR  |  
EN
Auteur / Autrice : Louise Parkin
Direction : Brice ChardinAllel HadjaliStéphane Jean
Type : Thèse de doctorat
Discipline(s) : Informatique et applications
Date : Soutenance le 09/12/2022
Etablissement(s) : Chasseneuil-du-Poitou, Ecole nationale supérieure de mécanique et d'aérotechnique
Ecole(s) doctorale(s) : École doctorale Sciences et Ingénierie des Systèmes, Mathématiques, Informatique (Limoges ; 2018-2022)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique et d'Automatique pour les Systèmes / LIAS
Jury : Examinateurs / Examinatrices : Anne Laurent, Hala Skaf
Rapporteurs / Rapporteuses : Guy De Tré, Frédérique Laforest

Résumé

FR  |  
EN

Avec le développement des bases de connaissances dans de nombreux domaines industriels comme académiques,des utilisateurs novices sont confrontés à la nécessité de formuler des requêtes, sans forcément maîtriser le langage de requête, SPARQL, ou la structure de données sous-jacente, généralement décrite avec le langage RDF. Ces utilisateurs peuvent ainsi commettre des erreurs lors de l’écriture de leurs requêtes et obtenir des résultats inattendus ou difficiles à traiter. Parmi les situations d’insatisfaction des utilisateurs, le problème des réponses vides a été largement étudié. L’explication des raisons de l’absence de réponse peut permettre soit à l’utilisateur de progresser dans l’écriture de ses requêtes, soit à les corriger automatiquement. Mais l’absence de réponse n’est pas la seule source possible d’insatisfaction et peu de travaux existants se sont intéressés à l’identification des causes d’échec pour des problèmes différents. Dans un premier temps nous nous intéressons au problème des réponses pléthoriques,c’est-à-dire lorsqu’une requête produit un très grand nombre de réponses alors que l’utilisateur ne s’y attendait pas,et qu’il ne peut alors pas en extraire l’information pertinente. Nous montrons que des notions de cause d’échec et de requête alternatives introduites pour le problème des réponses vides peuvent être étendues au problème des réponses pléthoriques, et nous introduisons des algorithmes de calcul adaptés. Nous avons ensuite considéré les apports spécifiques de SPARQL en utilisant les cardinalités de prédicats pour améliorer les algorithmes de recherche et en adaptant notre formalisme pour accepter les requêtes contenant plusieurs opérateurs spécifiques à ce langage.Enfin, la méthode est généralisée pour un problème quelconque d’insatisfaction de l’utilisateur avec les résultats obtenus. Nous montrons comment traiter cinq problèmes élémentaires de réponses insatisfaisantes et comment les combiner pour décrire des problèmes plus complexes. Nos contributions ont été validées expérimentalement en utilisant des données et requêtes synthétiques de WatDiv et des données et requêtes réelles de DBpedia.