Thèse soutenue

Un système d'interrogation flexible pour le Web sémantique : application au corpus de la correspondance d'Henri Poincaré
FR  |  
EN
Accès à la thèse
Auteur / Autrice : Nicolas Lasolle
Direction : Jean LieberOlivier Bruneau
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 07/10/2022
Etablissement(s) : Université de Lorraine
Ecole(s) doctorale(s) : École doctorale IAEM Lorraine - Informatique, Automatique, Électronique - Électrotechnique, Mathématiques de Lorraine
Partenaire(s) de recherche : Laboratoire : Laboratoire lorrain de recherche en informatique et ses applications
Jury : Président / Présidente : Horatiu Cirstea
Examinateurs / Examinatrices : Jean Lieber, Olivier Bruneau, Catherine Faron, Sylvie Despres, Nathalie Hernandez
Rapporteurs / Rapporteuses : Catherine Faron, Sylvie Despres

Résumé

FR  |  
EN

De nombreux travaux historiques s'intéressent à la vie et à l'œuvre d'Henri Poincaré (1854-1912), notamment par l'étude et la publication du corpus de sa correspondance, qui se compose d'environ 2000 lettres et qui comprend des échanges relevant du cadre académique, privé ou scientifique. Depuis plusieurs années, des travaux numériques se sont développés pour stocker, publier et exploiter les données de ce corpus par la mise en œuvre de standards et de technologies du Web sémantique, en particulier RDF RDFS et SPARQL. Lors de l'interrogation d'un graphe RDF plusieurs situations peuvent mener à une volonté de formuler des interrogations flexibles. Ce terme caractérise des méthodes de recherche allant au-delà des systèmes de recherche classiques, qui se cantonnent aux interrogations exactes et qui ne permettent pas ou peu d'exprimer des préférences utilisateurs. La contribution principale de ce travail de recherche s'intéresse à la formalisation, à l'étude et aux applications d'un mécanisme d'interrogation flexible s'appuyant sur l'utilisation de règles de transformation de requêtes SPARQL. Ce système permet, à partir d'une requête initiale, d'un graphe RDF et d'un ensemble de règles, de générer des requêtes SPARQL afin d'offrir des résultats alternatifs à ceux initialement retournés suite à l'interrogation d'un corpus. Les règles de transformation peuvent être génériques, et donc facilement transposables à d'autres graphes, ou être dépendantes d'un domaine d'application. Plusieurs outils s'appuyant sur ce mécanisme ont été développés pour assister l'exploitation numérique du corpus de la correspondance d'Henri Poincaré. Un outil d'aide à l'édition manuelle de données RDF a été implémenté pour assister cette tâche parfois longue et fastidieuse et comportant un risque d'erreurs significatif. Celui-ci s'appuie sur les connaissances du domaine et sur l'utilisation du raisonnement à partir de cas pour fournir une liste ordonnée de suggestions lors de l'édition d'un triplet RDF. Le système d'interrogation flexible défini a également été intégré à un outil de navigation, qui propose une interface pour l'exploration visuelle de graphes RDF, et qui exploite les similarités entre les ressources d'un graphe pour générer des filtres de recherche. Ces outils exploitent les connaissances associées au corpus de la correspondance qui sont intégrées à diverses règles de transformation. Au travers de l'utilisation de ce mécanisme, ces travaux s'interrogent également sur l'évolution des pratiques de recherche en histoire, et tendent à illustrer comment un tel système d'interrogation flexible peut contribuer à la méthode heuristique. Les méthodes et les outils proposés peuvent être appliqués pour d'autres corpus, en particulier dans le cadre de projets d'humanités numériques.