Thèse soutenue

Analyse de trajectoires sémantiques pour la prédiction de l'état physique des collections à la BnF

FR  |  
EN
Auteur / Autrice : Alaa Zreik
Direction : Zoubida Kedad
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 16/01/2023
Etablissement(s) : université Paris-Saclay
Ecole(s) doctorale(s) : École doctorale Sciences et technologies de l'information et de la communication (Orsay, Essonne ; 2015-....)
Partenaire(s) de recherche : Laboratoire : Données et algorithmes pour une ville intelligente et durable (Versailles ; 2015-...)
référent : Université de Versailles-Saint-Quentin-en-Yvelines (1991-....)
graduate school : Université Paris-Saclay. Graduate School Informatique et sciences du numérique (2020-....)
Jury : Président / Présidente : Nacéra Seghouani-Bennacer
Examinateurs / Examinatrices : Amel Bouzeghoub, Dimitris Kotzinos, Fayçal Hamdi
Rapporteurs / Rapporteuses : Amel Bouzeghoub, Dimitris Kotzinos

Résumé

FR  |  
EN

La Bibliothèque nationale de France (BnF) a pour mission de collecter, conserver, enrichir et communiquer le patrimoine documentaire national. Elle conserve près de quarante millions de documents.L'une des missions de la BnF est de maintenir les documents qui composent ses collections en bon état afin d'assurer leur disponibilité auprès des lecteurs.La définition d'une politique de conservation/restauration par les experts suppose l'identification des documents qui sont en mauvais état ; pour cela, l'état physique des documents doit être vérifié régulièrement afin d'identifier ceux qui nécessitent des interventions urgentes. Mais cette tâche très chronophage est impossible en pratique en raison du volume très important de documents.L'objectif de notre travail est de fournir un support aux experts dans la définition de leurs politiques de conservation/restauration, et de fournir un système d'aide à la décision permettant de caractériser l'état physique des documents par l'intégration et l'analyse des données disponibles dans les bases de données des différents départements de la BnF.En considérant que chaque document est décrit par un historique de conservation/restauration qui inclut toutes les informations susceptibles d'avoir un impact sur son état physique, les principales questions auxquelles nous sommes confrontés sont d'un part celle de la représentation de ces historiques et leur comparaison en tenant compte de leur hétérogénéité terminologique, d'autre part la définition d'un processus d'analyse de ces historiques permettant de caractériser l'état des documents et de le prédire.Notre travail vise à proposer des contributions pour un système d'aide à la décision pour des experts en conservation/restauration à la BnF. Nous avons proposé une représentation des historiques de conservation--restauration sous la forme de trajectoires sémantiques et nous avons introduit des mesures de similarité adaptées permettant de résoudre l'hétérogénéité terminologique des données en utilisant une base de connaissance externe, élaborée en collaboration avec les experts. Nous avons également défini un processus d'analyse fondé sur un algorithme de clustering afin de caractériser l'état physique des documents. Enfin, nous avons proposé une méthode originale de pondération des concepts qui permet de définir l'importance de ces derniers en considérant une tâche d'analyse spécifique.