Thèse soutenue

Interprétation contextuelle et assistée de fonds d'archives numérisées : application à des registres de ventes du XVIIIe siècle

FR  |  
EN
Auteur / Autrice : Joseph Chazalon
Direction : Jean Camillerapp
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance le 09/01/2013
Etablissement(s) : Rennes, INSA
Ecole(s) doctorale(s) : École doctorale Mathématiques, télécommunications, informatique, signal, systèmes, électronique (Rennes)
Partenaire(s) de recherche : Laboratoire : Institut de recherche en informatique et systèmes aléatoires (Rennes) - INTUIDOC - IRISA
: Université européenne de Bretagne (2007-2016)
Jury : Président / Présidente : Jean-Marc Ogier
Examinateurs / Examinatrices : Rolf Ingold, Christopher Kermorvant, Bertrand Coüasnon
Rapporteur / Rapporteuse : Jean-Marc Ogier, Josep Llados i Canet

Résumé

FR  |  
EN

Les fonds d'archives forment de grandes quantités de documents difficiles à interpréter automatiquement : les approches classiques imposent un lourd effort de conception, sans parvenir à empêcher la production d'erreurs qu'il faut corriger après les traitements.Face à ces limites, notre travail vise à améliorer la processus d'interprétation, en conservant un fonctionnement page par page, et en lui apportant des informations contextuelles extraites du fonds documentaire ou fournies par des opérateurs humains.Nous proposons une extension ciblée de la description d'une page qui permet la mise en place systématique d'échanges entre le processus d'interprétation et son environnement. Un mécanisme global itératif gère l'apport progressif d'informations contextuelles à ce processus, ce qui améliore l'interprétation.L'utilisation de ces nouveaux outils pour le traitement de documents du XVIIIe siècle a montré qu'il était facile d'intégrer nos propositions à un système existant, que sa conception restait simple, et que l'effort de correction pouvait être diminué.