Apprentissage profond auto-supervisé de métriques : application à la prédiction d'assemblage de fragments de papyrus
Auteur / Autrice : | Antoine Pirrone |
Direction : | Marie Beurton-Aimar, Nicholas Journet |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance le 28/03/2022 |
Etablissement(s) : | Bordeaux |
Ecole(s) doctorale(s) : | École doctorale Mathématiques et informatique (Talence, Gironde ; 1991-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire bordelais de recherche en informatique |
Equipe de recherche : Images et Son | |
Jury : | Président / Présidente : Harold Mouchère |
Examinateurs / Examinatrices : Marie Beurton-Aimar, Nicholas Journet, Véronique Eglin, Andreas Fischer, Marie-Pierre Chaufray, Daniel Stoekl ben ezra | |
Rapporteur / Rapporteuse : Véronique Eglin, Andreas Fischer |
Résumé
Dans cette thèse est présenté le développement de méthodes d’apprentissage profond pour proposer des appairages pertinents de fragments de documents, appliquées à la reconstruction de papyrus anciens. Nous avons conçu une méthode basée sur des réseaux de neurones siamois profonds ainsi qu’une approche auto-supervisée pour pallier le problème de la faible quantité de données d’entraînement annotées disponibles dans ce domaine. Ce travail fait partie du projet GESHAEM, une initiative de recherche scientifique financée par le Conseil Européen de la Recherche (European Research Council, ERC). Son objectif est d’étudier un corpus papyrologique, la collection Jouguet de la Sorbonne, composé de papyrus qui ont été déchirés pour fabriquer des ornements funéraires. Ces papyrus sont pour la plupart des documents administratifs et fiscaux dont le contenu est très utile pour les historiens afin de mieux comprendre la façon dont ces sociétés anciennes étaient organisées. Cependant, de part le fait que les papyrus ont été déchirés il y a environ 2000 ans, et qu’ils ont été très dégradés à cause du temps et des conditions de conservation, leur étude nécessite un grand travail de reconstruction par les papyrologues. C’est un processus long et fastidieux s’il est fait à la main, car la collection est composée de centaines de fragments. L’objectif de ce travail est ainsi de calculer des suggestions d’appairages de fragments aux papyrologues afin d’accélérer le processus de reconstruction. Nous proposons une approche basée sur des patchs utilisant des réseaux de neurones siamois profonds pour calculer un score de similarité entre deux fragments de papyrus. La difficulté d’obtenir des données annotées en grande quantité rend difficile la construction d’un modèle fonctionnant sur différents types de documents. Pour cela, nous proposons une méthodologie d’apprentissage auto-supervisée exploitant la structure intrinsèque des documents. Cette méthode permet d’entraîner des réseaux de neurones siamois profonds sans avoir besoin de données annotées. Nous avons aussi constitué une base de données prête à l’emploi basée sur la collection de papyrus de l’Université du Michigan, que nous avons ouverte à la communauté.