Apprentissage profond auto-supervisé de métriques : application à la prédiction d'assemblage de fragments de papyrus

Antoine Pirrone

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Apprentissage profond auto-supervisé de métriques : application à la prédiction d'assemblage de fragments de papyrus

FR |

EN

Auteur / Autrice :	Antoine Pirrone
Direction :	Marie Beurton-Aimar, Nicholas Journet
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 28/03/2022
Etablissement(s) :	Bordeaux
Ecole(s) doctorale(s) :	École doctorale Mathématiques et informatique (Talence, Gironde ; 1991-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire bordelais de recherche en informatique
	Equipe de recherche : Images et Son
Jury :	Président / Présidente : Harold Mouchère
	Examinateurs / Examinatrices : Marie Beurton-Aimar, Nicholas Journet, Véronique Eglin, Andreas Fischer, Marie-Pierre Chaufray, Daniel Stoekl ben ezra
	Rapporteurs / Rapporteuses : Véronique Eglin, Andreas Fischer

Mots clés

FR |

EN

Mots clés contrôlés

Apprentissage profond

Simulation par ordinateur

Texture (traitement d'images)

Apprentissage automatique

Mots clés libres

Apprentissage automatique

Analyse et traitement d’images

Apprentissage profond

Assemblage automatisé

Archéologie

Papyrologie

Résumé

FR |

EN

Dans cette thèse est présenté le développement de méthodes d’apprentissage profond pour proposer des appairages pertinents de fragments de documents, appliquées à la reconstruction de papyrus anciens. Nous avons conçu une méthode basée sur des réseaux de neurones siamois profonds ainsi qu’une approche auto-supervisée pour pallier le problème de la faible quantité de données d’entraînement annotées disponibles dans ce domaine. Ce travail fait partie du projet GESHAEM, une initiative de recherche scientifique financée par le Conseil Européen de la Recherche (European Research Council, ERC). Son objectif est d’étudier un corpus papyrologique, la collection Jouguet de la Sorbonne, composé de papyrus qui ont été déchirés pour fabriquer des ornements funéraires. Ces papyrus sont pour la plupart des documents administratifs et fiscaux dont le contenu est très utile pour les historiens afin de mieux comprendre la façon dont ces sociétés anciennes étaient organisées. Cependant, de part le fait que les papyrus ont été déchirés il y a environ 2000 ans, et qu’ils ont été très dégradés à cause du temps et des conditions de conservation, leur étude nécessite un grand travail de reconstruction par les papyrologues. C’est un processus long et fastidieux s’il est fait à la main, car la collection est composée de centaines de fragments. L’objectif de ce travail est ainsi de calculer des suggestions d’appairages de fragments aux papyrologues afin d’accélérer le processus de reconstruction. Nous proposons une approche basée sur des patchs utilisant des réseaux de neurones siamois profonds pour calculer un score de similarité entre deux fragments de papyrus. La difficulté d’obtenir des données annotées en grande quantité rend difficile la construction d’un modèle fonctionnant sur différents types de documents. Pour cela, nous proposons une méthodologie d’apprentissage auto-supervisée exploitant la structure intrinsèque des documents. Cette méthode permet d’entraîner des réseaux de neurones siamois profonds sans avoir besoin de données annotées. Nous avons aussi constitué une base de données prête à l’emploi basée sur la collection de papyrus de l’Université du Michigan, que nous avons ouverte à la communauté.

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Apprentissage profond auto-supervisé de métriques : application à la prédiction d'assemblage de fragments de papyrus

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Apprentissage profond auto-supervisé de métriques : application à la prédiction d'assemblage de fragments de papyrus

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses