Détection d'isotopies par apprentissage profond : l'exemple de la sexualité en latin classique et tardif
Auteur / Autrice : | Thibault Clérice |
Direction : | Christian Nicolas |
Type : | Thèse de doctorat |
Discipline(s) : | Lettres et civilisations antiques |
Date : | Soutenance le 28/03/2022 |
Etablissement(s) : | Lyon |
Ecole(s) doctorale(s) : | École doctorale Lettres, langues, linguistique, arts (Lyon ; 2007-....) |
Partenaire(s) de recherche : | établissement opérateur de soutenance : Université Jean Moulin (Lyon ; 1973-....) |
Jury : | Président / Présidente : Bruno Bureau |
Examinateurs / Examinatrices : Bruno Bureau, Elena Pierazzo, Laurent Romary, Marie-Claire Beaulieu, Helma Dik | |
Rapporteur / Rapporteuse : Elena Pierazzo, Laurent Romary |
Mots clés
Mots clés contrôlés
Résumé
En 1982, James N. Adams a produit l’étude de référence sur le vocabulaire latin de la sexualité. Dans son ouvrage, l’auteur présente un large éventail de mots ou d’expressions classées en fonction de leurs caractéristiques stylistiques (métaphore, métonymie, etc.) et sémantiques (guerre, cuisine, chasse, violence...) dans diverses catégories (actes, parties intimes masculines et féminines, etc.). À la même époque, François Rastier redéfinit l’isotopie comme « la récurrence d’un même trait sémantique » dans un texte. Dans la lignée de ces travaux, nous avons construit un méta-corpus latin inédit de 20 millions de mots en TEI mêlant projets existants et nouveaux textes. En utilisant ce métacorpus et le travail d’Adams, nous avons construit un exemplier numérique qui fournit 2500 exemples d’isotopies sexuelles latines. Pour traiter le corpus, nous avons développé une méthode et les outils pour lemmatiser et annoter la morphosyntaxe des textes en latins classique et tardif. Enfin, nous avons testé des méthodes d’apprentissage profond pour détecter les isotopies dans des textes latins allant de 200 avant notre ère jusqu’à +700. Cette méthode pourra servir de base à la construction de nouveaux « vocabulaires » ou exempliers pour d’autres isotopies à l’avenir. Une sélection de méthodes montre des résultats robustes avec l’exemplier complet, et nous évaluons les limites des diverses architectures de modèle de détection d’isotopie en fonction de la taille de l’exemplier ou de la part d’implicite dans ce dernier.