Thèse en cours

Traitement du langage et modélisation de relations pour la représentation unifiée de documents narratifs

FR  |  
EN
Auteur / Autrice : Arthur Amalvy
Direction : Vincent LabatutRichard Dufour
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 15/09/2021
Etablissement(s) : Avignon
Ecole(s) doctorale(s) : École doctorale Sciences et agrosciences (Avignon)
Partenaire(s) de recherche : Laboratoire : LIA - Laboratoire d'Informatique d'Avignon
Equipe de recherche : CORNET - Complex systems, Operation Resarch and NETworking

Résumé

FR  |  
EN

Dans le domaine du traitement du langage, la question de la construction de représentations pertinentes de mots ou de phrases est capitale pour de nombreuses applications. Or, il existe peu de travaux sur la représentation de documents ou de corpus à grande échelle. L'objectif de cette thèse est de proposer de nouvelles approches permettant la représentation multimodale de documents narratifs (articles de presse, notices biographiques, romans) ou de corpus de tels documents, en s'appuyant notamment sur des graphes d'interactions entre acteurs. Cette représentation multimodale ayant vocation à être utilisée dans la résolution de tâches concrètes, l'évaluation de celle-ci sur plusieurs applications telles que la classification, la recommandation et la segmentation de textes permettra de valider sa pertinence.