Traitement du langage et modélisation de relations pour la représentation unifiée de documents narratifs
Auteur / Autrice : | Arthur Amalvy |
Direction : | Vincent Labatut, Richard Dufour |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 15/09/2021 |
Etablissement(s) : | Avignon |
Ecole(s) doctorale(s) : | École doctorale Sciences et agrosciences (Avignon) |
Partenaire(s) de recherche : | Laboratoire : LIA - Laboratoire d'Informatique d'Avignon |
Equipe de recherche : CORNET - Complex systems, Operation Resarch and NETworking |
Mots clés
Résumé
Dans le domaine du traitement du langage, la question de la construction de représentations pertinentes de mots ou de phrases est capitale pour de nombreuses applications. Or, il existe peu de travaux sur la représentation de documents ou de corpus à grande échelle. L'objectif de cette thèse est de proposer de nouvelles approches permettant la représentation multimodale de documents narratifs (articles de presse, notices biographiques, romans) ou de corpus de tels documents, en s'appuyant notamment sur des graphes d'interactions entre acteurs. Cette représentation multimodale ayant vocation à être utilisée dans la résolution de tâches concrètes, l'évaluation de celle-ci sur plusieurs applications telles que la classification, la recommandation et la segmentation de textes permettra de valider sa pertinence.