Thèse en cours

Résolution de coréférences multi-domaines sur Twitter : TAL et Link Open Data

FR  |  
EN
Auteur / Autrice : Vivien Leonard
Direction : Jean-Yves AntoineBéatrice Markhoff
Type : Projet de thèse
Discipline(s) : Informatique
Date : Inscription en doctorat le 01/05/2022
Etablissement(s) : Tours
Ecole(s) doctorale(s) : École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire ; 2012-....)
Partenaire(s) de recherche : Laboratoire : Laboratoire d'Informatique Fondamentale et Appliquée de Tours

Mots clés

FR  |  
EN

Résumé

FR  |  
EN

Les données Twitter sont des données complexes : fautes, manque de consistance, langage proche de l'oral, et contrainte compte tenu du nombre de caractères autorisés. De plus, dans une perspective d'agrégation de données issues de cette source, le moteur de recherche qui est accessible est très limité (recherche par mot-clé avec correspondance stricte). La mise en place d'une approche multi-disciplinaire (TAL et LOD), alliant expansion de requête, entity linking (explicite et implicite), et résolution de coréférence permettrait de pallier le manque d'expressivité de l'outils de requêtage proposé par Twitter. Cette approche va se baser sur les mentions explicite (e.g. « Paris »), et implicite (e.g. « la ville de Notre Dame ») afin de construire un contexte qui sera enrichit au fur et à mesure des étapes, chaque étape se servant du résultat de la précédente. L'objectif final est l'agrégation de données en rapport à un sujet.