Résolution de coréférences multi-domaines sur Twitter : TAL et Link Open Data
Auteur / Autrice : | Vivien Leonard |
Direction : | Jean-Yves Antoine, Béatrice Markhoff |
Type : | Projet de thèse |
Discipline(s) : | Informatique |
Date : | Inscription en doctorat le 01/05/2022 |
Etablissement(s) : | Tours |
Ecole(s) doctorale(s) : | École doctorale Mathématiques, Informatique, Physique Théorique et Ingénierie des Systèmes (Centre-Val de Loire ; 2012-....) |
Partenaire(s) de recherche : | Laboratoire : Laboratoire d'Informatique Fondamentale et Appliquée de Tours |
Mots clés
Mots clés libres
Résumé
Les données Twitter sont des données complexes : fautes, manque de consistance, langage proche de l'oral, et contrainte compte tenu du nombre de caractères autorisés. De plus, dans une perspective d'agrégation de données issues de cette source, le moteur de recherche qui est accessible est très limité (recherche par mot-clé avec correspondance stricte). La mise en place d'une approche multi-disciplinaire (TAL et LOD), alliant expansion de requête, entity linking (explicite et implicite), et résolution de coréférence permettrait de pallier le manque d'expressivité de l'outils de requêtage proposé par Twitter. Cette approche va se baser sur les mentions explicite (e.g. « Paris »), et implicite (e.g. « la ville de Notre Dame ») afin de construire un contexte qui sera enrichit au fur et à mesure des étapes, chaque étape se servant du résultat de la précédente. L'objectif final est l'agrégation de données en rapport à un sujet.