Repérage automatique de séquences figées
Auteur / Autrice : | Aurélie Joseph |
Direction : | Salah Mejri, Emmanuel Cartier |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences du langage |
Date : | Soutenance le 18/12/2013 |
Etablissement(s) : | Paris 13 |
Ecole(s) doctorale(s) : | École doctorale Érasme (Villetaneuse, Seine-Saint-Denis) |
Jury : | Président / Présidente : Philippe Monneret |
Examinateurs / Examinatrices : Pierre-André Buvet, Vincent Poulain d'Andecy | |
Rapporteurs / Rapporteuses : Panayota-Tita Kyriacopoulou |
Mots clés
Résumé
Cette thèse vise à proposer un modèle théorique et une méthodologie permettant d’effectuer des analyses linguistiques fines des textes, permettant de rendre compte des éléments utiles des courriers à savoir : le motif/objet du courrier, l’émetteur et le destinataire du courrier. L’approche doit permettre un traitement efficace des verrous technologiques du TAL, et spécialement le problème du figement et plus particulièrement des séquences verbales figées. Il s’agit d’un phénomène extrêmement fréquent dans toutes les langues, présenté comme une des sources de difficultés majeures pour la recherche d’information et la veille dans les documents dits non structurés. La thèse comprendra une partie applicative démontrant l’efficacité de la théorie proposee, et aboutissant à un système de traitement automatique des courriers. Par ailleurs, la démarche méthodologique aboutissant aux ressources linguistiques doit permettre de définir un outil d’apprentissage automatique de ces ressources qui pourra ainsi être appliqué à de nouveaux types de documents.