Thèse soutenue

Repérage automatique de séquences figées

FR  |  
EN
Auteur / Autrice : Aurélie Joseph
Direction : Salah MejriEmmanuel Cartier
Type : Thèse de doctorat
Discipline(s) : Sciences du langage
Date : Soutenance le 18/12/2013
Etablissement(s) : Paris 13
Ecole(s) doctorale(s) : École doctorale Érasme (Villetaneuse, Seine-Saint-Denis)
Jury : Président / Présidente : Philippe Monneret
Examinateurs / Examinatrices : Pierre-André Buvet, Vincent Poulain d'Andecy
Rapporteurs / Rapporteuses : Panayota-Tita Kyriacopoulou

Résumé

FR  |  
EN

Cette thèse vise à proposer un modèle théorique et une méthodologie permettant d’effectuer des analyses linguistiques fines des textes, permettant de rendre compte des éléments utiles des courriers à savoir : le motif/objet du courrier, l’émetteur et le destinataire du courrier. L’approche doit permettre un traitement efficace des verrous technologiques du TAL, et spécialement le problème du figement et plus particulièrement des séquences verbales figées. Il s’agit d’un phénomène extrêmement fréquent dans toutes les langues, présenté comme une des sources de difficultés majeures pour la recherche d’information et la veille dans les documents dits non structurés. La thèse comprendra une partie applicative démontrant l’efficacité de la théorie proposee, et aboutissant à un système de traitement automatique des courriers. Par ailleurs, la démarche méthodologique aboutissant aux ressources linguistiques doit permettre de définir un outil d’apprentissage automatique de ces ressources qui pourra ainsi être appliqué à de nouveaux types de documents.