Communiquer par SMS : Analyse automatique du langage et extraction de l'information véhiculée

Eleni Kogkitsidou

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Communiquer par SMS : Analyse automatique du langage et extraction de l'information véhiculée

FR |

EN

Auteur / Autrice :	Eleni Kogkitsidou
Direction :	Georges Antoniadis
Type :	Thèse de doctorat
Discipline(s) :	Sciences du langage Spécialité Informatique et sciences du langage
Date :	Soutenance le 27/09/2018
Etablissement(s) :	Université Grenoble Alpes (ComUE)
Ecole(s) doctorale(s) :	École doctorale langues, littératures et sciences humaines (Grenoble, Isère, France ; 1991-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire de linguistique et didactique des langues étrangères et maternelles (Grenoble, Isère, France ; 1987-....)
Jury :	Président / Présidente : Gudrun Ledegen
	Examinateurs / Examinatrices : Rachel Panckhurst, Matthieu Quignard
	Rapporteurs / Rapporteuses : Cédrick Fairon, Panayota-Tita Kyriacopoulou

Mots clés

FR |

EN

Mots clés contrôlés

Normalisation linguistique

Langage SMS

Mots clés libres

Langage SMS

Normalisation des SMS

Recherche d'information

Communication médiée par ordinateur

Résumé

FR |

EN

Cette thèse concerne l’analyse automatique des SMS et l'extraction des informations qui y sont contenues. Le point de départ de notre recherche est le constat que la plupart des messages courts, observés dans le corpus alpes4science, présentent des différences en comparaison avec le langage standard. Les différences sont mises en évidence, d’une part, par la morphologie particulière des mots et, d’autre part, par les règles de syntaxe et de grammaire qui ne sont pas respectées lorsque l’émetteur considère que cela ne nuit pas à l’intelligibilité du message. À cause des écarts par rapport à la langue standard, le traitement et l'analyse des messages bruités est toujours un défi pour les tâches du TAL. Par conséquent, réduire les écarts est un défi fondamental que nous surmontons en utilisant l’approche de la normalisation pour la conception d’outils en traitement automatique des SMS.Nous proposons un modèle de normalisation en deux étapes, fondé sur une approche symbolique et statistique. La première étape vise à produire une représentation intermédiaire du message SMS par l’application de grammaires locales, tandis que la deuxième utilise un système de traduction automatique à base de règles pour convertir la représentation intermédiaire vers une forme standard. Le résultat produit par ce modèle a été évalué, par la suite, pour la reconnaissance d'entités nommées au travers d'une série de tests appliqués à l'aide de trois autres systèmes. Les résultats obtenus ont montré que les performances de ces systèmes de reconnaissance d'entités nommées présentent des améliorations significatives lorsqu’ils sont appliqués sur les SMS automatiquement normalisés en comparaison avec le corpus brut et manuellement transcrit.Mots-clés : communication médiée par ordinateur, langage SMS, normalisation des SMS, extraction d’informations

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Communiquer par SMS : Analyse automatique du langage et extraction de l'information véhiculée

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Communiquer par SMS : Analyse automatique du langage et extraction de l'information véhiculée

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses