Thèse soutenue

Modélisation de la sémantique des verbes composés chinois de type V-V
FR
Accès à la thèse
Auteur / Autrice : Chao-Jan Chen
Direction : Bernard Victorri
Type : Thèse de doctorat
Discipline(s) : Linguistique théorique, descriptive et automatique
Date : Soutenance en 2005
Etablissement(s) : Paris 7

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Dans cette thèse, nous présentons un modèle de la détermination automatique du sens pour les verbes composés de type V-V en chinois. Nous explorons d'abord deux problèmes principaux pour le traitement sémantique automatique des verbes composés en V-V : 1- le recensement incomplet des sens des caractères dans les dictionnaires et l'effet Gestaltiste dans la composition du sens, 2- les sens des composants influencent celui de la construction et vice-versa. Pour régler ces problèmes nous proposons une approche qui utilise deux notions sémantiques nouvelles : les "sens latents" des caractères et le "patron sémantique de composition" associé à un composé en V-V. Nous calculons des mesures d'association entre caractères et sens pour récupérer les sens des caractères non explicitement enregistrés dans le dictionnaire source (sens latents). En se basant sur ces mesures d'association, on peut également calculer la similarité des patrons sémantiques de deux composés en V-V pour retrouver des synonymes potentiels à un composé donné. Nous avons ainsi réalisé un premier système de recherche automatique de synonymes et un deuxième système de classification sémantique automatique, basé sur le premier. Des évaluations quantitatives montrent que la performance de ces systèmes est très satisfaisante.