Auteur / Autrice : | Chao-Jan Chen |
Direction : | Bernard Victorri |
Type : | Thèse de doctorat |
Discipline(s) : | Linguistique théorique, descriptive et automatique |
Date : | Soutenance en 2005 |
Etablissement(s) : | Paris 7 |
Mots clés
Mots clés contrôlés
Résumé
Dans cette thèse, nous présentons un modèle de la détermination automatique du sens pour les verbes composés de type V-V en chinois. Nous explorons d'abord deux problèmes principaux pour le traitement sémantique automatique des verbes composés en V-V : 1- le recensement incomplet des sens des caractères dans les dictionnaires et l'effet Gestaltiste dans la composition du sens, 2- les sens des composants influencent celui de la construction et vice-versa. Pour régler ces problèmes nous proposons une approche qui utilise deux notions sémantiques nouvelles : les "sens latents" des caractères et le "patron sémantique de composition" associé à un composé en V-V. Nous calculons des mesures d'association entre caractères et sens pour récupérer les sens des caractères non explicitement enregistrés dans le dictionnaire source (sens latents). En se basant sur ces mesures d'association, on peut également calculer la similarité des patrons sémantiques de deux composés en V-V pour retrouver des synonymes potentiels à un composé donné. Nous avons ainsi réalisé un premier système de recherche automatique de synonymes et un deuxième système de classification sémantique automatique, basé sur le premier. Des évaluations quantitatives montrent que la performance de ces systèmes est très satisfaisante.