Thèse soutenue

Segmentation et analyse morphologique automatiques du japonais en univers ouvert

FR  |  
EN
Auteur / Autrice : Nadine Rayon
Direction : Patrice Pognan
Type : Thèse de doctorat
Discipline(s) : Traitement automatique des langues
Date : Soutenance en 2003
Etablissement(s) : Paris, INALCO

Résumé

FR  |  
EN

La présente thèse propose une analyse morphologique automatique des séquences de kanji dans des textes japonais, généraux ou spécialisés. Cette analyse s'appuie sur les particularités graphémiques, morphologiques et syntaxiques du japonais. Elle n'emploie aucun dictionnaire, est basée sur la reconnaissance des contextes immédiats des séquences de kanji et produit un étiquetage des unités linguistiques reconnues et une segmentation du texte. La première partie décrit le système d'écriture japonais et son codage informatique. La deuxième partie décrit les parties du discours japonais, en particulier les verbes, qualificatifs, particules et suffixes flexionnels, leurs caractéristiques morphosyntaxiques étant essentielles pour l'analyse morphologique. La troisième partie décrit le module d'analyse: identification et formalisation des données pour l'analyse, algorithme de l'analyse et des pré-traitements, formalisation de modèles d'objets pour la manipulation informatique du japonais.