Étude d'un analyseur de surface de la langue naturelle : application à l'indexation automatique de textes
Auteur / Autrice : | Patrick Palmer |
Direction : | Yves Chiaramella |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 1990 |
Etablissement(s) : | Université Joseph Fourier (Grenoble ; 1971-2015) |
Partenaire(s) de recherche : | Laboratoire : Institut d'informatique et mathématiques appliquées (Grenoble ; 1989-2006) |
Jury : | Examinateurs / Examinatrices : Christian Boitet |
Résumé
Nous présentons l'étude et la réalisation d'un analyseur de surface de la langue naturelle, dans le contexte des systèmes de recherche d'informations. Cette analyse morpho-syntaxique a pour objet la reconnaissance des concepts véhicules par les syntagmes nominaux (groupes conceptuels) présents dans les textes, en vue de leur indexation automatique. Pour cela nous avons défini: 1) une analyse morphologique utilisant un dictionnaire de racines organise en arbre lexicographique, un ensemble de desinences et des modèles de composition morphologique; 2) une analyse syntaxique partielle basée d'une part, sur un filtrage utilisant une matrice de précédente qui exploite les relations positionnelles de la langue et certaines contraintes grammaticales, et d'autre part sur une resolution des ambiguïtés grammaticales par l'application de schémas prédéfinis; 3) un enrichissement automatique du vocabulaire base sur une interprétation des formes inconnues en fonction de l'orthographe et du contexte immédiat. L'architecture de cet analyseur est présentée en détail, ainsi que des résultats d'expérimentation obtenus pour des textes de différents corpus