Thèse soutenue

Étude d'un analyseur de surface de la langue naturelle : application à l'indexation automatique de textes

FR  |  
EN
Auteur / Autrice : Patrick Palmer
Direction : Yves Chiaramella
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1990
Etablissement(s) : Grenoble 1
Partenaire(s) de recherche : Laboratoire : Institut d'informatique et mathématiques appliquées (Grenoble1989-2006)
Jury : Examinateurs / Examinatrices : Christian Boitet

Résumé

FR

Nous présentons l'étude et la réalisation d'un analyseur de surface de la langue naturelle, dans le contexte des systèmes de recherche d'informations. Cette analyse morpho-syntaxique a pour objet la reconnaissance des concepts véhicules par les syntagmes nominaux (groupes conceptuels) présents dans les textes, en vue de leur indexation automatique. Pour cela nous avons défini: 1) une analyse morphologique utilisant un dictionnaire de racines organise en arbre lexicographique, un ensemble de desinences et des modèles de composition morphologique; 2) une analyse syntaxique partielle basée d'une part, sur un filtrage utilisant une matrice de précédente qui exploite les relations positionnelles de la langue et certaines contraintes grammaticales, et d'autre part sur une resolution des ambiguïtés grammaticales par l'application de schémas prédéfinis; 3) un enrichissement automatique du vocabulaire base sur une interprétation des formes inconnues en fonction de l'orthographe et du contexte immédiat. L'architecture de cet analyseur est présentée en détail, ainsi que des résultats d'expérimentation obtenus pour des textes de différents corpus