Thèse soutenue

Une plate-forme informatique de l'Exploration Contextuelle : cmodélisation, architecture et réalisation (ContextO) : application au filtrage sémantique de textes

FR  |  
EN
Auteur / Autrice : Gustavo Crispino
Direction : Jean-Pierre Desclès
Type : Thèse de doctorat
Discipline(s) : Linguistique
Date : Soutenance en 2003
Etablissement(s) : Paris 4

Résumé

FR  |  
EN

Ce travail s'inscrit dans le cadre du projet FilText, de l'équipe LaLICC, orienté vers la construction de systèmes automatiques de filtrage d'information, à l'aide de critères sémantiques, qui donnent à un lecteur la possibilité de définir un profil de filtrage en fonction de ses objectifs. Cette thèse décrit notre travail de modélisation et de réalisation de la plate-forme informatique ContextO. Nous proposons une représentation de la structure textuelle et un langage de spécification, LangTex, pour manipuler cette structure et pour exprimer des connaissances linguistiques. La première partie de la thèse expose les fondements du projet FilText et la méthode d'exploration contextuelle qui constitue sa justification théorique. La deuxième partie est consacrée à la présentation de l'architecture de ContextO et à la description de ses composants. La troisième partie présente LangTex, un langage formel structuré en deux couches : CBase, assurant les fonctionnalités de base pour naviguer dans la structure textuelle, et CRegEC, pour permettre la formulation de règles d'exploration contextuelle. Cette approche modulaire facilite l'extensibilité de chaque couche ainsi que la possibilité d'ajouter des nouvelles couches spécialisées dans une catégorie de traitements propres à des tâches spécifiques.