Thèse soutenue

Lexter : un Logiciel d'EXtraction de TERminologie : application à l'acquisition des connaissances à partir de textes

FR  |  
EN
Auteur / Autrice : Didier Bourigault
Direction : Jean-Pierre Desclès
Type : Thèse de doctorat
Discipline(s) : Mathématiques et informatique appliquées aux sciences sociales
Date : Soutenance en 1994
Etablissement(s) : Paris, EHESS

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Nous presentons dans cette these notre travail de conception, de realisation et de validation du logiciel lexter, un logiciel d'aide au depouillement terminologique. Lexter recoit en entree un corpus de textes techniques, en francais, portant sur un domaine quelconque, et il propose en sortie un ensemble de candidats termes, organise sous la forme d'un ''reseau terminologique''. Pour reperer des occurrences de termes complexes dans un texte, lexter met en oeuvre des techniques d'analyse syntaxique locale par patron de surface, qui repondent aux contraintes de robustesse et de precision imposees au logiciel, tout en evitant une analyse syntaxique totale des phrases. Le systeme est dote de procedures d'apprentissage qui lui permettent d'aller chercher lui-meme dans le corpus les informations syntaxiques de souss-categorisation des noms et des adjectifs dont il a besoin pour effectuer un decoupage precis des phrases. L'analyse grammaticale des candidats termes en une tete et une expansion permet d'organiser l'ensemble de ces termes en un ''reseau terminologique''. Les ambiguites de rattachement des adjectifs et des groupes prepositionnels sont resolues grace a une methode de desambiguisation endogene. Nous nous interessons a l'utilisation de la terminologie en general, e t d'un logiicel d'extraction de terminologie en particulier, en intelligence artificielle, pour la realisation de system e a base de connaissances. Dans une tache de modelisation des connaissances, un cogniticien ou un terminologue interprete le reseau teminologie pour reconstituer le systeme notionnel sous-jacent.