Thèse soutenue

Indexation de texte médicaux par extraction de concepts, et ses utilisations

FR  |  
EN
Auteur / Autrice : Bruno Pouliquen
Direction : Pierre Le Beux
Type : Thèse de doctorat
Discipline(s) : Médecine. Génie biologique et médical
Date : Soutenance en 2002
Etablissement(s) : Rennes 1

Résumé

FR

Nous avons utilisé un lexique créé pour le domaine médical, issu de la base ADM. Nous avons exploité les mots composés et en associations de mots de ce lexique pour optimiser l'indexation d'une phrase en mots de référence. Nous avons pu ainsi indexer des documents médicaux par un ensemble de concepts ; puis nous avons démontré l'utilité d'une telle indexation en développant un système de recherche d'informations et divers articles : extraction de mots-clés, similarité de documents et synthèse automatique de documents. Cette indexation diminue la complexité de la représentation des connaissances contenues dans les documents en langage naturel. Les résultats des évaluations montrent que cette indexation concerne néanmoins la majeure partie de l'information sémantique.