Thèse soutenue

Recherche d'information conceptuelle dans les documents semi-structurés

FR  |  
EN
Auteur / Autrice : Rami Harrathi
Direction : Sylvie Calabretto
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2010
Etablissement(s) : Lyon, INSA
Partenaire(s) de recherche : Laboratoire : LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Rhône ; 2003-....)

Mots clés

FR

Mots clés contrôlés

Résumé

FR  |  
EN

Avec l'avènement de XML, comme un format reconnu de représentation et d'échange de documents semi-structurés, de nombreuses approches ont été proposées pour la Recherche d'Information dans les documents semi-Structurés (RIS). Ces approches de RIS présentent des limites à différents niveaux : au niveau de l'appariement élément/requête et au niveau du langage de requêtes. En effet, l'appariement élément/requête vise à attribuer des scores de pertinences aux éléments des documents. La majorité des approches actuelles sont fondées sur des systèmes d'indexation basés sur des mots clés où l'élément d'un document et la requête sont représenté par une liste de mots clés pondérés. Cependant, l'indexation par des mots clés est imprécise et ne prend pas en considération les relations sémantiques entre ces mots. D'autre part, la majorité des langages de requêtes proposés pour l'Interrogation des documents semi-structurés sont des langages textuels. Une limite des langages textuels réside dans le fait qu'Il s'agit de langages inadaptés aux utilisateurs non informaticiens. Ces langages nécessitent de la part de l'utilisateur un apprentissage de leur syntaxe formelle. L'utilisation des langages visuels s'avère être une bonne solution pour remédier aux limites des langages textuels. Dans ce cadre, nos contributions portent principalement sur la proposition d'une approche de RI conceptuelle dans les documents semi-structurés et d'un modèle d'interrogation visuelle. Nos contributions ont été évaluées grâce à la campagne d'évaluation IN EX et à travers le développement d'un prototype.