Recherche d'information conceptuelle dans les documents semi-structurés
Auteur / Autrice : | Rami Harrathi |
Direction : | Sylvie Calabretto |
Type : | Thèse de doctorat |
Discipline(s) : | Informatique |
Date : | Soutenance en 2010 |
Etablissement(s) : | Lyon, INSA |
Partenaire(s) de recherche : | Laboratoire : LIRIS - Laboratoire d'Informatique en Image et Systèmes d'information (Rhône ; 2003-....) |
Mots clés
Mots clés contrôlés
Résumé
Avec l'avènement de XML, comme un format reconnu de représentation et d'échange de documents semi-structurés, de nombreuses approches ont été proposées pour la Recherche d'Information dans les documents semi-Structurés (RIS). Ces approches de RIS présentent des limites à différents niveaux : au niveau de l'appariement élément/requête et au niveau du langage de requêtes. En effet, l'appariement élément/requête vise à attribuer des scores de pertinences aux éléments des documents. La majorité des approches actuelles sont fondées sur des systèmes d'indexation basés sur des mots clés où l'élément d'un document et la requête sont représenté par une liste de mots clés pondérés. Cependant, l'indexation par des mots clés est imprécise et ne prend pas en considération les relations sémantiques entre ces mots. D'autre part, la majorité des langages de requêtes proposés pour l'Interrogation des documents semi-structurés sont des langages textuels. Une limite des langages textuels réside dans le fait qu'Il s'agit de langages inadaptés aux utilisateurs non informaticiens. Ces langages nécessitent de la part de l'utilisateur un apprentissage de leur syntaxe formelle. L'utilisation des langages visuels s'avère être une bonne solution pour remédier aux limites des langages textuels. Dans ce cadre, nos contributions portent principalement sur la proposition d'une approche de RI conceptuelle dans les documents semi-structurés et d'un modèle d'interrogation visuelle. Nos contributions ont été évaluées grâce à la campagne d'évaluation IN EX et à travers le développement d'un prototype.