Documents structures et bases de donnees objet
Auteur / Autrice : | BASILE CHRISTOPHIDES VASSILIS |
Direction : | Michel Scholl |
Type : | Thèse de doctorat |
Discipline(s) : | Sciences appliquées |
Date : | Soutenance en 1996 |
Etablissement(s) : | Paris, CNAM |
Résumé
Il existe un interet croissant pour les documents structures (sgml, html), notamment avec l'emergence du world wide web. Dans la plupart des cas, des documents sont stockes dans des fichiers et les outils d'acces aux documents sont relativement limites (souvent centres sur la recherche textuelle et la navigation). Dans cette these, nous etudions comment le stockage et l'acces aux documents peuvent etre ameliores en utilisant la technologie des bases de donnees. Dans la premiere partie de cette these nous nous concentrons sur la traduction des documents structures en bases de donnees objet et reciproquement. Afin d'effectuer cette traduction nous proposons l'extension du modele cdmg avec de nouvelles primitives de modelisation, pour capturer la structure sequentielle et souvent heterogene des documents. Cette etude a abouti a la realisation de deux traducteurs pour charger et decharger des donnees dans des documents sgml et des bases de donnees o2. Dans la deuxieme partie nous proposons une extension du langage de requetes oql appelee poql (path object query language), avec des predicats textuels sophistiques et des expressions de chemin generalisees. Poql permet de formuler des requetes sur le contenu et la structure des documents meme si une connaissance exacte de la structure des donnees n'est pas disponible. Nous definissons formellement la semantique de pool et nous presentons son implantation au dessus du systeme o2. Finalement, nous etudions certaines techniques d'optimisation interessantes pour des requetes avec des expressions de chemin generalisees