Thèse soutenue

Une approche terminologique pour l'interoperabilite semantique des systemes de bases de donnees heterogenes

FR  |  
EN
Auteur / Autrice : ABDELLATIF SAOUDI
Direction : Henri Briand
Type : Thèse de doctorat
Discipline(s) : Sciences appliquées
Date : Soutenance en 1997
Etablissement(s) : Nantes

Résumé

FR

Le besoin de cooperation ou d'interoperabilite des systemes de gestion de bases de donnees (sgbd) heterogenes, distants et autonomes constitue un defi majeur dans les systemes d'information d'aujourd'hui. Cette these s'inscrit dans cette optique et contribue a l'interoperabilite des sgbd relationnels et orientes objet (oo) dans le cadre d'une architecture federee. Ce travail est centre sur l'etude des deux etapes les plus importantes de la construction d'une base de donnees federee a savoir la traduction et l'integration de schemas. Nous utilisons le modele de donnees fourni par le systeme terminologique back comme une representation intermediaire (modele pivot) dans la federation. La traduction des schemas relationnels se fait selon un processus d'enrichissement semantique qui vise a decouvrir les semantiques disseminees dans les schemas et les donnees afin de les exprimer dans le schema terminologique cible. En effet, nous proposons des algorithmes pour l'inference des dependances d'inclusion et d'exclusion qui constituent le noyau de l'etape de conversion des schemas relationnels. Nous proposons egalement l'utilisation d'un indice statistique qui permet de transformer certaines dependances de recouvrement en dependances d'inclusion. La presence des valeurs nulles dans la base de donnees relationnelle et leur repercussion sur l'enrichissement du schema cible est aussi etudiee. La traduction des schemas oo, quant a elle, se fait a l'aide de regles de transformation syntaxiques vu la convergence des deux modeles de donnees (oo et back). L'integration des schemas terminologiques obtenus est effectuee en identifiant tout d'abord les correspondances structurelles inter-schemas (exprimees sous forme d'assertions). Nous proposons un algorithme pour le controle de coherence des correspondances identifiees et pour l'inference des correspondances manquantes. Ensuite, nous appliquons un ensemble de regles d'integration adapte a chaque type de correspondance. Enfin, l'utilisation d'un systeme terminologique permet de beneficier de ses capacites de classification automatique dans la restructuration du schema federe final (elimination des redondances).