Thèse soutenue

Cadre formel pour l'appariement de schémas XML pour l'intégration de données

FR
Auteur / Autrice : Amar Zerdazi
Direction : Catherine PelachaudMyriam Lamolle
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2007
Etablissement(s) : Paris 8

Mots clés

FR

Résumé

FR  |  
EN

Aujourd'hui, de nombreux travaux de recherche sur l'intégration de données hétérogènes offrent des systèmes d'intégration basés sur des architectures interopérables prenant en compte la diversité de l'autonomie et de l'hétérogénéité des sources de données. De plus, ce processus d'intégration doit permettre de traiter des sources qui ont des modèles de données et / ou des schémas différents. Dans cette thèse, nous nous intéressons à la problématique de l'intégration liée aux systèmes de médiation où les besoins des usagers sont représentés par un schéma de médiation créé à partir des schémas de données sources ou réalisés manuellement par des experts du domaine. Nous proposons l'utilisation d'un processus semi-automatique qui établit les correspondances sémantiques entre deux schémas hétérogènes. À partir de telles correspondances, des programmes de transformation peuvent être automatiquement générés. Concrètement, notre travail consiste à définir une représentation logique XML lors d'une phase de pré-intégration traduisant des schémas sources à partir des informations structurelles et sémantiques contenues dans ces derniers. Nous obtenons des schémas XML étendus appelés EXS. À partir de là, la problématique d'appariement se réduit à la mise en correspondance de plusieurs schémas EXS. À cet égard, nous proposons un cadre formel pour l'ensemble du processus d'appariement de ces schémas XML. Dans un premier temps, nous adoptons le formalisme des graphes (nœuds, arcs, contraintes). Puis nous appliquons des méthodes de recherche d'équivalence et de similitude entre les schémas prenant en compte notamment trois sortes de contextes d'apparition de nœud, à savoir racine, intermédiaire et feuille. Une fois établies, ces similarités permettent de construire les règles de correspondance qui serviront à produire automatiquement la description de la transformation sous la forme de feuilles de style XSL.