Thèse soutenue

La gestion efficace des ressources du web dans les réseaux pair-à-pair structurés

FR  |  
ENFR
Auteur / Autrice : Nicoleta Preda
Direction : Serge AbiteboulIoana Gabriela Manolescu Goujot
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 2008
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)

Mots clés

FR

Résumé

FR

Les entreprises, et plus généralement les communautés concentrées sur un intérêt commun reposent de plus en plus sur le partage d'informations communes et complexes (e. G. , des rapports, des catalogues, des annuaires téléphoniques), par le biais du réseau. Touts ces articles représentent des ressources du Web. D'autre part, l'accès à l'information se fonde aujourd'hui principalement sur des moteurs de recherche basés sur des mots clés - un inconvénient principal, en particulier pour les applications utilisées dans l'industrie. Nous proposons le système KadoP reposant sur la technologie DHT, des techniques d'indexation des documents XML, et des nouveaux algorithmes développés garantissant l'interrogation les ressources partagées du Web par des requêtes complexes, à base de motifs d'arbre. Pour modéliser des données à la fois irrégulières et arborescentes, nous avons suivi le langage XML : la norme du Web, que nous enrichissons afin de tenir compte de ressources plus complexes comme les services Web ou des documents avec des liens entre eux. Notre étude est parmi les premières réalisées sur une plateforme réelle de gestion de données XML au-dessus d'un réseau P2P, par opposition aux simulations. Les solutions que nous avons apportées peuvent bénéficier à n'importe quel outil de gestion des données basé sur un réseau DHT. Par exemple, nous avons introduit une structure distribuée, inspirée des arbres B+, qui adresse le problème des entrées d'index très populaires qui limitent le passage a l'échèle du système. Cette nouvelle structure nous a permis de développer des algorithmes parallèles d'évaluation de requêtes.