Algorithms for XML stream processing : massive data, external memory and scalable performance

Muath Alrammal

Le moteur de recherche
des thèses françaises

Désactiver l'aide à la saisie

Algorithms for XML stream processing : massive data, external memory and scalable performance

FR |

EN

Auteur / Autrice :	Muath Alrammal
Direction :	Gaétan Hains
Type :	Thèse de doctorat
Discipline(s) :	Informatique
Date :	Soutenance le 16/05/2011
Etablissement(s) :	Paris Est
Ecole(s) doctorale(s) :	École doctorale Mathématiques, Sciences et Technologies de l'Information et de la Communication (Champs-sur-Marne, Seine-et-Marne ; 2010-....)
Partenaire(s) de recherche :	Laboratoire : Laboratoire d'algorithmique, complexité et logique (Créteil)
Jury :	Président / Présidente : Véronique Benzaken
	Examinateurs / Examinatrices : Gaétan Hains, Mohamed Zergaoui, Mostafa Bamha
	Rapporteurs / Rapporteuses : Rada Chirkova

Mots clés

FR |

EN

Mots clés contrôlés

Algorithmes

XPath (langage de programmation)

XML (langage de balisage)

Streaming (télécommunications)

Mots clés libres

Traitement de flux

Données XML

Requêtes XPath

Estimation de sélectivité

Modèle de performance

Optimisation de requêtes

Résumé

FR |

EN

Plusieurs applications modernes nécessitent un traitement de flux massifs de données XML, cela crée de défis techniques. Parmi ces derniers, il y a la conception et la mise en ouvre d'outils pour optimiser le traitement des requêtes XPath et fournir une estimation précise des coûts de ces requêtes traitées sur un flux massif de données XML. Dans cette thèse, nous proposons un nouveau modèle de prédiction de performance qui estime a priori le coût (en termes d'espace utilisé et de temps écoulé) pour les requêtes structurelles de Forward XPath. Ce faisant, nous réalisons une étude expérimentale pour confirmer la relation linéaire entre le traitement de flux, et les ressources d'accès aux données. Par conséquent, nous présentons un modèle mathématique (fonctions de régression linéaire) pour prévoir le coût d'une requête XPath donnée. En outre, nous présentons une technique nouvelle d'estimation de sélectivité. Elle se compose de deux éléments. Le premier est le résumé path tree: une présentation concise et précise de la structure d'un document XML. Le second est l'algorithme d'estimation de sélectivité: un algorithme efficace de flux pour traverser le synopsis path tree pour estimer les valeurs des paramètres de coût. Ces paramètres sont utilisés par le modèle mathématique pour déterminer le coût d'une requête XPath donnée. Nous comparons les performances de notre modèle avec les approches existantes. De plus, nous présentons un cas d'utilisation d'un système en ligne appelé ''online stream-querying system''. Le système utilise notre modèle de prédiction de performance pour estimer le coût (en termes de temps / mémoire) d'une requête XPath donnée. En outre, il fournit une réponse précise à l'auteur de la requête. Ce cas d'utilisation illustre les avantages pratiques de gestion de performance avec nos techniques

Le moteur de recherche
des thèses françaises

Les thèses

Les personnes
liées aux thèses

Algorithms for XML stream processing : massive data, external memory and scalable performance

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche des thèses françaises

Les thèses

Les personnes liées aux thèses

Recherche Avancée

Algorithms for XML stream processing : massive data, external memory and scalable performance

Mots clés

Mots clés contrôlés

Mots clés libres

Résumé

Le moteur de recherche
des thèses françaises

Les personnes
liées aux thèses