Définition de résumés et incertitude dans les grandes bases de données

par Georges Hébrail

Thèse de doctorat en Informatique

Sous la direction de Erol Gelenbe.

Soutenue en 1987

à Paris 11 , en partenariat avec Université de Paris-Sud. Faculté des Sciences d'Orsay (Essonne) (autre partenaire) .

Le président du jury était Erol Gelenbe.

Le jury était composé de Serge Abiteboul, Erol Gelenbe, Paul Caseau, Geneviève Jomier, Nicolas Spyratos, Wojciech Cellary, Michel Léonard.

Les rapporteurs étaient Wojciech Cellary, Michel Léonard.


  • Résumé

    Deux problèmes en apparence distincts sont abordés dans cette étude : la construction de résumés d'une base de données et la modélisation des erreurs contenues dans une base de données. Un modèle permettant de construire des résumés d'une base de données est proposé. Ces résumés sont stockés physiquement dans la base et maintenus à jour automatiquement et à faible coût eu cours de l'évolution du contenu de la base. Ils permettent alors d'interroger la base de données à un niveau synthétique avec un temps de réponse indépendant de la taille de la base. Il est montré que ces résumés trouvent de multiples applications dans le domaine des bases de données interrogation de la base à un niveau synthétique, optimisation des requêtes, confidentialité des données, vérification de contraintes d'intégrité, bases de données distribuées. Un modèle de représentation des erreurs contenues dans une base de données est ensuite proposé. Ce modèle, basé sur une approche probabiliste, permet d'évaluer l'impact des erreurs contenues dans la base sur le résultat es requêtes qui lui sont adressées. Les liens entre ces deux problèmes sont mis en évidence : une même notion est utilisée pour définir les résumés et l'incertitude, et la construction de résumés particuliers est nécessaire pour évaluer l'impact des erreurs sur le résultat d'une requête. L'étude est indépendante du modèle de données utilisé (relationnel, réseau, hiérarchique). Une application des résultats de cette étude dans le cadre du modèle relationnel est cependant présentée. Le domaine privilégié d'application des résultats de cette étude est celui des bases de données contenant un volume important de données.

  • Titre traduit

    Definition of summaries and uncertainty in very large databases


  • Résumé

    Two apparently different problems are addressed in this study: building summaries of a database and modelling errors contained in a database. A model of summaries of a database is proposed. The summaries are physically stored in the database as redundant data and automatically updated when changes occur in the database. The cost of the summaries update is shown to be low. Lt is then possible to extract synthetic information from the database with a response time which is independent of the size of the database. The multiple applications of summaries in a database are also presented: extraction of synthetic information, query optimisation, data security, check of integrity constraints, distributed databases. A model of representation of errors contained in a database is then proposed. The model, based on a probabilistic approach, leads to a computation of the effect of errors on the result of database queries. The links which exist between these two problems are pointed out: a single concept is used both for the definition of the summaries and for the representation of errors, and particular summaries are required to compute the error associated to a query. The study is independent of the data model (relational, network, hierarchical). The results of the study are nevertheless applied to the relational model. The best area for application of the developped concepts is the area of very large databases.

Consulter en bibliothèque

La version de soutenance existe sous forme papier

Informations

  • Détails : 1 vol. (149 p.)
  • Notes : Publication autorisée par le jury
  • Annexes : Bibliogr. p. 134-140

Où se trouve cette thèse\u00a0?

  • Bibliothèque : Université Paris-Sud (Orsay, Essonne). Service Commun de la Documentation. Section Sciences.
  • Disponible pour le PEB
  • Cote : 0g ORSAY(1987)223
  • Bibliothèque : Centre Technique du Livre de l'Enseignement supérieur (Marne-la-Vallée, Seine-et-Marne).
  • Disponible pour le PEB
  • Cote : TH2014-034550
Voir dans le Sudoc, catalogue collectif des bibliothèques de l'enseignement supérieur et de la recherche.