Thèse soutenue

Définition de résumés et incertitude dans les grandes bases de données

FR  |  
EN
Auteur / Autrice : Georges Hébrail
Direction : Erol Gelenbe
Type : Thèse de doctorat
Discipline(s) : Informatique
Date : Soutenance en 1987
Etablissement(s) : Paris 11
Partenaire(s) de recherche : autre partenaire : Université de Paris-Sud. Faculté des sciences d'Orsay (Essonne)
Jury : Président / Présidente : Erol Gelenbe
Examinateurs / Examinatrices : Serge Abiteboul, Erol Gelenbe, Paul Caseau, Geneviève Jomier, Nicolas Spyratos, Wojciech Cellary, Michel Léonard
Rapporteurs / Rapporteuses : Wojciech Cellary, Michel Léonard

Mots clés

FR

Mots clés contrôlés

Mots clés libres

Résumé

FR  |  
EN

Deux problèmes en apparence distincts sont abordés dans cette étude : la construction de résumés d'une base de données et la modélisation des erreurs contenues dans une base de données. Un modèle permettant de construire des résumés d'une base de données est proposé. Ces résumés sont stockés physiquement dans la base et maintenus à jour automatiquement et à faible coût eu cours de l'évolution du contenu de la base. Ils permettent alors d'interroger la base de données à un niveau synthétique avec un temps de réponse indépendant de la taille de la base. Il est montré que ces résumés trouvent de multiples applications dans le domaine des bases de données interrogation de la base à un niveau synthétique, optimisation des requêtes, confidentialité des données, vérification de contraintes d'intégrité, bases de données distribuées. Un modèle de représentation des erreurs contenues dans une base de données est ensuite proposé. Ce modèle, basé sur une approche probabiliste, permet d'évaluer l'impact des erreurs contenues dans la base sur le résultat es requêtes qui lui sont adressées. Les liens entre ces deux problèmes sont mis en évidence : une même notion est utilisée pour définir les résumés et l'incertitude, et la construction de résumés particuliers est nécessaire pour évaluer l'impact des erreurs sur le résultat d'une requête. L'étude est indépendante du modèle de données utilisé (relationnel, réseau, hiérarchique). Une application des résultats de cette étude dans le cadre du modèle relationnel est cependant présentée. Le domaine privilégié d'application des résultats de cette étude est celui des bases de données contenant un volume important de données.