Bordures : de la sélection de vues dans un cube de données au calcul parallèle de fréquents maximaux
| Auteur / Autrice : | Radu-Ionel Tofan |
| Direction : | Nicolas Hanusse, Sofian Maabout |
| Type : | Thèse de doctorat |
| Discipline(s) : | Informatique |
| Date : | Soutenance le 28/09/2010 |
| Etablissement(s) : | Bordeaux 1 |
| Ecole(s) doctorale(s) : | École doctorale Mathématiques et informatique (Talence, Gironde ; 1991-....) |
| Partenaire(s) de recherche : | Laboratoire : Laboratoire bordelais de recherche en informatique |
| Jury : | Président / Présidente : Guy Melançon |
| Examinateurs / Examinatrices : Véronique Benzaken, Cyril Gavoille, Noël Novelli | |
| Rapporteurs / Rapporteuses : Rosine Cicchetti, Anne Laurent | |
| DOI : | 10.70675/6f96461az9d90z488ez9f7ez6bdb80122621 |
Résumé
La matérialisation de vues est une technique efficace d'optimisation de requêtes. Dans cette thèse, nous proposons une nouvelle vision ''orientée utilisateur'' de solutions pour le problème de sélection de vues à matérialiser dans les entrepôt de données : l'utilisateur fixe le temps de réponse maximal. Dans cette vision nous proposons des algorithmes qui s'avèrent compétitifs avec les algorithmes de type ''orienté système'', dans lesquels les ressources, comme la mémoire, sont considérées comme la contrainte forte. L'approche ''orientée utilisateur'' est étudiée avec un contexte dynamique de système d'optimisation de requêtes. Nous analysons la stabilité de ce système par rapport à la dynamique de la charge de requêtes et des données qui sont insérées ou supprimées. Le concept clé de nos algorithmes de sélection de vues à matérialiser est la bordure. Ce concept a été très étudié en fouille de données dans le cadre du calcul des fréquents maximaux. Plusieurs algorithmes séquentiels ont été proposés pour résoudre ce problème. Nous proposons un nouvel algorithme séquentiel MineWithRounds, facilement parallélisable, qui se distingue des autres propositions par une garantie théorique d'accélération dans le cas de machines à plusieurs unités de calcul et à mémoire partagée.