| 【论文摘要】 |
数据仓库是一个面向主题的、集成的、不可更新的且随时间不断变化的数据集合,用来支持管理人员的决策。它维护着海量的数据,所支持的查询形式复杂,通常需要访问大量数据,而一个决策支持系统必须对查询做出快速响应。因此如何高效的管理如此之多的数据是数据仓库面临的其中一个难题,而物化视图是解决这个问题的重要手段,但是它需要额外的系统空间来存储,并且需要牺牲系统的代价来维护(maintenance),因此,选择哪些视图加以物化是一个重要的研究主题。
本文的研究内容就是分别从静态和动态两方面,考虑物化视图的选择问题。物化视图的静态选择算法是基于查询分布概率已经由用户提供,或这些查询在综合数据上是均匀分布的前提下。本文在第三章中首先介绍了三种常用的物化视图静态选择算法,并分析了它们的优缺点;其次提出了优化的代价模型,其中不仅考虑了查询代价,而且还考虑了更新代价;最后在改进的代价模型基础上,提出了物化视图的遗传选择算法(Genetic Algorithm on Materialized View,简称GAMV),该算法属于静态选择算法。
由于在实际应用中,用户查询均匀分布的假设常常不能成立,由用户来提供查... |