基于时间维层次查询频率的数据仓库粒度模型

点赞:14590 浏览:59846 近期更新时间:2024-03-21 作者:网友分享原创网站原创

【摘 要】数据仓库中的事实数据一般以最小粒度存储.而大量的细粒度数据具有很大的随机性,很少直接进行分析和处理,往往被聚集到一定层次的粗粒度数据.另一方面若采用ROLAP存储数据,则大量的细粒度数据将会影响查询的效率.本文介绍了一种基于时间维层次查询频率的粒度调整模型,它能根据用户在时间维层次的查询频率实现对数据粒度的调整.

【关 键 词】粒度模型;数据仓库;时间维

1前言

将哪些细粒度数据进行转储?将这些数据聚集到哪一层次的粗粒度?是否能实现粒度自动调整?这是建立本系统粒度模型时考虑的问题.

2基本原理

3具体实现

3.1查询频率统计

3.1.1客户端应用程序交互

2.1.2查询频率的存储

3.2数据粒度调整

关于事实表的数据抽取存储过程修改,与iniDimDate类似,也通过增加一个存储过程参数DateLevel来实现,根据该参数的值,对详细数据进行汇总,然后再存入到事实表OutAccFact中.

3.3重新生成多维数据集

在对数据仓库中的维度表DimDate和事实表OutAccFact中的数据进行重新初始化和抽取后,基础数据的粒度已经发生了变化,因此需要在之前建立的商业智能项目中对多维数据集进行重新部署和处理.若进行的数据粒度调整是由细到粗,则基础数据的数量会比之前减少很多,此时重新生成多维数据集的效率也有明显提高.

4结束语

本文介绍了一个基于时间维层次查询频率的自调整粒度模型,该模型能够对事实数据的存储粒度做出调整.由于每个数据仓库系统都会存在时间维度表,而且结构也往往相差不大,因此该粒度模型具有一定的适用性.