主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2020年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
张延松,张 宇,黄 伟,王 珊,陈 红.分布式聚集函数支持的内存OLAP并行查询处理技术.软件学报,2009,20(zk):165-175
分布式聚集函数支持的内存OLAP并行查询处理技术
Distributed Aggregate Functions Enabled Parallel Main-Memory OLAP Query Processing Technique
投稿时间:2009-05-01  修订日期:2009-07-20
DOI:
中文关键词:  并行查询处理  内存OLAP数据库  延迟聚集计算
英文关键词:parallel query processing  main-memory OLAP DB  lazy aggregate computing
基金项目:Supported by the National High-Tech Research and Development Plan of China under Grant No.2009AA01Z149 (国家高技术研究发展计划(863)); the Union Project with Beijing Municipal Education Commission (BMEC) on Industry-Study-Research of China (北京市教委产学研合作项目); the Renmin
作者单位
张延松 数据工程与知识工程教育部重点实验室(中国人民大学),北京 100872
中国人民大学 信息学院,北京 100872
哈尔滨金融高等专科学校 计算机系,黑龙江 哈尔滨 150030 
张 宇 哈尔滨金融高等专科学校 计算机系,黑龙江 哈尔滨 150030 
黄 伟 数据工程与知识工程教育部重点实验室(中国人民大学),北京 100872
中国人民大学 信息学院,北京 100872 
王 珊 数据工程与知识工程教育部重点实验室(中国人民大学),北京 100872
中国人民大学 信息学院,北京 100872 
陈 红 数据工程与知识工程教育部重点实验室(中国人民大学),北京 100872
中国人民大学 信息学院,北京 100872 
摘要点击次数: 3910
全文下载次数: 4121
中文摘要:
      根据OLAP查询的特点和内存数据库的性能特征提出了由多个内存数据库组成的并行OLAP查询处理系统,将OLAP应用中的多维聚集查询分布到各个计算节点并行进行聚集计算,并将聚集计算的结果进行合并输出.与其他并行处理方法相比,该算法充分利用OLAP DB结构中维表远小于事实表的特性,根据数据库中事实表的数据量和节点的数据处理能力进行水平数据库分片,并根据聚集函数的可分布计算特性提高查询处理的并行度,延迟并行查询处理中的合并过程,充分利用节点的并行处理能力,减少并行查询处理过程中的数据通信量,提高系统并行查询处理性能.该算法易于实现,具有较好的可扩展性和性能,适用于企业级海量数据处理领域的需求.
英文摘要:
      A multi-node parallel main-memory OLAP system is proposed in this paper which is considered by the character of OLAP queries and the performance of main-memory database system. In this system, multi-dimensional OLAP queries with aggregate functions are distributed to each computing node to get aggregate results and final result can be available by merging all the aggregate results from multiple computing nodes. Comparing with other solutions, this system uses horizontal distribution policy to distribute massive data in multi-node with only consideration of memory capacity of computation node. According to feature of distributed aggregate function, system can improve parallel processing capacity by lazy results merging which can reduce the volume of message between nodes, the overall performance of parallel query processing can be improved. This system is easy to deploy, it is also practical with good scalability and performance for the requirements of enterprise massive data processing.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利