基于时序分区的时态索引与查询
作者:
作者单位:

作者简介:

杨佐希(1995-),男,广东人,硕士,主要研究领域为时空数据库,社会与协同计算,数据挖掘.
汤娜(1975-),女,博士,副教授,CCF专业会员,主要研究领域为时空数据库.
汤庸(1964-),男,博士,教授,博士生导师,CCF杰出会员,主要研究领域为时空数据库,社会与协同计算,数据挖掘.
潘明明(1994-),女,硕士,主要研究领域为时空数据库,XML数据库.
叶小平(1955-),男,博士,教授,博士生导师,主要研究领域为时空数据库,XML数据库技术.
李丁丁(1982-),男,博士,副教授,CCF专业会员,主要研究领域为计算机系统结构.

通讯作者:

汤庸,E-mail:ytang@m.scnu.edu.cn

中图分类号:

基金项目:

国家自然科学基金(61772211,U181120009);广州市产学研协同创新重大专项(201704020203);广东省应用型科技研发专项(2016B010124008)


Temporal Index and Query Based on Timing Partition
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61772211, U181120009); Major Project of Industry-university-research Collaborative Innovation of Guangzhou Municipality (201704020203); Special Fund for Applied Technology Research and Development of Guangdong Province (2016B010124008)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    时态索引作为一种高效管理和检索时态数据的有效手段,一直是时态数据领域的研究热点.提出了一种基于时序分区的时态索引技术TPindex.首先将海量时态数据的时态属性映射到二维平面上,对平面上的“有效时间”点进行采样处理,通过使用自上而下,自左而右的时序分区方法将平面划分成若干个均匀的区域.其次,使用基于拟序关系的线序划分算法对每个分区中的数据构建数据结构,并建立基于“有效时间戳”的全区索引,实现“一次一集合”的数据查询操作.再次,还提出了使用分文件存储线序索引的模式将分区线序索引磁盘化,同时可以结合多线程技术并行处理数据,充分利用现代化硬件资源以满足海量数据下的高性能需求,提高索引性能.另一方面,我们还研究了海量时态数据下TPindex的增量式更新操作.最后,设计相应的仿真实验,通过与现有的代表性工作进行对比评估,验证了所提出方法的有效性和实用价值.

    Abstract:

    Temporal index is one of key methods for temporal data managements and retrieval, which has been a hotspot in the field of temporal data. This paper presents a temporal index technique TPindex which is based on a temporal timing partition method. Firstly, the temporal attributes of massive amount of temporal data is mapped to a two-dimensional plane and the “Valid Time” points in this plane are sampled for timing partition. A “form up to down and form left to right” timing partition method is used to divide the plane into several balanced temporal areas and whole-partition index would be established at the same time. Once the steps above are completed, temporal data can be dynamically indexed by its querying schema of “one time, one set”. Secondly, the TPindex would build data structures through using “linear order partition” algorithm based on quasi-order relation for the data in each temporal area. Besides, a “Separated Files Model Index” based on disks and multi-threading parallel process technique that can be combined are proposed to make full use of modern hardware resources to meet the high performance needs under high-volume data, leading to better performance with index. On the other hand, the incremental updating algorithm was also studied. Finally, the corresponding simulation experiments are designed to compare with the current representative work to verify the feasibility and validity of the proposed algorithm.

    参考文献
    相似文献
    引证文献
引用本文

杨佐希,汤娜,汤庸,潘明明,李丁丁,叶小平.基于时序分区的时态索引与查询.软件学报,2020,31(11):3519-3539

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-09-05
  • 最后修改日期:2019-01-07
  • 录用日期:
  • 在线发布日期: 2020-11-07
  • 出版日期: 2020-11-06
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号