主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2022年专刊出版计划 微信服务介绍 最新一期:2021年第4期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
沈志宏,赵子豪,王华进,刘忠新,胡川,周园春.PandaDB:一种异构数据智能融合管理系统.软件学报,2021,32(3):763-780
PandaDB:一种异构数据智能融合管理系统
PandaDB: Intelligent Management System for Heterogeneous Data
投稿时间:2020-07-20  修订日期:2020-09-03
DOI:10.13328/j.cnki.jos.006180
中文关键词:  数据管理系统  异构数据融合  图数据模型  即席查询  人工智能
英文关键词:data management system  heterogeneous data fusion  graph data model  ad-hoc query  AI
基金项目:中国科学院战略性先导科技专项(B类)课题(XDB38030300);国家自然科学基金(61836013);科技部创新方法工作专项(2019IM020100);中国科学院信息化专项课题(XXH13503)
作者单位E-mail
沈志宏 中国科学院 计算机网络信息中心, 北京 100190 bluejoe@cnic.cn 
赵子豪 中国科学院 计算机网络信息中心, 北京 100190
中国科学院大学, 北京 100049 
 
王华进 中国科学院 计算机网络信息中心, 北京 100190  
刘忠新 中国科学院 计算机网络信息中心, 北京 100190  
胡川 中国科学院 计算机网络信息中心, 北京 100190
中国科学院大学, 北京 100049 
 
周园春 中国科学院 计算机网络信息中心, 北京 100190
中国科学院大学, 北京 100049 
 
摘要点击次数: 630
全文下载次数: 588
中文摘要:
      随着大数据应用的不断深入,对大规模结构化/非结构化数据进行融合管理和分析的需求日益凸显.然而,结构化/非结构化数据在存储管理方式、信息获取方式、检索方式方面的差异给融合管理和分析带来了技术挑战.提出了适用于异构数据融合管理和语义计算的属性图扩展模型,并定义了相关属性操作符和查询语法.接着,基于智能属性图模型提出异构数据智能融合管理系统PandaDB,并详细介绍了PandaDB的总体架构、存储机制、查询机制、属性协存和AI算法集成机制.性能测试和应用案例证明,PandaDB的协存机制、分布式架构和语义索引机制对大规模异构数据的即席查询和分析具有较好的性能表现,该系统可实际应用于学术图谱实体消歧与可视化等融合数据管理场景.
英文摘要:
      With the development of big data application, the demand of large-scale structured/unstructured data fusion management and analysis is becoming increasingly prominent. However, the differences in management, process, retrieval of structured/unstructured data brings challenges for fusion management and analysis. This study proposes an extended property graph model for heterogeneous data fusion management and semantic computing, defines related property operators and query syntax. Based on the intelligent property graph model, this study implements PandaDB, an intelligent heterogeneous data fusion management system. This study depicts the architecture, storage mechanism, query mechanism, property co-storage, AI algorithm scheduling, and distributed architecture of PandaDB. Test experiments and cases show that the co-storage mechanism and distributed architecture of PandaDB have good performance acceleration effects, and can be applied in some scenarios of fusion data intelligent management such as academic knowledge graph entity disambiguation.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利