知识图谱数据管理研究综述
作者:
作者单位:

作者简介:

王鑫(1981-),男,天津人,博士,副教授,CCF高级会员,主要研究领域为知识图谱数据管理,图数据库,大规模知识处理;彭鹏(1987-),男,博士,助理教授,CCF专业会员,主要研究领域为分布式知识图谱管理;邹磊(1981-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为图数据库,知识图谱,大数据系统;冯志勇(1965-),男,博士,教授,博士生导师,CCF杰出会员,主要研究领域为知识工程,服务计算;王朝坤(1976-),男,博士,副教授,博士生导师,CCF专业会员,主要研究领域为图和社交数据管理,大数据系统.

通讯作者:

王鑫,E-mail:wangx@tju.edu.cn

基金项目:

国家自然科学基金(61572353);天津市自然科学基金(17JCYBJC15400)


Research on Knowledge Graph Data Management: A Survey
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61572353); Natural Science Foundation of Tianjin of China (17JCYBJC 15400)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    知识图谱是人工智能的重要基石.各领域大规模知识图谱的构建和发布对知识图谱数据管理提出了新的挑战.以数据模型的结构和操作要素为主线,对目前的知识图谱数据管理理论、方法、技术与系统进行研究综述.首先,介绍知识图谱数据模型,包括RDF图模型和属性图模型,介绍5种知识图谱查询语言,包括SPARQL、Cypher、Gremlin、PGQL和G-CORE;然后,介绍知识图谱存储管理方案,包括基于关系的知识图谱存储管理和原生知识图谱存储管理;其次,探讨知识图谱上的图模式匹配、导航式和分析型3种查询操作.同时,介绍主流的知识图谱数据库管理系统,包括RDF三元组库和原生图数据库,描述目前面向知识图谱的分布式系统与框架,给出知识图谱评测基准.最后,展望知识图谱数据管理的未来研究方向.

    Abstract:

    Knowledge graphs have become the cornerstone of artificial intelligence. The construction and publication of large-scale knowledge graphs in various domains have posed new challenges on the data management of knowledge graphs. In this paper, in accordance with the structural and operational elements of a data model, the current theories, methods, technologies, and systems of knowledge graph data management are surveyed. First, the paper introduces knowledge graph data models, including the RDF graph model and the property graph model, and also introduces 5 knowledge graph query languages, including SPARQL, Cypher, Gremlin, PGQL, and G-CORE. Second, the storage management schemes of knowledge graphs are presented, including relational-based and native approaches. Third, three kinds of query operations are discussed, which are graph pattern matching, navigational, and analytical queries. Fourth, the paper introduces mainstream knowledge graph database management systems, which are categorized into RDF triple stores and native graph databases. Meanwhile, the state-of-the-art distributed systems and frameworks that are used for processing knowledge graphs are also described, and benchmarks are presented for knowledge graphs. Finally, the future research directions of knowledge graph data management are put forward as well.

    参考文献
    相似文献
    引证文献
引用本文

王鑫,邹磊,王朝坤,彭鹏,冯志勇.知识图谱数据管理研究综述.软件学报,2019,30(7):2139-2174

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2018-09-18
  • 最后修改日期:2019-02-20
  • 录用日期:
  • 在线发布日期: 2019-04-11
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号