面向关系型数据与知识图谱的数据集成技术综述
作者:
作者单位:

作者简介:

高云君(1977-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为数据库,大数据管理与分析,DB与AI融合;葛丛丛(1995-),女,博士,主要研究领域为数据集成,数据治理;郭宇翔(1998-),男,博士生,主要研究领域为数据集成,数据准备;陈璐(1989-),女,博士,教授,博士生导师,CCF专业会员,主要研究领域为数据库,大数据处理,度量空间数据管理.

通讯作者:

高云君,gaoyj@zju.edu.cn

中图分类号:

基金项目:

国家重点研发计划(2021YFC3300300,2021YFC3300303);国家自然科学基金(62025206,61972338,62102351)


Survey on Data Integration Technologies for Relational Data and Knowledge Graph
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    目前,各个国家和地区均已将大数据视为重要的战略资源.然而,大数据时代普遍存在数据流通困难、数据监管不足等问题,致使数据孤岛现象严重,数据质量低下,数据要素潜能难以释放.这驱使研究人员探索数据集成技术,以打破数据壁垒、实现信息共享、提升数据质量,进而激活数据要素潜能.关系型数据和知识图谱作为两种至关重要的数据组织与存储形式,在现实生活中应用广泛.为此,聚焦关系型数据和知识图谱,归纳总结并分析实体解析、数据融合、数据清洗3方面的数据集成关键技术,最后展望未来研究方向与趋势.

    Abstract:

    Recently, big data is considered a critical strategic resource by many countries and regions. However, difficult data circulation and insufficient data regulation commonly exist in the big data era, thereby leading to the serious phenomenon of data silos, poor data quality, and difficulty in unleashing the potential of data elements. This provokes researchers to explore data integration techniques for breaking data barriers, enabling data sharing, improving data quality, and activating the potential of data elements. Relational data and knowledge graphs, as two significant forms of data organization and storage, have been widely applied in real life. To this end, this study focuses on relational data and knowledge graphs to summarize and analyze the key technologies of data integration, including entity resolution, data fusion, and data cleaning. Finally, it prospects future research directions.

    参考文献
    相似文献
    引证文献
引用本文

高云君,葛丛丛,郭宇翔,陈璐.面向关系型数据与知识图谱的数据集成技术综述.软件学报,2023,34(5):2365-2391

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-06-21
  • 最后修改日期:2022-08-18
  • 录用日期:
  • 在线发布日期: 2022-12-30
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号