一种准确而高效的领域知识图谱构建方法
作者:
作者单位:

作者简介:

杨玉基(1994-),男,河南巩义人,硕士,主要研究领域为知识图谱,数据挖掘;许斌(1973-),男,博士,副教授,博士生导师,CCF高级会员,主要研究领域为知识图谱,数据挖掘,服务计算;胡家威(1991-),男,工程师,主要研究领域为人工智能应用;仝美涵(1995-),女,博士,主要研究领域为知识工程,信息抽取;张鹏(1979-),男,工程师,CCF专业会员,主要研究领域为知识图谱构建和应用,文本语义挖掘;郑莉(1963-),女,教授,CCF专业会员,主要研究领域为计算机应用.

通讯作者:

杨玉基,E-mail:yangyujiyyj@gmail.com

中图分类号:

基金项目:

国家高技术研究发展计划(863)(2015AA015401)


Accurate and Efficient Method for Constructing Domain Knowledge Graph
Author:
Affiliation:

Fund Project:

National High Technology Research and Development Plan of China (2015AA015401)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    作为语义网的数据支撑,知识图谱在知识问答、语义搜索等领域起着至关重要的作用,一直以来也是研究领域和工程领域的一个热点问题,但是,构建一个质量较高、规模较大的知识图谱往往需要花费巨大的人力和时间成本.如何平衡准确率和效率、快速地构建出一个高质量的领域知识图谱,是知识工程领域的一个重要挑战.对领域知识图谱构建方法进行了系统研究,提出了一种准确、高效的领域知识图谱构建方法——"四步法",将该方法应用到中国基础教育九门学科知识图谱的构建中,在较短时间内构建出了准确率较高的学科知识图谱,证明了该方法构建领域知识图谱的有效性.以地理学科知识图谱为例,使用"四步法"共得到67万个实例、1 421万条三元组,其中,标注数据的学科知识覆盖率和知识准确率均在99%以上.

    Abstract:

    In supporting semantic Web, knowledge graphs have played a vital role in many areas such as knowledge QA and semantic search. Therefore, they have become a hot topic in the field of research and engineering. However, it is often costly to build a large-scale knowledge graph with high accuracy. How to balance the accuracy and efficiency, and quickly build a high-quality domain knowledge graph, is a big challenge in the field of knowledge engineering. This paper engages a systematic study on the construction of domain knowledge graphs, and puts forward an accurate and efficient method of constructing domain knowledge graphs as "four-steps". This method has been applied to the construction of knowledge graphs of nine subjects in the k12 education of China, and the nine subject knowledge graphs have been developed with high accuracy, which demonstrates that the new method is effective. For example, the geographical knowledge graph, which is constructed using the "four-steps" method, has 670 thousand instances and 14.21 million triples. And as part of it, the annotation data's knowledge coverage and knowledge accuracy are both above 99%.

    参考文献
    相似文献
    引证文献
引用本文

杨玉基,许斌,胡家威,仝美涵,张鹏,郑莉.一种准确而高效的领域知识图谱构建方法.软件学报,2018,29(10):2931-2947

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2017-07-22
  • 最后修改日期:2017-11-08
  • 录用日期:
  • 在线发布日期: 2018-02-08
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号