用于表格事实检测的图神经网络模型
CSTR:
作者:
作者单位:

作者简介:

邓哲也(1997-),男,学士,主要研究领域为自然语言处理,数据挖掘.
张铭(1966-),女,博士,教授,博士生导师,CCF高级会员,主要研究领域为信息检索,推荐系统,数据挖掘,机器学习.

通讯作者:

张铭,E-mail:mzhang@net.pku.edu.cn

中图分类号:

基金项目:

国家重点研发计划(2018AAA0101900,2018AAA0101902);国家自然科学基金(91646202,61772039)


Graph Neural Networks for Table-based Fact Verification
Author:
Affiliation:

Fund Project:

Key Research and Development Program of China (2018AAA0101900, 2018AAA0101902); National Natural Science Foundation of China (91646202, 61772039)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在自然语言理解和语义表征的研究中,往往需要验证一句文本陈述是否基于给定的事实证据,这就是事实检测任务.现有的研究主要局限于处理文本事实验证,而结构化证据下的验证还有待探索,比如基于表格等形式的事实验证.TabFact作为最新的基于表格的事实验证数据集,基线方法并没有很好地利用表格的结构性特征.结合表格的结构特征,设计了以行、单元格为单位的基于图神经网络的事实验证模型Row-GVM和Cell-GVM,比基线模型的准确率分别提高了2.62%和2.77%.实验结果表明,这两种利用了表格特征的方法确实是有效的.

    Abstract:

    In the study of natural language understanding and semantic representation, the fact verification task is very important to verify whether a textual statement is based on given factual evidence. Existing research is mainly limited to dealing with textual fact verification, while verification under structured evidence has yet to be explored, such as fact verification based on forms. TabFact is the latest table-based fact verification data set, but the baseline methods do not make good use of the structural characteristics of the table. This study takes advantage of the structural characteristics of the table and designs two models, Row-GVM (Row-level GNN-based verification model) and Cell-GVM (cell-level GNN-based verification model). They have achieved performances of 2.62% and 2.77% higher than the baseline model respectively. The results prove that these two methods using table features are indeed effective.

    参考文献
    相似文献
    引证文献
引用本文

邓哲也,张铭.用于表格事实检测的图神经网络模型.软件学报,2021,32(3):753-762

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-08-23
  • 最后修改日期:2020-09-03
  • 录用日期:
  • 在线发布日期: 2021-01-21
  • 出版日期: 2021-03-06
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号