基于语义的中文事件触发词抽取联合模型
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金(61472265, 61331011); 软件新技术与产业化协同创新中心资助项目


Semantics-Based Joint Model of Chinese Event Trigger Extraction
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61472265, 61331011); Supporting Program of Collaborative Innovation Center of Novel Software Technology and Industrialization

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    中文事件触发词抽取是一项具有挑战性的任务.针对中文事件触发词抽取中存在的事件论元语义信息难以获取以及部分贫信息事件实例难以抽取的问题,提出了基于语义的中文事件触发词抽取联合学习模型.首先,根据中文句子结构灵活和句法成分多省略的特点,提出了基于模式匹配的核心论元和辅助论元抽取方法,这两类论元可以较好地表示论元语义,进一步提高中文事件触发词抽取性能;其次,根据同一文档中关联事件实例间存在的高度一致性,构造了一个关联事件语义驱动的中文事件触发词识别和类型分配二维联合模型,用于抽取贫信息事件实例.在ACE 2005中文语料上的实验结果表明:与现有最好的中文事件抽取系统相比,所提出方法的性能得到了明显提升.

    Abstract:

    Chinese event trigger extraction is a challenging task. To tackle the difficulties of obtaining the semantic information of event arguments and extracting those context-poor event mentions in Chinese event trigger extraction, this paper proposes a semantics-driven joint model to integrate the components of Chinese event trigger extraction. First, considering the nature of Chinese language (e.g., flexible sentence structure and ellipsis), it provides a pattern-based method to identify core arguments and supplement arguments to better represent argument semantics, and applies the method to improve the performance of Chinese trigger extraction. Secondly, regarding the consistency among relevant event mentions in a document or discourse, it introduces the semantics among relevant event mentions to formulate a 2-dimensional joint model of Chinese trigger detection and type allocation to extract those context-poor event mentions. Finally, it provides experimental results on the ACE 2005 Chinese corpus to show that the presented model significantly outperforms the state-of-the-art system.

    参考文献
    相似文献
    引证文献
引用本文

李培峰,周国栋,朱巧明.基于语义的中文事件触发词抽取联合模型.软件学报,2016,27(2):280-294

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2014-09-19
  • 最后修改日期:2015-03-16
  • 录用日期:
  • 在线发布日期: 2016-02-03
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号