基于跨度边界感知的嵌套命名实体识别
CSTR:
作者:
作者单位:

作者简介:

蔡宇翔(2001-), 男, 硕士生, 主要研究领域为事件抽取, 知识图谱, 时序推理. ;骆妲(1999-), 女, 硕士生, 主要研究领域为关系抽取, 知识图谱. ;甘洋镭(1995-), 男, 博士生, 主要研究领域为知识图谱, 推荐系统, 时序推理. ;侯睿(1995-), 男, 博士生, 主要研究领域为信息抽取, 知识图谱. ;刘雪怡(2001-), 女, 硕士生, 主要研究领域为情感计算, 知识图谱. ;刘峤(1974-), 男, 博士, 教授, 博士生导师, CCF专业会员, 主要研究领域为知识图谱构建与应用, 情感分析, 推荐系统. ;石晓军(1982-), 男, 正高级工程师, 主要研究领域为人工智能, 自然语言处理, 物联网, 信息系统架构.

通讯作者:

刘峤, E-mail: qliu@uestc.edu.cn

中图分类号:

TP391

基金项目:

国家自然科学基金(U19B2028, U22B2061); 国家重点研发计划(2022YFB4300603); 四川省科技计划(2023YFG0151)


Nested Named Entity Recognition Based on Span Boundary Perception
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    命名实体识别任务是信息抽取领域中的一个基础任务, 旨在定位句子中实体所在位置的边界, 并对该实体进行分类. 针对现有基于跨度检测的模型存在的嵌套实体边界模糊问题, 提出一种基于跨度边界感知的嵌套命名实体识别模型. 首先, 利用双仿射注意力机制, 捕获词元间的语义相关性, 进而生成跨度语义表示矩阵; 其次, 通过设计一种二阶对角邻域差分算子, 建立跨度语义差分机制, 以提取跨度间的语义差异信息. 此外, 引入一种跨度边界感知机制, 利用滑动窗口的局部特征提取能力, 强化跨度的边界语义差异, 从而准确定位实体跨度位置. 为验证模型的有效性, 在3个基准数据集上进行测试, 包括ACE04、ACE05和Genia数据集. 实验结果表明, 提出的模型在实体识别准确率的表现优于相关工作. 此外, 还设计消融实验和案例分析以验证提出的语义差分机制和跨度边界感知机制的有效性, 为进一步研究命名实体识别问题提供新的思路和实验证据.

    Abstract:

    Named entity recognition (NER) is a fundamental task in information extraction and aims to locate the boundaries of entities in a sentence and classify them. In response to the fuzzy boundaries of nested entities based on span detection models, this study proposes a nested NER model based on span boundary perception. Firstly, it utilizes a bidirectional affine attention mechanism to capture the semantic relevance among word tokens and then generates a span semantic representation matrix. Secondly, it designs a second-order diagonal neighborhood difference operator and establishes a span semantic difference mechanism to extract semantic difference information among spans. Additionally, a span boundary perception mechanism is introduced to employ the local feature extraction ability of sliding windows to enhance the span boundary semantic differences, thereby accurately locating the entity span. The model is validated on three benchmark datasets of ACE04, ACE05, and Genia. The experimental results show that the proposed model outperforms related work in entity recognition accuracy. Additionally, the study conducts ablation experiments and case studies to verify the effectiveness of the proposed semantic difference mechanism and span boundary perception mechanism, providing new ideas and empirical evidence for further research on NER.

    参考文献
    相似文献
    引证文献
引用本文

蔡宇翔,骆妲,甘洋镭,侯睿,刘雪怡,刘峤,石晓军.基于跨度边界感知的嵌套命名实体识别.软件学报,2024,35(11):5149-5162

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-04-04
  • 最后修改日期:2023-05-29
  • 录用日期:
  • 在线发布日期: 2024-01-10
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号