基于知识增强的开放域多轮对话模型
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

TP18

基金项目:

国家自然科学基金(62162031,62076175,61876074);江西省自然科学基金(20224ACB202010);江西省创新创业高层次人才计划(jxsq2018102035)


Open-domain Multi-turn Dialogue Model Based on Knowledge Enhancement
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    如何减轻安全回复和重复回复一直是开放域多轮对话模型的两大挑战性难题. 然而, 现有开放域对话模型往往忽略了对话目标的引导性作用, 以及如何在对话历史和对话目标中引入和选择更精确的知识信息. 鉴于此, 提出基于知识增强的多轮对话模型. 所提模型首先将对话历史中实词进行义原及领域词替换, 达到消除歧义和丰富对话文本表示的效果. 然后将经过知识增强后的对话历史、扩充的三元组世界知识、知识管理和知识拷贝加以集成, 以融合知识、词汇、对话历史和对话目标多种信息, 生成多样性回复. 通过两个国际基准开放域汉语对话语料库上的实验结果及可视化验证所提模型同时在自动评测和人工评测上的有效性.

    Abstract:

    How to reduce secure and repeated replies is a challenging problem in the open-domain multi-turn dialogue model. However, the existing open-domain dialogue models often ignore the guiding role of dialogue objectives and how to introduce and select more accurate knowledge information in dialogue history and dialogue objectives. Based on these phenomena, this study proposes a multi-turn dialogue model based on knowledge enhancement. Firstly, the model replaces the notional words in the dialogue history with semaphores and domain words, so as to eliminate ambiguity and enrich the dialogue text representation. Then, the knowledge-enhanced dialogue history and expanded triplet world knowledge are effectively integrated into the knowledge management and knowledge copy modules, so as to integrate information of knowledge, vocabularies, dialogue history, and dialogue objectives and generate diverse responses. The experimental results and visualization on two international benchmark open-domain Chinese dialogue corpora verify the effectiveness of the proposed model in both automatic evaluation and human judgment.

    参考文献
    相似文献
    引证文献
引用本文

徐凡,徐健明,马勇,王明文,周国栋.基于知识增强的开放域多轮对话模型.软件学报,2024,35(2):758-772

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-06-25
  • 最后修改日期:2022-08-19
  • 录用日期:
  • 在线发布日期: 2023-05-24
  • 出版日期: 2024-02-06
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号