文本风格迁移研究综述
作者:
作者单位:

作者简介:

陈可佳(1980-),女,博士,副教授,CCF专业会员,主要研究领域为机器学习,图数据挖掘;费子阳(1996-),男,硕士生,主要研究领域为文本风格迁移,自然语言处理;陈景强(1983-),男,博士,副教授,主要研究领域为自动摘要,自然语言处理;杨子农(1997-),男,硕士生,主要研究领域为机器翻译,自然语言处理

通讯作者:

陈可佳,E-mail:chenkj@njupt.edu.cn

中图分类号:

基金项目:

国家自然科学基金(61772284,61876091)


Survey on Text Style Transfer Research
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    文本风格迁移是近年来自然语言处理领域的热点问题之一,旨在保留文本内容的基础上通过编辑或生成的方式更改文本的特定风格或属性(如情感、时态和性别等).旨在梳理已有的技术,以推进该方向的研究.首先,给出文本风格迁移问题的定义及其面临的挑战;然后,对已有方法进行分类综述,重点介绍基于无监督学习的文本风格迁移方法并将其进一步分为隐式和显式两类方法,对各类方法在实现机制、优势、局限性和性能等方面进行分析和比较;同时,还通过实验比较了几种代表性方法在风格迁移准确率、文本内容保留和困惑度等自动化评价指标上的性能;最后,对文本风格迁移研究进行总结和展望.

    Abstract:

    Text style transfer is one of the hot issues in the field of natural language processing in recent years. It aims to transfer the specific style or attributes of the text (such as emotion, tense, gender, etc.) through editing or generating while retaining the text content. The purpose of this study is to sort out the existing methods in order to advance this research field. First, the problem of text style transfer is defined and the challenges are given. Then, the existing methods are classified and reviewed, focusing on the TST methods based on unsupervised learning and further dividing them into the implicit methods and the explicit methods. The implementation mechanisms, advantages, limitations, and performance of each method are also analyzed. Subsequently, the performance of several representative methods on automatic evaluation indicators such as transfer accuracy, text content retention, and perplexity are compared through experiments. Finally, the research of text style transfer is concluded and prospected.

    参考文献
    相似文献
    引证文献
引用本文

陈可佳,费子阳,陈景强,杨子农.文本风格迁移研究综述.软件学报,2022,33(12):4668-4687

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-07-04
  • 最后修改日期:2021-09-22
  • 录用日期:
  • 在线发布日期: 2021-12-24
  • 出版日期: 2022-12-06
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号