英汉篇章结构分析研究综述
CSTR:
作者:
作者单位:

作者简介:

蒋峰(1994-),男,博士生,CCF学生会员,主要研究领域为自然语言处理,篇章分析;范亚鑫(1997-),男,博士生,CCF学生会员,主要研究领域为自然语言处理,篇章分析;褚晓敏(1981-),女,博士,CCF专业会员,主要研究领域为自然语言处理,篇章分析;李培峰(1971-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为自然语言处理,机器学习;朱巧明(1963-),男,博士,教授,博士生导师,CCF杰出会员,主要研究领域为中文信息处理,Web信息处理.

通讯作者:

朱巧明,E-mail:qmzhu@suda.edu.cn

中图分类号:

基金项目:

国家自然科学基金(61836007, 61772354, 61773276); 江苏高校优势学科建设工程项目


Survey on English and Chinese Discourse Structure Analysis
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    篇章结构分析旨在理解文章的整体结构及其各部分之间的语义联系. 作为自然语言处理的研究热点, 近年来篇章结构分析研究发展迅速. 首先总结英语和汉语中篇章结构分析理论, 然后介绍相关篇章语料库及其计算模型的研究. 在此基础上, 梳理了当前英语、汉语中篇章结构分析的相关工作脉络, 构建了篇章结构分析研究框架, 归纳总结出当前研究的趋势和热点. 然后, 简要介绍篇章结构在下游任务中的应用. 最后, 指出当前汉语篇章结构分析存在的问题与挑战, 为今后的研究提供指导和帮助.

    Abstract:

    Discourse structure analysis aims to understand the overall structure of an article and the semantic relationships between its various parts. As a research hotspot of natural language processing, it has developed rapidly in recent years. This study first summarizes the mainstream discourse structure analysis theories in English and Chinese and then introduces the research on the popular English and Chinese discourse corpora as well as their calculation models. On this basis, this study surveys the current work context of discourse structure analysis in Chinese and English and constructs its research framework. Moreover, the current research trends and focuses are summarized, and the application of discourse structure in downstream tasks is introduced briefly. Finally, this study points out the issues and challenges in the current Chinese discourse structure analysis to provide guidance and help for future research.

    参考文献
    相似文献
    引证文献
引用本文

蒋峰,范亚鑫,褚晓敏,李培峰,朱巧明.英汉篇章结构分析研究综述.软件学报,2023,34(9):4167-4194

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-08-22
  • 最后修改日期:2021-12-12
  • 录用日期:
  • 在线发布日期: 2022-05-24
  • 出版日期: 2023-09-06
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号