主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第11期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
褚晓敏,奚雪峰,蒋峰,徐昇,朱巧明,周国栋.宏观篇章结构表示体系和语料标注研究.软件学报,0,(0):0
宏观篇章结构表示体系和语料标注研究
Research of macro discourse structure representation schema and resource construction
投稿时间:2018-01-09  修订日期:2019-04-19
DOI:10.13328/j.cnki.jos.005868
中文关键词:  篇章结构分析  宏观篇章结构  篇章结构表示体系  逻辑语义结构  功能语用结构  语料标注
英文关键词:discourse structure analysis  macro discourse structure  discourse structure representation schema  logical semantic structure  functional pragmatic structure  corpus annotating
基金项目:国家自然科学基金(61773276,61673290,61836007)
作者单位E-mail
褚晓敏 苏州大学 自然语言处理实验室, 江苏 苏州 215006  
奚雪峰 苏州科技大学 电子与信息工程学院, 江苏 苏州 215000  
蒋峰 苏州大学 自然语言处理实验室, 江苏 苏州 215006  
徐昇 苏州大学 自然语言处理实验室, 江苏 苏州 215006  
朱巧明 苏州大学 自然语言处理实验室, 江苏 苏州 215006 qmzhu@suda.edu.cn 
周国栋 苏州大学 自然语言处理实验室, 江苏 苏州 215006  
摘要点击次数: 175
全文下载次数: 106
中文摘要:
      篇章结构分析是自然语言处理领域的一个重要研究方向.篇章结构分析有助于理解篇章的结构和语义,并为自然语言处理的应用(如自动文摘、主题抽取、问答系统等)提供有力的支撑.目前篇章结构分析主要集中在微观的层面,分析重点是句子内部或句子与句子之间的关系和结构,而宏观层面的研究相对较少.因此,本文以篇章结构作为研究对象,并将研究重点放在宏观篇章结构的表示体系和语料资源建设上.本文探讨了篇章结构分析的重要性,从理论体系、语料资源、计算模型等三个方面阐述了篇章结构分析的研究现状,提出了以篇章主次关系为媒介的宏观和微观统一的篇章结构表示框架,并分别构建了宏观篇章的逻辑语义结构和功能语用结构.在此基础上本文标注了规模为720篇新闻报道的宏观篇章结构语料,并对标注的结果进行了一致性分析和标注统计分析.
英文摘要:
      Discourse structure analysis is an important research topic in natural language processing. Discourse structure analysis not only helps to understand the discourse structure and semantics, but also provides strong support for deep applications of natural language processing, such as automatic summarization, topic extraction, question answering, etc. At present, the analysis of discourse structure is mainly concentrated on the micro level. The analysis focuses on the relations and structures between sentences or sentences groups, while the analysis on macro level is less. Therefore, this paper takes discourse structure as the research object, and focuses on the construction of representation schema and corpus resources on the macro level. This paper discusses the importance of discourse structure analysis, expounds the research status of discourse structure analysis from three aspects of theory system, corpora resource and computing model, and puts forward the macro-micro unified discourse structure representation framework with the primary-secondary relation as the carrier. Furthermore, this paper constructs the logical semantic structure and functional pragmatic structure of macro discourse level respectively. On this basis, this paper annotated a macro Chinese discourse structure corpus, consisting of 720 Newswire articles, and analyzed the results of the annotations in consistency and statistical data.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利