主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2022年专刊出版计划 微信服务介绍 最新一期:2021年第3期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
沈琦,钱莹,邹艳珍,伍仕骏,谢冰.融合代码与文档的软件功能特征挖掘方法.软件学报,2021,32(4):10-0
融合代码与文档的软件功能特征挖掘方法
Fusing Code and Documents to Mine Software Functional Features
投稿时间:2020-09-13  修订日期:2020-10-26
DOI:10.13328/j.cnki.jos.006228
中文关键词:  软件复用  软件功能特征  开源软件  自然语言编程接口
英文关键词:software reuse  software functional feature  open source software  Natural language Interface
基金项目:国家自然科学基金面上项目(61972006);国家杰出青年科学基金(61525201)
作者单位E-mail
沈琦 高可信软件技术教育部重点实验室(北京大学), 北京 100871
北京大学 信息科学技术学院, 北京 100871 
 
钱莹 高可信软件技术教育部重点实验室(北京大学), 北京 100871
北京大学 信息科学技术学院, 北京 100871 
 
邹艳珍 高可信软件技术教育部重点实验室(北京大学), 北京 100871
北京大学 信息科学技术学院, 北京 100871 
zouyz@pku.edu.cn 
伍仕骏 高可信软件技术教育部重点实验室(北京大学), 北京 100871
北京大学 信息科学技术学院, 北京 100871 
 
谢冰 高可信软件技术教育部重点实验室(北京大学), 北京 100871
北京大学 信息科学技术学院, 北京 100871 
 
摘要点击次数: 190
全文下载次数: 118
中文摘要:
      在软件复用过程中,简洁清楚的软件功能自然语言描述是帮助复用者快速了解待复用软件项目/代码库的前提和基础.但当前开源软件往往缺乏高质量的软件功能说明文档,使得这一过程变得更加复杂和困难.为此,本文提出了一种融合代码与文档的软件功能特征挖掘方法.该方法以动宾短语的形式描述软件功能特征,通过迭代挖掘软件源代码和以Stack Overflow讨论帖为代表的软件文档,自动提取开源软件的功能特征描述,并构造了层次化的软件功能特征视图.在针对多个开源软件项目的实验中,本文方法可覆盖官方文档中列举的95.38%的软件功能.挖掘结果中语句和功能特征的准确率分别达到了93.78%和92.57%.对比现有工作TaskNav和APITasks,本文方法在平均准确率上分别提升了28.78%和11.56%.
英文摘要:
      In the process of software reuse, users need concise and clear natural language description of software functions to understand the candidate software project quickly. However, current open source software often lacks high-quality documentation, which makes this process even more complex and difficult. In this paper, we propose a novel functional feature mining approach combining code and documentation. It describes functional features in the form of verb phrases, automatically extracts functional features by iterately mining source code and software documents such as Stack Overflow, associates corresponding API usage example for each functional feature, and builds hierarchical functional feature view for uses finally. We set up our experiments on several open source software and its related heterogeneous data, the resuts show that the functional features generated by our approach cover 95.38% of the functions in official documentation, and our approach achieves 93.78% and 92.57% accuracy for mining sentences and functional features respectively. Compared to two existing tools TaskNav and APITasks, our approach improves the accuracy by 28.78% and 11.56% separately.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利