朱子骁,邹艳珍,华晨彦,沈琦,赵俊峰.基于StackOverflow数据的软件功能特征挖掘组织方法.软件学报,2018,29(8):2210-2225 |
基于StackOverflow数据的软件功能特征挖掘组织方法 |
Mining and Organizing Software Functional Features Based on StackOverflow Data |
投稿时间:2017-07-19 修订日期:2017-09-28 |
DOI:10.13328/j.cnki.jos.005533 |
中文关键词: 软件复用 功能特征 软件文档 StackOverflow 自然语言句法分析 频繁子图挖掘 |
英文关键词:software reuse functional feature software documentation StackOverflow natural language syntax parsing frequent subgraph mining |
基金项目:国家重点研发计划(2016YFB1000801);国家杰出青年科学基金(61525201) |
作者 | 单位 | E-mail | 朱子骁 | 高可信软件技术教育部重点实验室(北京大学), 北京 100871 北京大学 信息科学技术学院 软件研究所, 北京 100871 | | 邹艳珍 | 高可信软件技术教育部重点实验室(北京大学), 北京 100871 北京大学 信息科学技术学院 软件研究所, 北京 100871 北京大学(天津滨海) 新一代信息技术研究院, 天津 300450 | zouyz@pku.edu.cn | 华晨彦 | 高可信软件技术教育部重点实验室(北京大学), 北京 100871 北京大学 信息科学技术学院 软件研究所, 北京 100871 | | 沈琦 | 高可信软件技术教育部重点实验室(北京大学), 北京 100871 北京大学 信息科学技术学院 软件研究所, 北京 100871 | | 赵俊峰 | 高可信软件技术教育部重点实验室(北京大学), 北京 100871 北京大学 信息科学技术学院 软件研究所, 北京 100871 北京大学(天津滨海) 新一代信息技术研究院, 天津 300450 | |
|
摘要点击次数: 2718 |
全文下载次数: 1671 |
中文摘要: |
软件的功能描述文档是开发人员了解软件的重要基础.现有的软件项目并不都是具备全面描述软件功能的文档,但软件项目开发和应用过程中的各种交流记录蕴含了讨论其功能的大量信息.为此,提出了一种基于StackOverflow问答数据的软件功能特征挖掘组织方法.该方法提出以动宾短语形式描述软件功能特征,挖掘并组织蕴含在StackOverflow数据中的软件功能特征,自动生成一种以层次化方式展示的软件项目功能特征文档.在针对真实项目的实验中,该方法生成的软件功能文档可以覆盖官方文档中列举的97.6%的软件常用功能.同时,该方法可以扩展从不同形式的项目交流记录中生成全面描述软件功能特征的文档. |
英文摘要: |
Functional specification documents are very important for the developers who want to understand and reuse unfamiliar software libraries. Due to high cost of human effort and time, lots of software do not provide the official functional documentation. However, some software communication records produced in software developing processes contain valuable information regarding software functions and usages. In this paper, an approach is proposed to automatically mining and organizing functional features for open source software based on StackOverflow data. By describing functional features in the form of verb phrases, this approach generates hierarchical list of software functional features as the supplement of software documentation. In the experimental evaluation on some real-world subjects, the automatically generated documents have covered 97.6% of the frequent-used functional features in the official documents. At the same time, the proposed approach can be adapted to different types of software communication records, and applied to software in different domains. |
HTML 下载PDF全文 查看/发表评论 下载PDF阅读器 |