主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2018年第12期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
黄袁,刘志勇,陈湘萍,熊英飞,罗笑南.基于关键类判定的代码提交理解辅助方法.软件学报,2017,28(6):1418-1434
基于关键类判定的代码提交理解辅助方法
Auxiliary Method for Code Commit Comprehension Based on Core-Class Identification
投稿时间:2016-07-28  修订日期:2016-10-11
DOI:10.13328/j.cnki.jos.005225
中文关键词:  代码修改  代码修改理解  代码提交  机器学习  可判别特征
英文关键词:code change  code change comprehension  code commit  machine learning  discriminative feature
基金项目:NSFC-广东联合基金(U1201252);国家重点研发计划(2016YFB1000101);国家自然科学基金(61672545,61672045);广东科技计划(2015B040403005)
作者单位E-mail
黄袁 中山大学 数据科学与计算机学院, 广东 广州 510006
国家数字家庭工程技术研究中心, 广东 广州 510006 
 
刘志勇 中山大学 数据科学与计算机学院, 广东 广州 510006
国家数字家庭工程技术研究中心, 广东 广州 510006 
 
陈湘萍 国家数字家庭工程技术研究中心, 广东 广州 510006
中山大学 先进技术研究院, 广东 广州 510006 
chenxp8@mail.sysu.edu.cn 
熊英飞 北京大学 信息科学技术学院 软件研究所, 北京 100871
高可信软件技术教育部重点实验室(北京大学), 北京 100871 
 
罗笑南 中山大学 数据科学与计算机学院, 广东 广州 510006
国家数字家庭工程技术研究中心, 广东 广州 510006 
 
摘要点击次数: 1371
全文下载次数: 740
中文摘要:
      软件代码提交是最重要的软件版本演化数据之一,被广泛应用于软件审查和软件理解中.对于程序员,提交的理解难度随着受影响的类数量、修改的代码量的增加而增加.通过对大量数据的分析发现:识别出提交中核心的修改类(关键类)以及为了完成这个核心修改所进行的依赖性改动的类(非关键类),能够辅助代码提交的理解.受机器学习技术在分类领域有效性的启发,提出一种基于机器学习的关键类识别方法,将判定提交中的关键类建模为二分类问题(即关键和非关键类),从软件演化过程中产生的海量提交数据中抽取可判别性特征来度量类的关键性.在多个数据集上的实验结果表明:该方法判定关键类的综合准确率达到了87%;相比于开发人员直接理解提交,使用关键类信息提示来辅助理解提交,能够显著提高开发人员的效率和正确率.
英文摘要:
      Code commit is one of the most important software evolution data, and it is widely used in the software review and code comprehension. A commit involving multiple modified classes and code makes the review of code changes difficult. By analyzing a large amount of commit data, this study discovers that identifying the core modified classes in a commit can speed up commit review for developers. Inspired by the effectiveness of machine learning techniques in classification, the paper models the core class identification as a binary classification problem (i.e., core and non-core) and proposes discriminative features from a large number of commits to characterize the core modified classes. The experiments results show that the proposed approach achieves 87% accuracy, and using core class in commit review provides significant improvement than the ones without core class.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利