基于代价极速学习机的软件缺陷报告分类方法
CSTR:
作者:
作者单位:

作者简介:

张天伦(1991-),男,河北保定人,博士生,主要研究领域为机器学习,软件工程,计算视觉;杨溪(1993-),男,硕士生,主要研究领域为机器学习,计算视觉,模糊集;陈荣(1969-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为机器学习,软件故障诊断,行为识别,运筹学;祝宏玉(1994-),女,硕士,主要研究领域为神经网络,不平衡数据处理,大数据算法.

通讯作者:

陈荣,E-mail:rchen@dlmu.edu.cn

中图分类号:

基金项目:

国家自然科学基金(61672122,61602077,61732011)


Approach of Bug Reports Classification Based on Cost Extreme Learning Machine
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61672122, 61602077, 61732011)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在所有的软件系统开发过程中,Bug的存在是不可避免的问题.对于软件系统的开发者来说,修复Bug最有利的工具就是Bug报告.但是人工识别Bug报告会给开发人员带来新的负担,因此,自动对Bug报告进行分类是一项很有必要的工作.基于此,提出用基于极速学习机的方法来对Bug报告进行分类.具体而言,主要解决Bug报告自动分类的3个问题:第1个是Bug报告数据集里不同类别的样本数量不平衡问题;第2个是Bug报告数据集里被标注的样本不充足问题;第3个是Bug报告数据集总体样本量不充足问题.为了解决这3个问题,分别引入了基于代价的有监督分类方法、基于模糊度的半监督学习方法以及样本迁移方法.通过在多个Bug报告数据集上进行实验,验证了这些方法的可行性和有效性.

    Abstract:

    Bug is an unavoidable problem in the development of all software systems. For developers of software system, bug report is a powerful tool for fixing bugs. However, manual recognition on bug reports tends to be time-consuming and not economical. It thus becomes significant to advance the automated classification approach to provide clear guidelines on how to assign a reasonable severity to a reported bug. In this study, several algrithoms are proposed based on extreme learning machine to automatically classify bug reports. Concretely, this study focuses on three problems in the field of bug report classification. The first one is the imbalanced class distribution in bug report dataset; the second is the insufficient labeled sample in bug report dataset; the last is the limited training data available. In order to solve these issues, three methods are proposed based on cost-sensitive supervised classification, semi-supervised learning, and sample transferring, respectively. Extensive experiments on real bug report datasets are conducted, and the results demonstrate the practicability and effectiveness of the proposed methods.

    参考文献
    相似文献
    引证文献
引用本文

张天伦,陈荣,杨溪,祝宏玉.基于代价极速学习机的软件缺陷报告分类方法.软件学报,2019,30(5):1386-1406

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-08-31
  • 最后修改日期:2018-10-31
  • 录用日期:
  • 在线发布日期: 2019-05-08
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号