主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2022年专刊出版计划 微信服务介绍 最新一期:2021年第2期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
贾修一,张文舟,李伟湋,黄志球.一种基于变分自编码器的异构缺陷预测特征表示方法.软件学报,2021,32(7):12-0
一种基于变分自编码器的异构缺陷预测特征表示方法
A Feature Representation Method for Heterogeneous Defect Prediction Based on Variational Autoencoders
投稿时间:2020-04-13  修订日期:2020-10-26
DOI:10.13328/j.cnki.jos.006257
中文关键词:  异构缺陷预测  变分自编码器  特征表示
英文关键词:Heterogeneous defect prediction  variational autoencoders  feature representation
基金项目:国家自然科学基金(61906090,U20B2064,61773208);江苏省自然科学基金(BK20191287,BK20170809);中央高校基本科研业务费专项资金资助(30920021131);中国博士后科学基金资助(2018M632304)
作者单位E-mail
贾修一 南京理工大学 计算机科学与工程学院, 江苏 南京 210094  
张文舟 南京理工大学 计算机科学与工程学院, 江苏 南京 210094  
李伟湋 南京航空航天大学 航天学院, 江苏 南京 210016 liweiwei@nuaa.edu.cn 
黄志球 南京航空航天大学 计算机科学与技术学院, 江苏 南京 210016  
摘要点击次数: 269
全文下载次数: 118
中文摘要:
      跨项目软件缺陷预测技术可以利用现有的已标注缺陷数据集对新的无标记项目进行预测,但需要两者之间具有相同的度量集合,难以用于实际开发.异构缺陷预测技术可以在具有异构度量集合的项目间进行缺陷预测,该技术引起了大量研究人员的关注.现有的异构缺陷预测技术利用朴素的或者传统机器学习方法为源项目和目标项目学习特征表示,所学习到的特征表示能力很弱且缺陷预测性能很差.鉴于深度神经网络强大的特征抽取和表示能力,本文基于变分自编码器技术提出了一种面向异构缺陷预测的特征表示方法.该模型结合了变分自编码器和最大均值差异距离,能有效地学习源项目和目标项目的共性特征表示,基于该特征表示可以训练出有效的缺陷预测模型.在多组缺陷数据集上通过与传统跨项目缺陷预测方法及异构缺陷预测方法实验对比验证了所提方法的有效性.
英文摘要:
      Cross-project defect prediction technology can use the existing labeled defect data to predict new unlabeled data, but it needs to have the same metric features between the two projects, which is difficult to be applied in actual development. Heterogeneous defect prediction can perform prediction without requiring the source and target project to have the same set of metrics and has attracted great interest. Existing heterogeneous defect prediction models use naive or traditional machine learning methods to learn feature representations between source and target projects, and perform prediction based on it. The feature representation learned by previous studies is weak, causing poor performance in predicting defect-prone instances. In view of the powerful feature extraction and representation capabilities of deep neural networks, this paper proposes a feature representation method for heterogeneous defect prediction based on variational autoencoders. By combining the variational autoencoder and maximum mean discrepancy, this method can effectively learn the common feature representation of the source and target projects. Then an effective defect prediction model can be trained based on it. The validity of the proposed method is verified by comparing it with traditional cross-project defect prediction methods and heterogeneous defect prediction methods on various datasets.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利