基于多标签学习的代码评审意见质量评价
作者:
作者单位:

作者简介:

杨岚心(1993-), 男, 博士生, 主要研究领域为软件工程, 软件质量, 软件代码评审.
张贺(1971-), 男, 博士, 教授, 博士生导师, CCF高级会员, 主要研究领域为软件工程, 开发运维一体化, 软件研发效能, 软件安全, 经验及循证软件工程, 区块链.
徐近伟(1994-), 男, 博士生, CCF学生会员, 主要研究领域为软件代码评审, 软件供应链.
张逸凡(1998-), 男, 硕士, 主要研究领域为软件代码评审, 推荐系统.
王梓宽(1999-), 男, 硕士生, 主要研究领域为持续集成相关技术, 软件代码评审.
周鑫(1991-), 男, 博士生, 主要研究领域为经验软件工程, 灰色文献, 自然语言处理.
李京悦(1974-), 男, 博士, 副教授, 主要研究领域为经验软件工程, 软件安全和数据隐私, 区块链技术.
荣国平(1977-), 男, 博士, 副研究员, CCF专业会员, 主要研究领域为软件过程, 实证软件工程.

通讯作者:

张贺, E-mail: hezhang@nju.edu.cn

中图分类号:

TP311

基金项目:

国家自然科学基金(62072227, 62202219); 国家重点研发计划(2019YFE0105500); 江苏省重点研发计划(BE2021002-2); 南京大学计算机软件新技术国家重点实验室创新项目(ZZKT2022A25); 海外开放课题(KFKT2022A09)


Multi-label Learning for Evaluating Quality of Code Review Comments
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    代码评审是现代软件开发过程中被广泛应用的最佳实践之一, 其对于软件质量保证和工程能力提升都具有重要意义. 代码评审意见是代码评审最主要和最重要的产出之一, 其不仅是评审者对代码变更的质量感知, 而且是作者修复代码缺陷和提升质量的重要参考. 目前, 全球各大软件组织都相继制定了代码评审指南, 但仍缺少针对代码评审意见质量的有效的评价方式和方法. 为了实现可解释的、自动化的评价, 开展文献综述、案例分析等若干实证研究, 并在此基础上提出一种基于多标签学习的代码评审意见质量评价方法. 实验使用某大型软件企业的34个商业项目的共计17 000条评审意见作为数据集. 结果表明所提出的方法能够有效地评价代码评审意见质量属性和质量等级. 除此以外, 还提供若干建模经验, 如评审意见标注和校验等, 旨在帮助那些受代码评审困扰的软件组织更好地实施所提出的方法.

    Abstract:

    Code review is one of the best practices widely used in modern software development, which is crucial for ensuring software quality and strengthening engineering capability. Code review comments (CRCs) are one of the main and most important outputs of code reviews. CRCs are not only the reviewers’ perceptions of code quality but also the references for authors to fix code defects and improve quality. Nowadays, although a number of software organizations have developed guidelines for performing code reviews, there are still few effective methods for evaluating the quality of CRCs. To provide an explainable and automated quality evaluation of CRCs, this study conducts a series of empirical studies such as literature reviews and case analyses. Based on the results of the empirical studies, the study proposes a multi-label learning-based approach for evaluating the quality of CRCs. Experiments are carried out by using a large software enterprise-specific dataset that includes a total of 17 000 CRCs from 34 commercial projects. The results indicate that the proposed approach can effectively evaluate the quality attributes and grades of CRCs. The study also provides some modeling experiences such as CRC labeling and verification, so as to help software organizations struggling with code reviews better implement the proposed approach.

    参考文献
    相似文献
    引证文献
引用本文

杨岚心,张贺,徐近伟,张逸凡,王梓宽,周鑫,李京悦,荣国平.基于多标签学习的代码评审意见质量评价.软件学报,2024,35(6):2775-2794

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-06-15
  • 最后修改日期:2022-09-19
  • 录用日期:
  • 在线发布日期: 2023-08-16
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号