按关键词检索

微信服务号

微信订阅号

2025年4月4日 18:40 星期五

查询高级检索+

共找到相关记录6条

全选

显示方式：|

代码变更表示学习及其应用研究进展
刘忠鑫，唐郅杰，夏鑫，李善平
2023, 34(12):5501-5526.DOI: 10.13328/j.cnki.jos.006749
关键词：代码变更; 表示学习; 代码变更表示; 软件演化; 软件维护
摘要 (1707)HTML (3037)PDF 6.04 M (5330)收藏
摘要:代码变更是软件演化过程中的关键行为, 其质量与软件质量密切相关. 对代码变更进行建模和表示是众多软件工程任务的基础, 例如即时缺陷预测、软件制品可追溯性恢复等. 近年来, 代码变更表示学习技术得到了广泛的关注与应用. 该类技术旨在学习将代码变更的语义信息表示为稠密低维实值向量, 即学习代码变更的分布式表示, 相比于传统的人工设计代码变更特征的方法具有自动学习、端到端训练和表示准确等优点. 但同时该领域目前也存在如结构信息利用困难、基准数据集缺失等挑战. 对近期代码变更表示学习技术的研究及应用进展进行了梳理和总结, 主要内容包括: (1)介绍了代码变更表示学习及其应用的一般框架. (2)梳理了现有的代码变更表示学习技术, 总结了不同技术的优缺点. (3)总结并归类了代码变更表示学习技术的下游应用. (4)归纳了代码变更表示学习技术现存的挑战和潜在的机遇, 展望了该类技术的未来发展方向.
代码审查中代码变更恢复的经验研究
王青叶，万志远，李善平，夏鑫
2022, 33(7):2581-2598.DOI: 10.13328/j.cnki.jos.006312
关键词：代码审查; 代码变更; 代码变更拒收; 代码变更恢复; 经验研究
摘要 (1315)HTML (2034)PDF 2.25 M (3337)收藏
摘要:代码审查是一种由其他开发者而非代码作者本人评审代码的形式.在代码审查系统中,开发者通过提交代码变更来修复软件缺陷或添加软件特性.并非所有的代码变更都会被集成到代码库中,部分代码变更会被拒收.被拒收的代码变更有可能被恢复,并继续接受审查,提供代码贡献者改进代码变更的机会.然而,审查恢复过的代码变更需要花费更多的时间.收集了4个开源项目中的920 700条代码变更,采用主题分析方法识别出11类代码变更恢复的原因,并定量分析被恢复的代码变更的特征.主要发现包括:1)导致代码变更恢复的原因中,“提升改进”类型占比最大;2)不同项目之间,代码变更被恢复的原因类别分布存在差异,但并不显著;3)与从未恢复过的代码变更相比,恢复的代码变更接收率低10%,评论数量平均多1.9倍,审查所用时间平均多5.8倍;4)81%的恢复代码变更被接收,19%的恢复代码变更被拒收.
智能代码补全研究综述
杨博，张能，李善平，夏鑫
2020, 31(5):1435-1453.DOI: 10.13328/j.cnki.jos.005966
关键词：代码补全; 代码表征; 软件开发工具
摘要 (4695)HTML (5797)PDF 2.06 M (9681)收藏
摘要:代码补全（code completion）是自动化软件开发的重要功能之一，是大多数现代集成开发环境和源代码编辑器的重要组件.代码补全提供即时类名、方法名和关键字等预测，辅助开发人员编写程序，直观提高软件开发效率.近年来，开源软件社区中源代码和数据规模不断扩大，人工智能技术取得了卓越进展，这对自动化软件开发技术产生了极大的促进作用.智能代码补全（intelligent code completion）根据源代码建立语言模型，从语料库学习已有代码特征，根据待补全位置的上下文代码特征在语料库中检索最相似的匹配项进行推荐和预测.相对于传统代码补全，智能代码补全凭借其高准确率、多补全形式、可学习迭代的特性成为软件工程领域的热门方向之一.研究者们在智能代码补全方面进行了一系列研究，根据这些方法如何表征和利用源代码信息的不同方式，可以将它们分为基于编程语言表征和基于统计语言表征两个研究方向，其中，基于编程语言表征又分为标识符序列、抽象语法树、控制/数据流图这3个类别，基于统计语言表征又分为N-gram模型、神经网络模型这2个类别.从代码表征的角度入手，对近年来代码补全方法研究进展进行梳理和总结，主要内容包括：（1）根据代码表征方式阐述并归类了现有的智能代码补全方法；（2）总结了代码补全的一般过程和模型评估中的模型验证方法与性能评估指标；（3）归纳了智能代码补全的主要挑战；（4）展望了智能代码补全的未来发展方向.
代码克隆检测研究进展
陈秋远, 李善平, 鄢萌, 夏鑫
2019, 30(4):962-980.DOI: 10.13328/j.cnki.jos.005711
关键词：代码克隆; 克隆检测; 代码表征
摘要 (4112)HTML (5156)PDF 1.88 M (9708)收藏
摘要:代码克隆（code clone），是指存在于代码库中两个及以上相同或者相似的源代码片段.代码克隆相关问题是软件工程领域研究的重要课题.代码克隆是软件开发中的常见现象，它能够提高效率，产生一定的正面效益.但是研究表明，代码克隆也会对软件系统的开发、维护产生负面的影响，包括降低软件稳定性，造成代码库冗余和软件缺陷传播等.代码克隆检测技术旨在寻找检测代码克隆的自动化方法，从而用较低成本减少代码克隆的负面效应.研究者们在代码克隆检测方面获得了一系列的检测技术成果，根据这些技术利用源代码信息的程度不同，可以将它们分为基于文本、词汇、语法、语义4个层次.现有的检测技术针对文本相似的克隆取得了有效的检测结果，但同时也面临着更高抽象层次克隆的挑战，亟待更先进的理论、技术来解决.着重从源代码表征方式角度入手，对近年来代码克隆检测研究进展进行了梳理和总结.主要内容包括：（1）根据源代码表征方式阐述并归类了现有的克隆检测方法；（2）总结了模型评估中使用的实验验证方法与性能评估指标；（3）从科学性、实用性和技术难点这3个方面归纳总结了代码克隆研究的关键问题，围绕数据标注、表征方法、模型构建和工程实践4个方面，阐述了问题的可能解决思路和研究的未来发展趋势.
LBS 中连续查询攻击算法及匿名性度量
林欣, 李善平, 杨朝晖
2009, 20(4):1058-1068.
关键词：LBS(location-based service); k-匿名; 连续查询; 攻击算法; 匿名性度量
摘要 (6805)HTML (0)PDF 629.07 K (8156)收藏
摘要:k-匿名机制是LBS(location based service)中保证查询隐私性的重要手段.已有文献指出,现有的k-匿名机制不能有效保护连续性查询的隐私性.提出一种连续查询发送模型,该模型融合了查询发送时间的间隔模型和连续性模型,针对此模型下的两种k-匿名算法Clique Cloaking 和Non-clique Cloaking,分别提出了一种连续查询攻击算法.在此攻击算法下,匿名集的势不再适合作为查询匿名性的度量,因此提出一种基于熵理论的度量方式AD(anonymity degree).实验结果表明,对连续性很强的查询,攻击算法重识别用户身份的成功率极高;AD 比匿名集的势更能反映查询的匿名性.
STEP模型映射技术及其在开放环境中的应用
杨子江, 李善平, 董金祥
2002, 13(8):1644-1651.
关键词：STEP; EXPRESS; CIMS; 模型映射; 开放环境
摘要 (3381)HTML (0)PDF 488.38 K (4994)收藏
摘要:针对互操作所导致的异构系统间数据交换构造STEP模型映射算法,为基于不同STEP应用协议的CAx系统集成提出了一种方法论.首先对STEP/EXPRESS数据模型作出形式化定义,在此基础上提出了两种STEP模型映射技术--静态映射与动态映射,并阐述了基于EXPRESS-X的实现及其在开放式环境中的一种典型应用.提出了模型映射技术独立于具体系统,为异构系统提供透明的集成方式,从而降低了信息集成在系统开发中的开销.

共1页6条记录跳转到页GO

微信服务号

微信订阅号

出版年份