• 2022年第1期文章目次
    全 选
    显示方式: |
    • >综述文章
    • 开源许可证的选择: 挑战和影响因素

      2022, 33(1):1-25. DOI: 10.13328/j.cnki.jos.006279

      摘要 (2754) HTML (3063) PDF 7.76 M (4552) 评论 (0) 收藏

      摘要:开发者通常会为其开源代码选择不同的开源许可证来约束其使用条件, 以期能有效地保护知识产权和维持软件的长远发展. 然而, 现有的开源许可证种类繁杂, 开发者难以了解不同开源许可证间的差异, 并且难以通过现有的开源许可证选择工具做出合适的选择——其使用要求开发者了解开源许可证相关条款并明确自己的业务需求. 学术界虽然对开源许可证已有研究, 但是对开发者选择开源许可证的实际困难并无系统的分析进而缺乏清晰的认知. 有鉴于此, 旨在从开源开发者角度出发, 理解其选择开源许可证的困难, 并通过分析开源许可证的组成要素和影响开源许可证选择的因素, 为开源许可证的选择提供借鉴. 设计问卷并随机调研了参与GitHub开源项目的200名开发者. 通过对53个反馈结果采用主题分析, 发现开发者选择开源许可证通常面临条款内容太复杂和考虑因素不确定这两方面的困难. 通过分析GitHub上3 346 168个代码仓库中使用最广泛的10种开源许可证, 建立了包含10个维度的开源许可证框架. 通过借鉴计划行为理论, 从行为态度、主观规范和知觉行为控制3方面提出了影响许可证选择的9大要素, 通过开发者调研验证了它们的相关性, 并进一步通过拟合次序回归模型验证了项目特征与许可证选择的关系. 研究结果能加深开发者对开源许可证内容的理解, 为开发者结合自身需求选择合适的许可证提供决策支持, 并为实现基于用户需求的开源许可证选择工具提供借鉴.

    • 自承认技术债的研究: 问题、进展与挑战

      2022, 33(1):26-54. DOI: 10.13328/j.cnki.jos.006292

      摘要 (2728) HTML (3726) PDF 10.25 M (5385) 评论 (0) 收藏

      摘要:技术债是一个指以牺牲长期代码质量为代价来实现短期项目目标的隐喻. 其中, 那些由开发者有意引入项目中的技术债被称为自承认技术债(self-admitted technical debt, SATD), 通常以代码注释的形式存在于软件项目中. SATD的存在给软件质量和鲁棒性带来了巨大挑战. 为了识别并且及时地偿还SATD来保障代码质量, 研究者从特性分析和识别模型两方面进行了大量研究并且取得了较大的进展. 与此同时, 相关研究工作中仍存在一些亟待解决的挑战. 对近年来国内外学者在该领域的研究成果进行系统性的总结. 首先, 描述自承认技术债的研究问题. 然后, 分别从特性分析和识别模型两方面总结相关的研究进展, 并对具体的理论和技术途径进行梳理. 接着, 简要介绍技术债的其他相关技术. 最后, 指出目前该领域研究过程中面临的挑战并给出建议的研究方向.

    • 基于神经网络的自动源代码摘要技术综述

      2022, 33(1):55-77. DOI: 10.13328/j.cnki.jos.006337

      摘要 (2540) HTML (3190) PDF 5.36 M (3965) 评论 (0) 收藏

      摘要:源代码的摘要可以帮助软件开发人员快速地理解代码, 帮助维护人员更快地完成维护任务. 但是, 手工编写摘要代价高、效率低, 因此人们试图利用计算机自动地为源代码生成摘要. 近年来, 基于神经网络的代码摘要技术成为自动源代码摘要研究的主流技术和软件工程领域的研究热点. 首先阐述了代码摘要的概念和自动代码摘要的定义, 回顾了自动代码摘要技术的发展历程, 并介绍了生成式摘要的质量评估方法和评估指标; 然后分析了神经代码摘要算法的通用结构、工作流程和面临的主要挑战; 给出了代表性算法的分类, 并对每类算法的设计原理、特点和限制条件进行了分析. 最后, 讨论并展望了未来神经代码摘要技术的发展趋势和研究方向.

    • 面向对象程序的上下文敏感指针分析研究

      2022, 33(1):78-101. DOI: 10.13328/j.cnki.jos.006345

      摘要 (1805) HTML (3412) PDF 8.23 M (3316) 评论 (0) 收藏

      摘要:指针分析是编译优化、程序静态分析中的基础, 很多应用都需要基于指针分析, 低精度的指针分析会给这些应用带来高误报率和漏报率, 通过添加上下文敏感信息是提高指针分析的精度的一个重要手段. 自从面向对象的概念被提出来之后, 该概念得到了广泛的应用, Java、C++、.NET、C#等主流语言都支持面向对象的特性, 面向对象程序的指针分析越来越受关注. 做了一个系统文献综述(SLR), 通过对索引到的相关文献进行分析和归类, 总结了面向对象程序的上下文敏感指针分析研究的5个主要问题, 并对这5个问题中用到的方法进行了分析讨论.

    • 自然语言处理中的文本表示研究

      2022, 33(1):102-128. DOI: 10.13328/j.cnki.jos.006304

      摘要 (3554) HTML (4328) PDF 6.89 M (6121) 评论 (0) 收藏

      摘要:自然语言处理是人工智能的核心技术, 文本表示是自然语言处理的基础性和必要性工作, 影响甚至决定着自然语言处理系统的质量和性能. 探讨了文本表示的基本原理、自然语言的形式化、语言模型以及文本表示的内涵和外延. 宏观上分析了文本表示的技术分类, 对主流技术和方法, 包括基于向量空间、基于主题模型、基于图、基于神经网络、基于表示学习的文本表示, 进行了分析、归纳和总结, 对基于事件、基于语义和基于知识的文本表示也进行了介绍. 对文本表示技术的发展趋势和方向进行了预测和进一步讨论. 以神经网络为基础的深度学习以及表示学习在文本表示中将发挥重要作用, 预训练加调优的策略将逐渐成为主流, 文本表示需要具体问题具体分析, 技术和应用融合是推动力.

    • 神经结构搜索的研究进展综述

      2022, 33(1):129-149. DOI: 10.13328/j.cnki.jos.006306

      摘要 (3413) HTML (3136) PDF 7.60 M (7825) 评论 (0) 收藏

      摘要:近年来, 深度神经网络(DNNs)在许多人工智能任务中取得卓越表现, 例如计算机视觉(CV)、自然语言处理(NLP). 然而, 网络设计严重依赖专家知识, 这是一个耗时且易出错的工作. 于是, 作为自动化机器学习(AutoML)的重要子领域之一, 神经结构搜索(NAS)受到越来越多的关注, 旨在以自动化的方式设计表现优异的深度神经网络模型. 全面细致地回顾神经结构搜索的发展过程, 进行了系统总结. 首先, 给出了神经结构搜索的研究框架, 并分析每个研究内容的作用; 接着, 根据其发展阶段, 将现有工作划分为4个方面, 介绍各阶段发展的特点; 然后, 介绍现阶段验证结构搜索效果经常使用的数据库, 创新性地总结该领域的规范化评估标准, 保证实验对比的公平性, 促进该领域的长久发展; 最后, 对神经结构搜索研究面临的挑战进行了展望与分析.

    • 大规模图神经网络系统综述

      2022, 33(1):150-170. DOI: 10.13328/j.cnki.jos.006311

      摘要 (6469) HTML (5490) PDF 3.57 M (12203) 评论 (0) 收藏

      摘要:图神经网络(GNN)是一类基于深度学习的处理图域信息的方法, 它通过将图广播操作和深度学习算法结合, 可以让图的结构信息和顶点属性信息都参与到学习中, 在顶点分类、图分类、链接预测等应用中表现出良好的效果和可解释性, 已成为一种广泛应用的图分析方法. 然而现有主流的深度学习框架(如TensorFlow、PyTorch等)没有为图神经网络计算提供高效的存储支持和图上的消息传递支持, 这限制了图神经网络算法在大规模图数据上的应用. 目前已有诸多工作针对图结构的数据特点和图神经网络的计算特点, 探索了大规模图神经网络系统的设计和实现方案. 首先对图神经网络的发展进行简要概述, 总结了设计图神经网络系统需要面对的挑战; 随后对目前图神经网络系统的工作进行介绍, 从系统架构、编程模型、消息传递优化、图分区策略、通信优化等多个方面对系统进行分析; 最后使用部分已开源的图神经网络系统进行实验评估, 从精确度、性能、扩展性等多个方面验证这些系统的有效性.

    • 图分类研究综述

      2022, 33(1):171-192. DOI: 10.13328/j.cnki.jos.006323

      摘要 (4563) HTML (3978) PDF 6.79 M (7144) 评论 (0) 收藏

      摘要:图数据广泛存在于现实世界中, 可以自然地表示复合对象及其元素之间的复杂关联. 对图数据的分类是一个非常重要且极具挑战的问题, 在生物/化学信息学等领域有许多关键应用, 如分子属性判断, 新药发现等. 但目前尚缺乏对于图分类研究的完整综述. 首先给出图分类问题的定义和该领域的挑战; 然后梳理分析了两类图分类方法—基于图相似度计算的图分类方法和基于图神经网络的图分类方法; 接着给出了图分类方法的评价指标、常用数据集和实验结果对比; 最后介绍了图分类常见的实际应用场景, 展望了图分类领域的未来研究方向并对全文进行总结.

    • 小样本困境下的深度学习图像识别综述

      2022, 33(1):193-210. DOI: 10.13328/j.cnki.jos.006342

      摘要 (4583) HTML (3183) PDF 8.07 M (6775) 评论 (0) 收藏

      摘要:图像识别是图像研究领域的核心问题, 解决图像识别问题对人脸识别、自动驾驶、机器人等各领域研究都有重要意义. 目前广泛使用的基于深度神经网络的机器学习方法, 已经在鸟类分类、人脸识别、日常物品分类等图像识别数据集上达到了超过人类的水平, 同时越来越多的工业界应用开始考虑基于深度神经网络的方法, 以完成一系列图像识别业务. 但是深度学习方法极度依赖大规模标注数据, 这一缺陷极大地限制了深度学习方法在实际图像识别任务中的应用. 针对这一问题, 越来越多的研究者开始研究如何基于少量的图像识别标注样本来训练识别模型. 为了更好地理解基于少量标注样本的图像识别问题, 广泛地讨论了几种图像识别领域主流的少量标注学习方法, 包括基于数据增强的方法、基于迁移学习的方法以及基于元学习的方法, 通过讨论不同算法的流程以及核心思想, 可以清晰地看到现有方法在解决少量标注的图像识别问题上的优点和不足. 最后针对现有方法的局限性, 指出了小样本图像识别未来的研究方向.

    • 域名系统测量研究综述

      2022, 33(1):211-232. DOI: 10.13328/j.cnki.jos.006218

      摘要 (2091) HTML (2543) PDF 6.34 M (4332) 评论 (0) 收藏

      摘要:域名系统(domain name system, DNS)测量研究是深入理解DNS的重要研究方式. 从组件、结构、流量、安全4个方面对近30年 (1992–2019) 的DNS测量研究工作梳理出18个主题. 首先, 介绍组件测量, 组件有解析器和权威服务器两种, 解析器测量包括公共解析器、开放解析器、解析器缓存、解析器选择策略4个主题, 权威服务器包括性能、任播部署、托管、误配置4个主题. 其次, 阐述结构测量, 包括桩解析器与解析器的依赖结构、解析器间依赖结构、域名解析依赖结构3个主题. 然后, 描述流量测量, 包括查询流量特征、异常根查询流量、流量拦截共3个主题. 最后综述了安全测量, 包括DNSSEC代价与隐患、DNSSEC部署进展、加密DNS部署、恶意域名检测4个主题.

    • 链下通道路由算法综述

      2022, 33(1):233-253. DOI: 10.13328/j.cnki.jos.006219

      摘要 (2716) HTML (2052) PDF 9.44 M (3912) 评论 (0) 收藏

      摘要:链下通道网络是实现区块链系统性能提升的有效手段, 其中路由算法是保证链下通道网络长期高效、稳定运行的关键. 提出了链下通道网络层次化架构及路由算法基础模型; 从单路路由与多路路由两方面, 系统梳理了代表性路由算法及其发展过程; 从有效性、并发性、可扩展性、通道平衡、路由选择中心化、成本效益、隐私保护、吞吐量、处理延迟、成功率、搜索效率11个方面设计了链下通道路由算法评价体系, 对代表性路由算法进行了对比分析, 并探讨了未来研究趋势.

    • 基于网络轨迹的协议逆向技术研究进展

      2022, 33(1):254-273. DOI: 10.13328/j.cnki.jos.006303

      摘要 (2188) HTML (4107) PDF 8.23 M (4024) 评论 (0) 收藏

      摘要:协议逆向广泛应用于入侵检测系统、深度包检测、模糊测试、僵尸网络检测等领域. 首先给出了协议逆向工程的形式化定义和基本原理, 然后针对网络运行轨迹的协议逆向方法和工具从协议格式提取和协议状态机推断两个方面对现有的协议逆向方法进行了详细分析, 阐释其基本模块、主要原理和特点, 最后从多个角度对现有算法进行了比较, 对基于网络流量的协议逆向技术的发展趋势进行了展望和分析.

    • 网络行为仿真综述

      2022, 33(1):274-296. DOI: 10.13328/j.cnki.jos.006338

      摘要 (2255) HTML (4018) PDF 14.32 M (4948) 评论 (0) 收藏

      摘要:网络行为描述了网络上各类元素对象动态交互过程. 它以各类网络服务协议及应用为运行载体, 形成不断变化的丰富多样的网络行为, 反映出网络拓扑结构给定时间内网络上的场景特点. 网络行为仿真主要包括运行框架、背景流仿真、前景流仿真, 将生产网络环境下网络行为按需映射到测试网络环境, 提供一种按需灵活定制仿真再现能力. 网络仿真应用场景不断发展, 包括性能分析评估、产品和技术验证、网络入侵检测、网络攻防演练与研究发展等. 为总结现有研究成果和存在的不足, 分析未来发展趋势, 梳理了网络行为仿真的相关概念和研究框架, 从框架、背景流、前景流等技术层面总结了网络行为仿真的国内外研究现状, 并对相关商业产品和开源软件工具进行了系统地分析调研, 最后对网络行为仿真的未来发展进行了展望.

    • 基于RFID的无源感知机制研究综述

      2022, 33(1):297-323. DOI: 10.13328/j.cnki.jos.006344

      摘要 (2138) HTML (3487) PDF 9.09 M (3956) 评论 (0) 收藏

      摘要:随着物联网技术的飞速发展与广泛部署, 物联网领域的应用需求逐步从“万物互联”转变成“人-机-物”的感知融合. 在众多感知技术之中, 射频识别技术(radio frequency identification, RFID)作为物联网领域的核心技术之一, 由于标签的轻量级、可标记、易部署等特征, 成为“无源感知”的重要媒介. 为深入剖析无源感知的研究方法, 了解当前无源感知的研究进展, 以基于RFID的无源感知研究为主要切入点, 根据感知研究的一般流程, 从感知渠道、感知方法、感知范畴以及感知应用这4个层面对近年来基于RFID的无源感知研究工作进行阐述和分析. 我们着重在各个层面上分析相关技术的研究进展, 比较不同技术在感知应用中的优势和劣势, 总结当前阶段无源感知的主要研究趋势, 并对未来发展方向进行展望.

    • 区块链公链应用的典型安全问题综述

      2022, 33(1):324-355. DOI: 10.13328/j.cnki.jos.006280

      摘要 (3218) HTML (3026) PDF 12.18 M (5752) 评论 (0) 收藏

      摘要:区块链作为互联网金融的颠覆性创新技术, 吸引学术研究和工程应用领域广泛关注, 并被持续推广应用到各种行业领域中. 以公有链为代表的区块链系统具有弱中心化、信任共识、平台开放、系统自治、用户匿名、数据完整等特点, 在缺乏集中可信的分布式场景中实现可信数据管理和价值交易. 但区块链作为新兴信息技术, 由于自身机制和周边设施不够完善、用户安全观念不够成熟等原因, 也面临安全威胁和挑战. 本文首先介绍了区块链技术, 回顾其面临的安全风险; 其次以比特币和以太坊两个典型系统为例, 剖析了针对面向代币交易和应用的区块链系统的各类安全威胁以及应对方法; 接着分析了钱包交易所等区块链周边设施和区块链用户的安全隐患; 最后对文中安全问题进行了分类总结, 提出可行技术线路和防御方法, 展望当前区块链安全的研究热点和发展趋势.

    • 基于机器学习的三维场景高度真实感绘制方法综述

      2022, 33(1):356-376. DOI: 10.13328/j.cnki.jos.006334

      摘要 (2142) HTML (2804) PDF 12.42 M (4632) 评论 (0) 收藏

      摘要:目前, 电影、动漫、游戏等产业对真实感绘制的需求越来越高, 而三维场景高度真实感绘制通常需要耗费大量的计算时间和存储空间来计算全局光照, 如何在保证绘制质量的前提下提升绘制速度依然是图形学领域面临的核心和热点问题之一. 数据驱动的机器学习方法开辟了一种新的研究思路, 近年来研究者将多种高度真实感绘制方法映射为机器学习问题, 从而大大降低了计算成本. 总结分析了近年来基于机器学习的高度真实感绘制方法的研究进展, 具体包括: 基于机器学习的全局光照优化计算方法、基于深度学习的物理材质建模方法、基于深度学习的参与性介质优化绘制方法、基于机器学习的蒙特卡洛降噪方法等. 详细论述了各种绘制方法与机器学习方法的映射思路, 归纳总结了网络模型以及训练数据集的构建方式, 并在绘制质量、绘制时间、网络能力等多个方面开展了对比分析. 最后, 本文提出了机器学习和真实感绘制相结合的可能思路和未来展望.

当期目录


文章目录

过刊浏览

年份

刊期

联系方式
  • 《软件学报 》
  • 主办单位:中国科学院软件研究所
                     中国计算机学会
  • 邮编:100190
  • 电话:010-62562563
  • 电子邮箱:jos@iscas.ac.cn
  • 网址:https://www.jos.org.cn
  • 刊号:ISSN 1000-9825
  •           CN 11-2560/TP
  • 国内定价:70元
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号