• 2025年第36卷第1期文章目次
    全 选
    显示方式: |
    • 预训练模型在软件工程领域应用研究进展

      2025, 36(1):1-26. DOI: 10.13328/j.cnki.jos.007143 CSTR: 32375.14.jos.007143

      摘要 (927) HTML (212) PDF 10.70 M (1867) 评论 (0) 收藏

      摘要:近年来深度学习在软件工程领域任务中取得了优异的性能. 众所周知, 实际任务中优异性能依赖于大规模训练集, 而收集和标记大规模训练集需要耗费大量资源和成本, 这限制了深度学习技术在实际任务中的广泛应用. 随着深度学习领域预训练模型(pre-trained model, PTM)的发布, 将预训练模型引入到软件工程(software engineering, SE)任务中得到了国内外软件工程领域研究人员的广泛关注, 并得到了质的飞跃, 使得智能化软件工程进入了一个新时代. 然而, 目前没有研究提炼预训练模型在软件工程领域的成功和机遇. 为阐明这一交叉领域的工作 (pre-trained models for software engineering, PTM4SE), 系统梳理当前基于预训练模型的智能软件工程相关工作, 首先给出基于预训练模型的智能软件工程方法框架, 其次分析讨论软件工程领域常用的预训练模型技术, 详细介绍使用预训练模型的软件工程领域下游任务, 并比较和分析预训练模型技术这些任务上的性能. 然后详细介绍常用的训练和微调PTM的软件工程领域数据集. 最后, 讨论软件工程领域使用PTM面临的挑战和机遇. 同时将整理的软件工程领域PTM和常用数据集发布在https://github.com/OpenSELab/PTM4SE.

    • 嵌入式系统的需求描述综述

      2025, 36(1):27-46. DOI: 10.13328/j.cnki.jos.007157 CSTR: 32375.14.jos.007157

      摘要 (583) HTML (194) PDF 2.47 M (1640) 评论 (0) 收藏

      摘要:随着嵌入式系统的广泛应用, 其需求正变得越来越复杂, 需求分析成为嵌入式系统开发的关键阶段, 如何准确地建模和描述需求成为首要问题. 系统地调研嵌入式系统的需求描述, 并进行全面的比较分析, 以便更深入地理解嵌入式系统需求的核心关注点. 首先采用系统化文献综述方法, 对1979年1月–2023年11月间发表的相关文献进行识别、筛选、汇总和分析. 通过自动检索和滚雪球等检索过程, 筛选出150篇与主题密切相关的文献, 力求文献综述的全面性. 其次, 从需求描述关注点、需求描述维度、需求分析要素等方面, 分析现有嵌入式需求描述语言的表达能力. 最后, 总结现有嵌入式系统软件需求描述所面临的挑战, 并针对嵌入式软件智能合成任务, 提出对嵌入式系统需求描述方法表达能力的要求.

    • 服务器无感知计算系统性能优化技术研究综述

      2025, 36(1):47-78. DOI: 10.13328/j.cnki.jos.007190 CSTR: 32375.14.jos.007190

      摘要 (349) HTML (133) PDF 9.19 M (1452) 评论 (0) 收藏

      摘要:服务器无感知计算是新兴的云计算模式, 它基于“函数即服务(FaaS)”的范式, 以函数为部署和调度的基本单位, 为用户提供大规模并行和自动伸缩的函数执行服务, 且无需用户管理底层资源. 对于用户, 服务器无感知计算能够帮助他们摆脱集群底层基础设施管理的负担, 专注于业务层的开发和创新; 对于服务提供商, 服务器无感知计算将应用分解为细粒度的函数, 极大地提高了调度效率和资源利用率. 显著的优势让服务器无感知计算迅速吸引了业界的注意, 然而, 服务器无感知计算与传统云计算迥然不同的计算模式以及对任务各方面的严格限制给应用的迁移带来了诸多障碍, 各种越来越复杂的任务也对服务器无感知计算的性能提出了越来越高的要求, 服务器无感知计算的性能优化成为一个重要的研究课题. 从4个方面对服务器无感知计算系统性能优化技术的相关研究工作进行梳理和综述, 并介绍现有的系统实现. (1)介绍面向典型任务的优化技术, 包括任务适配和针对特定任务的系统优化; (2)综述沙箱环境的优化工作, 包括沙箱方案和冷启动优化技术, 它们是决定函数运行速度的核心; (3)概括I/O和通信技术的优化, 它们是服务器无感知计算应用程序的主要性能瓶颈; (4)简述相关的资源调度技术, 包括面向平台和面向用户的调度策略, 它们决定着系统的资源利用率和任务的执行效率. 最后, 总结当前服务器无感知计算性能优化技术所面临的问题和挑战, 并展望未来可能的发展方向.

    • 面向大规模图像检索的哈希学习综述

      2025, 36(1):79-106. DOI: 10.13328/j.cnki.jos.007141 CSTR: 32375.14.jos.007141

      摘要 (527) HTML (159) PDF 9.28 M (1608) 评论 (0) 收藏

      摘要:随着互联网空间中图像数据的爆发式增长和图像应用领域的拓宽, 大规模图像检索的需求与日俱增. 哈希学习为大规模图像检索提供显著的存储与检索效率, 并成为近年来一个研究热点. 现有哈希学习综述存在着时效性弱与技术路线不清晰的问题, 即多总结5–10年前的研究成果, 且较少总结哈希学习算法各组成部分间的关联关系. 鉴于此, 通过总结近20年公开发表的哈希学习文献, 对面向大规模图像检索的哈希学习进行系统的综述性研究. 首先, 介绍哈希学习的技术路线和哈希学习算法的主要组成部分, 包括损失函数、优化策略及样本外扩展映射. 其次, 将面向图像检索的哈希学习算法分为无监督哈希方法和监督哈希方法两类, 并分别梳理每类方法的研究现状和演化过程. 然后, 介绍哈希学习算法评估通用的图像数据集与评估指标, 并通过对比实验分析部分经典算法的性能. 最后, 结合哈希学习的局限性与新挑战对其发展前景进行阶段性总结与展望.

    • 混合博弈问题的求解与应用综述

      2025, 36(1):107-151. DOI: 10.13328/j.cnki.jos.007212 CSTR: 32375.14.jos.007212

      摘要 (426) HTML (139) PDF 15.07 M (1323) 评论 (0) 收藏

      摘要:近年来, 随着人工智能技术在序贯决策和博弈对抗等问题的应用方面取得了飞速发展, 围棋、游戏、德扑和麻将等领域取得了巨大的进步, 例如, AlphaGo、OpenAI Five、AlphaStar、DeepStack、Libratus、Pluribus和Suphx等系统都在这些领域中达到或超过人类专家水平. 这些应用集中在双人、两队或者多人的零和博弈问题中, 而对于混合博弈问题的研究缺乏实质性的进展与突破. 区别于零和博弈, 混合博弈需要综合考虑个体收益、集体收益和均衡收益等诸多目标, 被广泛应用于公共资源分配、任务调度和自动驾驶等现实场景. 因此, 对于混合博弈问题的研究至关重要. 通过梳理当前混合博弈领域中的重要概念和相关工作, 深入分析国内外研究现状和未来发展方向. 具体地, 首先介绍混合博弈问题的定义与分类; 其次详细阐述博弈解概念和求解目标, 包含纳什均衡、相关均衡、帕累托最优等解概念, 最大化个体收益、最大化集体收益以及兼顾公平等求解目标; 接下来根据不同的求解目标, 分别对博弈论方法、强化学习方法以及这两种方法的结合进行详细探讨和分析; 最后介绍相关的应用场景和实验仿真环境, 并对未来研究的方向进行总结与展望.

    • 文档级神经机器翻译综述

      2025, 36(1):152-183. DOI: 10.13328/j.cnki.jos.007217 CSTR: 32375.14.jos.007217

      摘要 (314) HTML (117) PDF 10.34 M (1446) 评论 (0) 收藏

      摘要:机器翻译(machine translation, MT)研究旨在构建一个自动转换系统, 将给定源语言序列自动地转换为具有相同语义的目标语言序列. 由于机器翻译广阔的应用场景, 使其成为自然语言理解领域乃至人工智能领域的一个重要的研究方向. 近年来, 端到端的神经机器翻译(neural machine translation, NMT)方法显著超越了统计机器翻译(statistical machine translation, SMT)方法, 成为目前机器翻译研究的主流方法. 然而, 神经机器翻译系统通常以句子为翻译单位, 在面向文档的翻译场景中, 将文档中每个句子独立地进行翻译, 会因脱离文档的篇章语境引起一些篇章级的错误, 如词语错翻、句子间不连贯等. 因此将文档级的信息融入到翻译的过程中去解决跨句的篇章级错误是更加自然和合理的做法, 文档级的神经机器翻译(document-level neural machine translation, DNMT)的目标正是如此, 成为机器翻译研究的热门方向. 调研了近年来在文档级神经机器翻译研究方向的主要工作, 从篇章评测方法、使用的数据集和模型方法等方面系统地对当前研究工作进行了归纳与阐述, 目的是帮助研究者们快速了解文档级神经机器翻译研究现状以及未来的发展和研究方向. 同时在文中也阐述了在文档级神经机器翻译的一些展望、困难和挑战, 希望能带给研究者们一些启发.

    • 无线时间敏感网络技术综述

      2025, 36(1):184-202. DOI: 10.13328/j.cnki.jos.007148 CSTR: 32375.14.jos.007148

      摘要 (315) HTML (119) PDF 8.89 M (2305) 评论 (0) 收藏

      摘要:由IEEE 802.1任务组开发的时间敏感网络标准可以用来构建高可靠、低延迟、低抖动的以太网, 将时间敏感网络扩展到无线领域也是目前许多工作的研究重点. 与传统的有线通信相比, 无线的时间敏感网络不仅可以实现高可靠和低时延通信, 还具有更高的灵活性、更强的移动性以及更低的布线和维护成本等优点. 因此, 在面对未来无人驾驶、协作机器人、远程医疗控制等新兴应用时, 无线时间敏感网络被认为是一种十分有前景的技术. 无线网络一般可以分为基于基础设施的无线网络和无基础设施的无线网络, 而后者基于移动性还可以分为两类: 移动自组织网络和无线传感网络, 因此主要从这3种网络类型出发, 对其应用场景、相关技术、路由协议以及高可靠低时延传输进行了调研与综述.

    • 面向APT攻击的溯源和推理研究综述

      2025, 36(1):203-252. DOI: 10.13328/j.cnki.jos.007162 CSTR: 32375.14.jos.007162

      摘要 (532) HTML (57) PDF 12.58 M (477) 评论 (0) 收藏

      摘要:高级可持续性威胁(advanced persistent threat, APT)是一种新型网络攻击, 具有极强的组织性、隐蔽性、持续性、对抗性和破坏性, 给全球网络安全带来严重危害. 传统APT攻击防御倾向于构建模型检测攻击的恶意性或识别家族类别, 以被动防御为主, 缺乏全面及深入地梳理APT攻击溯源和推理领域的工作. 基于此, 围绕APT攻击的溯源和推理的智能化方法开展综述性研究. 首先, 提出APT攻击防御链, 有效地将APT攻击检测、溯源和推理进行区分和关联; 其次, 详细比较APT攻击检测4个任务的相关工作; 然后, 系统总结面向区域、组织、攻击者、地址和攻击模型的APT攻击溯源工作; 再次, 将APT攻击推理划分为攻击意图推理、攻击路径感知、攻击场景还原、攻击阻断和反制这4个方面, 对相关研究进行详细总结和对比; 最后, 讨论APT攻击防御领域的热点主题、发展趋势和挑战.

    • Tor被动流量分析综述

      2025, 36(1):253-288. DOI: 10.13328/j.cnki.jos.007182 CSTR: 32375.14.jos.007182

      摘要 (116) HTML (55) PDF 8.66 M (241) 评论 (0) 收藏

      摘要:随着网络的蓬勃发展, 用户隐私正面临着前所未有的挑战. 人们开发出多种匿名通信系统来保护隐私, 第2代洋葱路由Tor (the second-generation onion router)是目前最为广泛使用的匿名通信系统. 然而, 卓越的匿名性也使之成为不法分子犯罪的温床, 如今Tor中充斥着非法交易、网络犯罪等. Tor被动流量分析通过被动观察网络流量对Tor进行去匿名化, 已成为最热门的去匿名化技术. 从Tor与流量分析基本概念出发, 介绍Tor被动流量分析技术的应用场景与威胁模型. 按照技术类型将现有工作分为流量分类技术与流关联技术, 依据分析流程分别对比其流量采集方法、特征提取方法、使用算法. 最后探讨当前研究面临的主要挑战与未来可能的研究趋势.

    • 多路径传输技术研究综述

      2025, 36(1):289-320. DOI: 10.13328/j.cnki.jos.007193 CSTR: 32375.14.jos.007193

      摘要 (431) HTML (81) PDF 8.04 M (2204) 评论 (0) 收藏

      摘要:多路径传输技术是指通过设备上的多个网络接口, 在通信双方建立多条传输路径, 实现带宽聚合、负载均衡、路径冗余, 增加传输的吞吐量, 提高可靠性. 多路径传输技术凭借其上述优势, 已被广泛应用于服务器、终端和数据中心等场景, 是网络体系结构和传输技术研究的重要组成, 具有重要研究价值和意义. 为此, 从概念、核心机制等方面, 系统梳理了多路径传输技术. 首先概述了多路径传输的基本概念、标准化进程以及应用价值. 其次, 阐述多路径传输技术的核心机制, 包括拥塞控制、报文调度、路径管理、重传机制、安全机制, 以及面向特定应用的机制设计. 对每种机制的分类方法、主要研究成果给予了总结和评述, 分析总结了不同机制的优缺点与发展方向. 最后, 探讨了多路径传输技术研究面临的挑战, 展望了未来研究方向.

    • 客户端独立的IP地理定位研究综述

      2025, 36(1):321-340. DOI: 10.13328/j.cnki.jos.007194 CSTR: 32375.14.jos.007194

      摘要 (294) HTML (76) PDF 8.65 M (1087) 评论 (0) 收藏

      摘要:准确、快速地获取IP地理定位信息对于各种网络应用而言至关重要. IP地理定位指将互联网实体的IP地址转换为其地理位置的技术. 然而, 互联网规模的迅速扩大和互联网应用的快速发展, 给IP地理定位研究带来了巨大的挑战. 首先, 复杂的网络结构和网络环境导致IP定位技术的精确度远远无法满足实际的应用需求. 其次, IP地理定位在各个领域的作用日益凸显, 如何精准、高效、可靠地计算互联网主机的地理位置正在成为各行关注的焦点. 因此, 通过设备的IP地址对其进行地理定位以支撑复杂的上层应用尤为重要. 自2001年以来, 学术界和工业界围绕上述问题开展了大量的研究. 系统地梳理客户端独立的IP地理定位方面的相关工作, 系统地整理基于网络测量的IP地理定位研究分类方法. 根据定位数据是否由主动测量产生, 将相关研究分为主动的IP定位技术、被动的IP定位技术和主被动结合的IP定位技术. 进一步, 对每一类方法进行更细粒度的分类并分析其主要的优缺点. 在此基础上, 总结IP地理定位领域的最新进展和研究挑战, 并展望其未来发展方向.

    • 智能网联汽车的车载网络攻防技术研究进展

      2025, 36(1):341-370. DOI: 10.13328/j.cnki.jos.007196 CSTR: 32375.14.jos.007196

      摘要 (548) HTML (77) PDF 10.18 M (1786) 评论 (0) 收藏

      摘要:随着人工智能和5G技术在汽车行业的应用, 智能网联汽车应运而生, 它是一种由众多来自不同供应商的电子控制单元(ECU)组成的复杂分布式异构系统, 通过以CAN为代表的车载网络协议交互协同控制各ECU. 然而, 攻击者可能通过各种接口攻击智能网联汽车, 渗透到车载网络, 再攻击车载网络及其各组成部分如ECU. 因此, 智能网联汽车的车载网络安全成为近些年车辆安全研究的焦点之一. 在介绍智能网联汽车整体结构、ECU、CAN总线和车载诊断协议等基础之上, 首先总结了目前车载网络协议的逆向工程技术进展, 逆向工程的目标是获取汽车行业通常不公开的车载网络协议实现细节, 也是实施攻击和防御的前提条件. 然后从车载网络攻、防两个角度展开: 一方面概括了车载网络攻击向量及主要攻击技术, 包括通过物理访问和远程访问方式实施的攻击技术, 以及针对ECU和CAN总线实施的攻击技术; 另一方面, 讨论了车载网络现有的防御技术, 包括基于特征工程和机器学习方法的车载网络入侵检测和基于密码学方法的车载网络协议安全增强技术. 最后展望了未来的研究方向.

    • 广域确定性网络传输技术综述

      2025, 36(1):371-398. DOI: 10.13328/j.cnki.jos.007231 CSTR: 32375.14.jos.007231

      摘要 (643) HTML (50) PDF 10.66 M (304) 评论 (0) 收藏

      摘要:广域网作为连接新业务、新基础设施和各类新型应用的纽带, 已成为21世纪最重要的基础设施之一. 近年来, 数据量爆炸性增长, 伴随着基于广域网的大模型、数字经济、元宇宙和全息社会等新型应用形态的持续涌现, 以及东数西算、算力网络和数据场等新型业务架构的出现, 业务对广域网的数据传输服务质量提出了越来越高的要求. 以时延为例, 广域网不仅需要提供及时的服务, 还需要提供准时的服务, 即时延成为必须满足的确定性指标. 因此, 广域确定性网络作为广域网的新范式应运而生. 系统地综述确定性网络的内涵, 回顾传统确定性网络相关技术发展脉络, 介绍广域确定性网络的新应用, 探讨广域网确定性网络传输具有的新特征以及面临的新挑战, 并提出广域确定性网络的新目标. 基于上述新应用、新特征、新挑战和新目标, 详细总结当前广域确定性网络领域的主要研究进展, 并给出未来研究的方向. 期望能为广域确定性网络领域的研究提供参考和帮助.

    • 数据库管理系统模糊测试技术研究综述

      2025, 36(1):399-423. DOI: 10.13328/j.cnki.jos.007048 CSTR: 32375.14.jos.007048

      摘要 (634) HTML (77) PDF 9.27 M (1949) 评论 (0) 收藏

      摘要:数据库管理系统(DBMS)是用于高效存储、管理、分析数据的基础软件, 在现代数据密集型应用中起着举足轻重的作用. 数据库管理系统中存在的漏洞则对数据的安全性和应用的正常运行造成巨大威胁. 模糊测试是当前最为流行的动态漏洞检测技术之一, 它已经被应用于分析DBMS, 并发现许多漏洞. 分析DBMS的测试需求和难点, 提出对DBMS进行模糊测试的一般框架, 同时分析DBMS模糊测试工具面临的挑战和需要支持的维度; 接着从挖掘不同类型漏洞的角度介绍典型的DBMS模糊测试工具; 然后总结包括SQL表达式合成、代码覆盖追踪、测试准则构建在内的DBMS模糊测试的关键技术. 接着就测试的覆盖率, 生成测试用例的语法语义正确性和漏洞的发现能力对当前的几个流行模糊测试工具进行评估. 最后, 讨论当前DBMS模糊测试技术研究和实践中面临的问题, 并对未来的研究方向进行展望.

    • HTAP 评测基准的评测能力综述

      2025, 36(1):424-445. DOI: 10.13328/j.cnki.jos.007225 CSTR: 32375.14.jos.007225

      摘要 (202) HTML (79) PDF 16.62 M (997) 评论 (0) 收藏

      摘要:对数据库系统即时修改数据的高效实时分析需求推动了数据库系统向同时支持 OLTP 业务和 OLAP 业务两种场景的 HTAP 数据库系统的快速发展. 面对众多的HTAP数据库系统, 为了推动HTAP数据库系统的公平比较和健康发展, 定义和实现相应的评测基准来评估HTAP数据库系统的新特性至关重要. 首先, 分析HTAP数据库系统的关键特征并抽象总结HTAP数据库系统实现的关键技术. 然后, 提炼出HTAP数据库系统的设计难点和构建HTAP 评测基准的挑战, 并基于此提出HTAP评测基准应考虑的设计维度, 包括数据生成、负载生成、评价指标和一致性模型支持性. 对比现有HTAP 评测基准在设计维度和实现技术上的差异, 总结评测基准在不同设计维度上的优劣. 此外, 运行已公开的典型评测基准, 展示并分析它们对HTAP数据库系统关键特征的评测能力以及对不同HTAP数据库系统的横向对比的支持能力. 最后, 总结对HTAP 评测基准的能力需求和未来的一些研究方向, 指出语义一致的负载控制和新鲜数据访问度量是HTAP数据库系统评测基准定义的关键问题.

    • 云多租数据库资源规划调度技术综述

      2025, 36(1):446-468. DOI: 10.13328/j.cnki.jos.007240 CSTR: 32375.14.jos.007240

      摘要 (100) HTML (55) PDF 7.65 M (220) 评论 (0) 收藏

      摘要:云多租数据库具有按需付费、按需扩展、免部署、高可用、自带运维能力、资源共享等诸多优势, 可以大大降低用户使用数据库服务的成本. 现在越来越多的企业和个人开始在数据库即服务(DaaS)平台托管他们的数据库服务. DaaS平台需要按照用户服务水平协议(SLA)为诸多租户提供服务, 同时也需要保障平台收益. 但是, 由于租户及其负载具有动态性、异构性和竞争性等特点, 如何在遵循SLA的同时根据负载自适应规划调度资源同时兼顾平台收益对于DaaS平台来说是一件极具挑战性的工作. 针对云多租数据库中比较常见的类型, 如关系型数据库, 详细分析了当前云多租数据库资源规划调度技术所面临的挑战, 提炼了关键科学问题, 给出了技术框架, 然后从资源规划调度技术、资源预估技术、资源弹性伸缩技术以及数据库资源规划调度工具等4个方面对现有研究工作进行了总结和分析, 并且展望了未来的研究方向.

当期目录


文章目录

过刊浏览

年份

刊期

联系方式
  • 《软件学报 》
  • 主办单位:中国科学院软件研究所
                     中国计算机学会
  • 邮编:100190
  • 电话:010-62562563
  • 电子邮箱:jos@iscas.ac.cn
  • 网址:https://www.jos.org.cn
  • 刊号:ISSN 1000-9825
  •           CN 11-2560/TP
  • 国内定价:70元
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号