2023, 34(4):1523-1542. DOI: 10.13328/j.cnki.jos.006702 CSTR:
摘要:传统的基于Pareto支配关系的多目标进化算法(MOEA)难以有效求解高维多目标优化问题(MaOP). 提出一种利用PBI效用函数的双距离构造的支配关系, 且无需引入额外的参数. 其次, 利用双距离定义了一种多样性保持方法, 该方法不仅考虑了解个体的双距离, 而且还可以根据优化问题的目标数目自适应地调整多样性占比, 以较好地平衡高维目标解群的收敛性和多样性. 最后, 将基于双距离构造的支配关系和多样性保持方法嵌入到NSGA-II算法框架中, 设计了一种基于双距离的高维多目标进化算法MaOEA/d2. 该算法与其他5种代表性的高维多目标进化算法一同在5-、10-、15-和20-目标的DTLZ和WFG基准测试问题上进行了IGD和HV性能测试, 结果表明, MaOEA/d2算法具有较好的收敛性和多样性. 由此表明, MaOEA/d2算法是一种颇具前景的高维多目标进化算法.
2023, 34(4):1543-1569. DOI: 10.13328/j.cnki.jos.006682 CSTR:
摘要:工作流可满足性是业务安全规划的基本问题, 正在面临高资源配比(资源数n显著大于步骤数k)造成的性能挑战. 在资源独立约束下, 其最高效求解途径是模式空间上的增量回溯法IPB. 为克服结点真实性验证的性能瓶颈, 它增量计算模式k指派(二部)图及其(左完备)匹配, 分别需要O(kn)和O(k2)时间. 利用父子模式的原子差异增量计算完全指派图, 只需O(n)时间, 特别是其实际性能, 将随模式块规模增长迅速提高. 但该图的O(kn)规模导致了同样的增量匹配时间. 进而引入完备k核心匹配概念, 证明其存在性等价于左完备匹配, 且其增量计算时间为O(k2). 由此, 建立了时间复杂度更低的最小增量模式回溯法. 在含互斥和两种全局值势约束而授权比例约为1/4的扩展公开实例集上进行实验, 结果表明: 当n/k=10(及n/k=100), 而k变化时, 该方法较IPB有平均超过2(及5)倍、最低1.5(及2.9)倍的性能优势; 当k=18(及k=36), 而n/k=2~4096(及n/k=2~2048)时, 该方法有平均超过2.6(及3.6)倍优势; 而较2021年Minizinc挑战赛的冠军求解器Google OR-Tools CP-SAT, 该方法最低有超过3倍优势.
2023, 34(4):1570-1593. DOI: 10.13328/j.cnki.jos.006688 CSTR:
摘要:异构架构逐渐成为高性能计算领域的主流架构, 但相较于同构多核架构, 其硬件结构及存储层次更为复杂, 程序编写更为困难. 先进的优化编译器可以协助程序开发人员实现更为高效的代码, 降低程序开发复杂度. 多面体编译模型通过抽象分析将程序抽象成空间多面体表示形式, 能够将多种循环变换与硬件映射相结合, 并面向特定体系结构生成相应的代码. 设计实现了一个面向国产申威异构架构的并行代码自动生成系统, 采用“源-源”编译模式, 基于多面体编译模型实现. 系统针对申威异构架构特点将程序计算过程进行硬件部署, 同时实现数据传输与内存空间的自动管理. 实验基于Polybench测试集中线性代数相关用例进行测试. 结果表明, 利用代码自动生成系统生成的异构并行代码能够在申威异构平台上正确运行, 并能够有效发挥申威异构平台的性能, 基于申威异构平台利用64线程加速计算的平均加速比达到了539.16倍.
2023, 34(4):1594-1612. DOI: 10.13328/j.cnki.jos.006691 CSTR:
摘要:软件崩溃是一种严重的软件缺陷, 可导致软件终止运行. 因此, 对软件崩溃的测试在软件迭代的过程中极为重要. 近年来, 模糊测试技术(如AFL)由于可以自动化生成大量的测试输入来触发软件崩溃, 被广泛用于软件测试中. 然而, 通过该技术产生的导致软件崩溃的测试输入中, 大部分崩溃的触发原因都是重复的, 因此软件开发人员需要对测试输入进行分类, 带来了许多冗余工作. 目前, 测试输入分类已经有很多自动化方法, 主要包括基于程序修复的分类算法和基于软件崩溃信息的分类算法. 前者通过对程序在语义上进行分析, 在运行时通过在程序中替换修复模板后重新运行测试输入, 进而对输入分类. 因为此方法需要人为地对于软件崩溃编写修复模板, 所以其分类的效率与修复模板的质量存在很大联系; 且由于需要先修复崩溃、再对崩溃做分类, 影响了软件崩溃的修复效率. 采用后者的思想, 提出了一种轻量而高效的利用软件崩溃信息的测试输入分类算法CICELY. 其在软件崩溃点堆栈信息分类的算法基础上, 在分析软件崩溃点堆栈时引入了动态链接库信息, 通过区分系统动态链接库与用户动态链接库, 结合用户代码位置信息, 得到用户关注的函数集合, 以在分类时以用户函数为基准对崩溃进行界定. 最后, 分别将CICELY与几种基于程序修复的分类算法和基于软件崩溃信息的流行分类工具进行了比较, 实验测试的数据集共计19个项目、42组测试集. 在与基于软件崩溃信息的分类工具Honggfuzz, CERT BFF在相同数据集上比较时, CICELY在分类结果的组数上比上述二者减少了2112.89%和135.05%, 说明CICELY在同类算法上的实验效果有较大提升, 具有更高的精确性. 在与基于程序修复的分类算法“语义崩溃分类”用其论文中提供的测试数据集进行比较时, CICELY比“语义崩溃分类”的分组结果差4.42%; 在由对应了多个崩溃的测试输入所组成的测试集上实验时, CICELY比“语义崩溃分类”分组的重复度高了3%. 但是语义崩溃分类只能对于空指针解引用和缓冲区溢出这两种崩溃输入导致的崩溃进行分类, CICELY不受这样的限制.
2023, 34(4):1613-1629. DOI: 10.13328/j.cnki.jos.006697 CSTR:
摘要:手机用户提交的App评论为开发者提供了一个了解用户满意度的沟通渠道. 许多用户通常使用“send a video”和“crash”等关键短语来描述有缺陷的功能(即用户操作)和App的异常行为(即异常行为), 而这些短语可能会与其他琐碎信息(如用户的抱怨)一起交杂在评论文本中. 掌握这些细粒度信息可以帮助开发者理解来自用户的功能需求或缺陷报告, 进而有利于提升App的质量. 现有的基于模式的目标短语提取方法只能对评论的高层主题/方面进行总结, 并且由于对评论的语义理解不足, 短语提取的性能较差. 提出了一种语义感知的细粒度App评论缺陷挖掘方法(Arab), 来提取用户操作和异常行为, 并挖掘两者之间的关联关系. 设计了一种新颖的用于提取细粒度目标短语的神经网络模型, 该模型将文本描述和评论属性相结合, 能更好地建模评论的语义. Arab还根据语义关系对提取的短语进行聚类, 并将用户操作和异常行为之间的关联关系进行了可视化. 使用6个App的3 426条评论进行评估实验, 实验结果证实了Arab在短语提取方面的有效性. 进一步使用Arab对15个热门App的301 415条评论进行了案例研究, 以探索其潜在的应用, 并验证其在大规模数据上的实用性.
2023, 34(4):1630-1649. DOI: 10.13328/j.cnki.jos.006701 CSTR:
摘要:自动化测试工具是安卓应用质量保障的主要手段. 随着安卓版本多样性、底层硬件差异性(碎片化)以及逻辑复杂性增加, 自动化测试迎来新的挑战. 为解决这些问题, 近年来, 业界开发出大量自动化测试工具. 但是现有工具数量多, 并且测试重点多样, 测试人员选择工具时存在一定的困扰. 为帮助测试人员选择最佳测试工具, 实现对自动化测试工具的统一评估, 提出了面向安卓自动化测试工具多特征综合评估方法(comprehensive evaluation of Android automated testing, CEAT), 并将其实现为便于测试人员使用的平台. CEAT在引入测试领域广泛接受的3个评估指标, 即代码覆盖率、异常检出率、融合多版本兼容度得分的基础上, 进一步基于变异测试的思想引入变异杀死率, 并从用户体验出发引入UI控件覆盖率. 以上5个指标构成CEAT整个体系, 从而实现安卓自动化测试工具的综合多维评估. 为验证CEAT的效果, 生成了1 089个变异应用的待测应用集, 在包含6个移动设备的真机集群中部署实验, 对5个自动化测试工具适配并执行5 040次测试任务. 最终结果表明: i) 5个指标从不同角度对自动化测试工具进行评估, 更加多维地反映不同工具的测试效果, 验证了CEAT的有效性; ii) CEAT支持测试人员为5个指标分配不同的权重, 根据实际测试需求得到综合评估结果, 具有一定的灵活性; iii) CEAT可自动改造APP获得变异应用, 同时为工具设置特定平台用于测试, 操作具备简单性. CEAT可以有效地根据不同测试需求为测试人员选择最佳的安卓自动化测试工具提供参考依据.
2023, 34(4):1650-1665. DOI: 10.13328/j.cnki.jos.006719 CSTR:
摘要:目前, 在代码保护技术研究领域, 传统的混淆方法具有明显的混淆特征, 分析人员可根据特征对其进行定制化的去混淆处理. 为此, 提出了一种基于分片融合的代码保护技术, 通过在源代码层面将目标代码按照语法规则进行代码分片,依据执行顺序与语法规则,将分片插入另一程序的不同位置, 在修复函数调用过程与数据关系后, 形成可正常运行两个代码功能的融合后代码. 在实验部分, 对混淆后的代码, 从运行效率、代码复杂度影响、代码相似性这3个维度, 与其他混淆技术进行对比. 从测试结果可以看出: 基于分片融合的代码隐式混淆技术能够有效地模糊代码语义, 改变控制流特征, 且没有明显的混淆特征. 因此, 融合技术在对抗多种相似性对比算法的能力上有明显优势.
2023, 34(4):1666-1694. DOI: 10.13328/j.cnki.jos.006721 CSTR:
摘要:近年来, 群智化软件开发已被学术和工业广泛关注. 与传统方法相比, 群智化软件开发最大化利用全球开发者资源完成复杂的发展任务, 有效降低开发成本并提高发展效率. 考虑将推荐技术引入开发者和任务的匹配问题中, 即向软件开发者推荐合适的软件开发任务. 考虑从两方面解决该问题: 一方面, 开发人员的任务选择与兴趣偏好的变化有关, 因此需要准确捕获. 另一方面, 软件开发任务与传统商品或其他内容相比具有专业特性, 只有相应技能的人才能完成和竞争性质的平台更多, 所以开发者也会考虑是否其在众多竞争对手中有较高的评分. 因此, 研究并完成以下工作: 对开发者建模时考虑其动态偏好和竞争力并定义相关的参数指标. 提出一个两阶段的群智化软件任务推荐模型: 第1阶段使用基于注意力机制的长短期记忆神经网络预测开发者当前的动态偏好, 并利用相似度从大量候选任务中筛选出符合偏好的Top-N任务; 第2阶段利用开发者的竞争力, 使用基于差分进化算法的极端梯度提升方法预测开发者在第1阶段任务上的评分, 并按照评分高低向开发者推荐Top-K任务. 为了验证其有效性, 进行了一系列的实验与已有方法作对比. 实验结果表明, 所提出的模型在群智化软件任务推荐上有显著优势.
2023, 34(4):1695-1710. DOI: 10.13328/j.cnki.jos.006723 CSTR:
摘要:代码摘要通过生成源代码片段的简短自然语言描述, 可帮助开发人员理解代码并减少文档工作. 近期, 关于代码摘要的研究工作主要采用深度学习模型, 这些模型中的大多数都在由独立代码摘要对组成的大型数据集上进行训练. 尽管取得了良好的效果, 这些工作普遍忽略了代码片段和摘要的项目级上下文信息, 而开发人员在编写文档时往往高度依赖这些信息. 针对该问题, 研究了一种与开发者行为和代码摘要工具实现更加一致的代码摘要场景——项目级代码摘要, 其中, 创建了用于项目特定代码摘要的数据集, 该数据集包含800k方法摘要对及其生命周期信息, 用于构建特定时刻准确的项目项目上下文; 提出了一种新颖的深度学习方法, 利用高度相关的代码片段及其相应的摘要来表征上下文语义, 并通过迁移学习整合从大规模跨项目数据集中学到的常识. 实验结果表明: 基于项目级上下文的代码摘要模型不仅能够比通用代码摘要模型获得显著的性能提升, 同时, 针对特定项目能够生成更一致的摘要.
2023, 34(4):1711-1731. DOI: 10.13328/j.cnki.jos.006700 CSTR:
摘要:受人类的视觉注意力机制启发, 显著性目标检测任务旨在定位给定场景中最吸引人注意的目标或区域. 近年来, 随着深度相机的发展和普及, 深度图像已经被成功应用于各类计算机视觉任务, 这也为显著性目标检测技术提供了新思路. 通过引入深度图像, 不仅能使计算机更加全面地模拟人类视觉系统, 而且深度图像所提供的结构、位置等补充信息也可以为低对比度、复杂背景等困难场景的检测提供新的解决方案. 鉴于深度学习时代下RGB-D显著目标检测任务发展迅速, 旨在从该任务关键问题的解决方案出发, 对现有相关研究成果进行归纳、总结和梳理, 并在常用RGB-D SOD数据集上进行不同方法的定量分析和定性比较. 最后, 对该领域面临的挑战及未来的发展趋势进行总结与展望.
2023, 34(4):1732-1748. DOI: 10.13328/j.cnki.jos.006703 CSTR:
摘要:多标签学习是一种非常重要的机器学习范式. 传统的多标签学习方法是在监督或半监督的情况下设计的.通常情况下, 它们需要对所有或部分数据进行准确的属于多个类别的标注. 在许多实际应用中, 拥有大量标注的标签信息往往难以获取, 限制了多标签学习的推广和应用. 与之相比, 标签相关性作为一种常见的弱监督信息, 它对标注信息的要求较低. 如何利用标签相关性进行多标签学习, 是一个重要但未研究的问题. 提出了一种利用标签相关性作为先验的弱监督多标签学习方法(WSMLLC). 该模型利用标签相关性对样本相似性进行了重述,能够有效地获取标签指示矩阵; 同时, 利用先验信息对数据的投影矩阵进行约束, 并引入回归项对指示矩阵进行修正. 与现有方法相比, WSMLLC模型的突出优势在于: 仅提供标签相关性先验, 就可以实现多标签样本的标签指派任务. 在多个公开数据集上进行实验验证, 实验结果表明: 在标签矩阵完全缺失的情况下, WSMLLC与当前先进的多标签学习方法相比具有明显优势.
2023, 34(4):1749-1764. DOI: 10.13328/j.cnki.jos.006708 CSTR:
摘要:针对深度强化学习在高维机器人行为控制中训练效率低下和策略不可解释等问题, 提出一种基于结构交互驱动的机器人深度强化学习方法(structure-motivated interactive deep reinforcement learning, SMILE).首先, 利用结构分解方法将高维的单机器人控制问题转化为低维的多关节控制器协同学习问题, 从而缓解连续运动控制的维度灾难难题; 其次, 通过两种协同图模型(ATTENTION和PODT)动态推理控制器之间的关联关系, 实现机器人内部关节的信息交互和协同学习; 最后, 为了平衡ATTENTION和PODT协同图模型的计算复杂度和信息冗余度, 进一步提出两种协同图模型更新方法APDODT和PATTENTION, 实现控制器之间长期关联关系和短期关联关系的动态自适应调整. 实验结果表明, 基于结构驱动的机器人强化学习方法能显著提升机器人控制策略学习效率. 此外, 基于协同图模型的关系推理及协同机制, 可为最终学习策略提供更为直观和有效的解释.
2023, 34(4):1765-1778. DOI: 10.13328/j.cnki.jos.006399 CSTR:
摘要:稠密深度图在自动驾驶和机器人等领域至关重要, 但是现今的深度传感器只能产生稀疏的深度测量, 所以有必要对其进行补全. 在所有辅助模态中, RGB图像是常用且易得的信息. 现今的许多方法都采用RGB和稀疏深度信息结合进行补全. 然而它们绝大部分都是利用通道拼接或逐元素求和简单的对两种模态的信息进行融合, 没有考虑到不用场景下不同模态特征的置信度. 提出一种以输入深度稀疏分布为指导, 结合双模态信息量的动态门控融合模块, 通过动态产生融合权重的方式对两个模态特征进行更高效的结合. 并且根据不同模态的数据特征设计了精简的网络结构. 实验结果表明所提出模块和改进的有效性, 提出的网络在两个有挑战性的公开数据集KITTI depth completion和NYU depth v2上, 使用了很少的参数量达到了先进的结果, 取得了性能和速度的优秀平衡.
2023, 34(4):1779-1795. DOI: 10.13328/j.cnki.jos.006400 CSTR:
摘要:现实世界中高维数据无处不在, 然而在高维数据中往往存在大量的冗余和噪声信息, 这导致很多传统聚类算法在对高维数据聚类时不能获得很好的性能. 实践中发现高维数据的类簇结构往往嵌入在较低维的子空间中. 因而, 降维成为挖掘高维数据类簇结构的关键技术. 在众多降维方法中, 基于图的降维方法是研究的热点. 然而, 大部分基于图的降维算法存在以下两个问题: (1)需要计算或者学习邻接图, 计算复杂度高; (2)降维的过程中没有考虑降维后的用途. 针对这两个问题, 提出一种基于极大熵的快速无监督降维算法MEDR. MEDR算法融合线性投影和极大熵聚类模型, 通过一种有效的迭代优化算法寻找高维数据嵌入在低维子空间的潜在最优类簇结构. MEDR算法不需事先输入邻接图, 具有样本个数的线性时间复杂度. 在真实数据集上的实验结果表明, 与传统的降维方法相比, MEDR算法能够找到更好地将高维数据投影到低维子空间的投影矩阵, 使投影后的数据有利于聚类.
2023, 34(4):1796-1810. DOI: 10.13328/j.cnki.jos.006406 CSTR:
摘要:从案件相关的话题评论中生成简短的话题描述对于快速了解案件舆情有着重要作用, 其可以看做是基于用户评论的多文档摘要任务. 然而用户评论中含有较多噪声且生成摘要所需的重要信息分散在不同的评论句中, 直接基于序列模型容易生成错误或不相关的摘要. 为了缓解上述问题, 提出一种基于主题交互图的案件话题摘要方法, 将嘈杂的用户评论组织为主题交互图, 利用图来表达不同用户评论之间的关联关系, 从而过滤重要的用户评论信息. 具体来说, 首先从评论句中抽取案件要素, 然后构造以案件要素为节点, 包含案件要素的句子为内容的主题交互图; 然后利用图Transformer网络生成图中节点的表征, 最后生成简短的话题描述. 在收集的案件话题摘要数据集上的实验结果表明, 所提方法是一种有效的数据选择方法, 能够生成连贯、事实正确的话题摘要.
2023, 34(4):1811-1823. DOI: 10.13328/j.cnki.jos.006408 CSTR:
摘要:微博评价对象识别是涉案网络舆情分析的基础. 目前基于主题表征的评价对象识别方法需要预设固定的主题数目, 且最终评价对象识别依赖人工推断. 针对此问题, 提出一种弱监督涉案微博评价对象识别方法, 仅采用少量标签评论即可实现对评价对象的自动识别. 具体实现思路为: 首先基于变分双主题表征网络对评论进行两次编码和重构, 获得丰富的主题特征; 然后, 利用少量标签评论, 引导主题表征网络自动判别评价对象类别; 最后采用联合训练策略, 对双主题表征的重构损失与评价对象分类损失进行联合调优, 最终实现对评价对象的自动分类和评价对象词项的挖掘. 在涉案舆情的两个数据集上进行了实验, 结果表明, 所提出的模型在评价对象分类、评价对象词项的主题连贯性和多样性等方面均优于几个基线模型.
2023, 34(4):1824-1836. DOI: 10.13328/j.cnki.jos.006412 CSTR:
摘要:问句匹配是问答系统的重要任务, 当前方法通常采用神经网络建模两个句子的语义匹配程度. 但是, 在法律领域中, 问句常存在文本表征稀疏、法律词的专业性较强、句子蕴含法律知识不足等问题. 因此, 通用领域的深度学习文本匹配模型在法律问句匹配任务上效果并不好. 为了让模型更好的理解法律问句的含义、建模法律领域知识, 首先构建一个法律领域知识库, 在此基础上提出一种融合法律领域知识(如法律词汇和法律法条)的问句匹配模型. 具体地, 构建了合同纠纷、离婚、交通事故、劳动工伤、债务债权等5种法律纠纷类别下的法律词典, 并且收集了相关法律法条, 构建法律领域知识库. 在问句匹配中, 首先查询法律知识库检索问句对所对应的法律词汇和法律法条, 进而通过交叉关注模型同时建模问句、法律词汇、法律法条三者之间的关联, 最终实现更精准的问句匹配, 在多个法律类别下的实验表明提出的方法能有效提升问句匹配性能.
2023, 34(4):1837-1849. DOI: 10.13328/j.cnki.jos.006413 CSTR:
摘要:语音翻译旨在将一种语言的语音翻译成另一种语言的语音或文本. 相比于级联式翻译系统, 端到端的语音翻译方法具有时间延迟低、错误累积少和存储空间小等优势, 因此越来越多地受到研究者们的关注. 但是, 端到端的语音翻译方法不仅需要处理较长的语音序列, 提取其中的声学信息, 而且需要学习源语言语音和目标语言文本之间的对齐关系, 从而导致建模困难, 且性能欠佳. 提出一种跨模态信息融合的端到端的语音翻译方法, 该方法将文本机器翻译与语音翻译模型深度结合, 针对语音序列长度与文本序列长度不一致的问题, 通过过滤声学表示中的冗余信息, 使过滤后的声学状态序列长度与对应的文本序列尽可能一致; 针对对齐关系难学习的问题, 采用基于参数共享的方法将文本机器翻译模型嵌入到语音翻译模型中, 并通过多任务训练方法学习源语言语音与目标语言文本之间的对齐关系. 在公开的语音翻译数据集上进行的实验表明, 所提方法可以显著提升语音翻译的性能.
2023, 34(4):1850-1869. DOI: 10.13328/j.cnki.jos.006432 CSTR:
摘要:针对粒子群算法无法有效兼顾开采与勘探的问题, 提出一种基于密度峰值的依维度重置多种群粒子群算法. 首先采用密度峰值聚类中相对距离的思想并结合适应度值将种群分为两个子种群: 顶层群和底层群. 之后为顶层群设计专注于开采的学习策略而为底层群设计倾向于勘探的学习策略, 以均衡种群的勘探与开采. 最后依维度将陷入局部最优的粒子与全局最优粒子交叉重置, 在有效避免早熟收敛的同时也显著减少了无效计算次数. 将提出的算法与其他改进的优化算法在基础优化问题与CEC2017测试集上进行实验对比, 实验结果均值的统计检验证明了提出算法的改进具有统计学显著性.
2023, 34(4):1870-1878. DOI: 10.13328/j.cnki.jos.006433 CSTR:
摘要:借助预置任务创建的免费监督信号/标记, 自监督学习(SSL)能学得无标记数据的有效表示, 并已在多种下游任务中获得了验证. 现有预置任务通常先对原视图数据作显式的线性或非线性变换, 由此形成了多个增广视图数据, 然后通过预测上述视图或变换的对应标记或最大化视图间的一致性达成学习表示. 发现这种自监督增广(即数据自身与自监督标记的增广)不仅有益无监督预置任务而且也有益监督分类任务的学习, 而当前鲜有工作对此关注, 它们要么将预置任务作为下游分类任务的学习辅助, 采用多任务学习建模; 要么采用多标记学习, 联合建模下游任务标记与自监督标记. 然而, 下游任务与预置任务间往往存在固有差异(语义, 任务难度等), 由此不可避免地造成二者学习间的竞争, 给下游任务的学习带来风险. 为挑战该问题, 提出一种简单但有效的自监督多视图学习框架(SSL-MV), 通过在增广数据视图上执行与下游任务相同的学习来避免自监督标记对下游标记学习的干扰. 更有意思的是, 借助多视图学习, 设计的框架自然拥有了集成推断能力, 因而显著提升了下游分类任务的学习性能. 最后, 基于基准数据集的广泛实验验证了SSL-MV的有效性.
2023, 34(4):1879-1906. DOI: 10.13328/j.cnki.jos.006692 CSTR:
摘要:在互联网快速发展、大数据的挖掘与应用已渗透到各行各业的今天, 如何安全且高效地共享、使用海量数据成为新的热点研究问题. 安全多方计算是解决该问题的关键技术之一, 它允许一组参与方在不泄露隐私输入的前提下进行交互, 共同计算一个函数并得到输出结果. 不经意传输协议, 也叫茫然传输协议, 是一种保护隐私的两方通信协议, 消息发送者持有两条待发送的消息, 接收者选择一条进行接收, 事后发送者对接收者获取哪一条消息毫不知情, 接收者对于未选择的消息也无法获取任何信息. 不经意传输协议是安全多方计算技术的关键模块之一, 其效率优化可有效推动安全多方计算技术的应用落地, 对于特殊的两方安全计算协议如隐私集合交集计算尤为重要. 总结了不经意传输协议的分类及几种常见的变体, 分别阐述了基于公钥密码的不经意传输协议的构造和研究进展, 以及不经意传输扩展协议的构造和研究进展, 由此引出不经意传输扩展协议的效率优化研究的重要性. 同时, 在半诚实敌手和恶意敌手这两种敌手模型下, 分别对不经意传输协议和不经意传输扩展协议的效率优化研究进展进行了全面梳理. 另一方面, 从应用角度对不经意传输协议和不经意传输扩展协议在工程实现中常用的优化技术进行了系统化分析. 最后, 总结了不经意传输协议和不经意传输扩展协议研究目前所面临的主要问题及未来发展趋势.
2023, 34(4):1907-1925. DOI: 10.13328/j.cnki.jos.006698 CSTR:
摘要:为解决属性基加密方案中用户撤销繁琐、密文更新计算开销大的问题, 提出一种面向可变用户群体的可搜索属性基加密方案. 利用二叉树管理撤销列表, 当需要撤销用户时, 可信中心只要将其加入撤销列表, 并通知云服务器更新部分密文, 提高了用户撤销的效率. 考虑到利用二叉树实现用户撤销会导致系统中用户数量存在上限, 当某个二叉树叶结点所代表的用户被撤销后, 只要更新二叉树中设置的随机值, 其他用户就可以重复使用该结点. 基于配对计算为用户提供密文搜索功能, 并保证被撤销的用户无法搜索密文. 安全性分析表明, 该方案在随机谕言模型下满足选择明文不可区分安全性. 性能分析和实验数据表明, 该方案相比于同类方案, 计算开销更小.
2023, 34(4):1926-1943. DOI: 10.13328/j.cnki.jos.006722 CSTR:
摘要:深度学习已经逐渐应用于恶意代码检测并取得了不错的效果. 然而, 最近的研究表明: 深度学习模型自身存在不安全因素, 容易遭受对抗样本攻击. 在不改变恶意代码原有功能的前提下, 攻击者通过对恶意代码做少量修改, 可以误导恶意代码检测器做出错误的决策, 造成恶意代码的漏报. 为防御对抗样本攻击, 已有的研究工作中最常用的方法是对抗训练. 然而对抗训练方法需要生成大量对抗样本加入训练集中重新训练模型, 效率较低,并且防御效果受限于训练中所使用的对抗样本生成方法. 为此, 提出一种PE文件格式恶意代码对抗样本检测方法, 针对在程序功能无关区域添加修改的一类对抗样本攻击, 利用模型解释技术提取端到端恶意代码检测模型的决策依据作为特征, 进而通过异常检测方法准确识别对抗样本. 该方法作为恶意代码检测模型的附加模块, 不需要对原有模型做修改, 相较于对抗训练等其他防御方法效率更高, 且具有更强的泛化能力, 能够防御多种对抗样本攻击. 在真实的恶意代码数据集上进行了实验, 实验结果表明, 该方法能够有效防御针对端到端PE文件恶意代码检测模型的对抗样本攻击.
2023, 34(4):1944-1961. DOI: 10.13328/j.cnki.jos.006725 CSTR:
摘要:参与介质在自然界中广泛存在, 也是包括影视特效、电子游戏、仿真系统等大多数图形应用中的主要场景元素之一, 对其外观的模拟和再现, 可以极大地提升场景的真实感和沉浸感. 但是由于参与介质本身结构以及光线在参与介质中的传播过程都非常复杂, 所以迄今为止, 对参与介质渲染的研究都一直是图形领域的热点和难点. 为了处理的方便和计算的高效, 传统的参与介质渲染方法都基于两点假设: 独立散射假设和局部连续假设. 这两点假设也是经典的辐射传输方程成立的关键. 但实际上, 自然界中的很多参与介质都不满足这两点假设, 因此导致现有的参与介质渲染方法生成的图片效果和真实世界的效果存在一定的差异. 近年来, 研究者们提出了各种非经典参与介质渲染方法, 试图打破上述的两点假设, 用更符合物理客观规律的方式来处理参与介质, 从而进一步提升参与介质渲染的物理真实感. 从相干介质渲染技术和离散介质渲染技术两方面展开对现有的面向非经典参与介质的渲染方法进行分析和讨论, 重点阐述经典和非经典参与介质渲染方法的区别, 以及现有非经典参与介质渲染方法的原理、优势和不足. 最后, 展望一些开放性问题并进行总结. 本综述希望能启发相关领域的研究人员进一步攻克非经典参与介质渲染技术中的关键问题和技术难点, 也为工业界改进现有渲染器以提高参与介质渲染的真实感提供参考.
2023, 34(4):1962-1976. DOI: 10.13328/j.cnki.jos.006683 CSTR:
摘要:局部几何形状的描述能力, 对不规则的点云形状表示是十分重要的. 然而, 现有的网络仍然很难有效地捕捉准确的局部形状信息. 在点云中模拟深度可分离卷积计算方式, 提出一种新型的动态覆盖卷积(dynamic cover convolution, DC-Conv), 以聚合局部特征. DC-Conv的核心是空间覆盖算子(space cover operator, SCOP), 该算子通过在局部区域中构建各向异性的空间几何体覆盖局部特征空间, 以加强局部特征的紧凑性. DC-Conv通过在局部邻域中动态组合多个SCOP, 实现局部形状的捕捉. 其中, SCOP的注意力系数通过数据驱动的方式由点位置自适应地学习得到. 在3D点云形状识别基准数据集ModelNet40, ModelNet10和ScanObjectNN上的实验结果表明, 该方法能有效提高3D点云形状识别的性能和对稀疏点云的鲁棒性. 最后, 也提供了充分的消融实验验证该方法的有效性. 开源代码发布在https://github.com/changshuowang/DC-CNN.
2023, 34(4):1977-1996. DOI: 10.13328/j.cnki.jos.006732 CSTR:
摘要:现阶段, 随着数据规模扩大化和结构多样化的趋势日益凸现, 如何利用现代链路内链的异构多协处理器为大规模数据处理提供实时、可靠的并行运行时环境, 已经成为高性能以及数据库领域的研究热点. 利用多协处理器(GPU)设备的现代服务器(multi-GPU server)硬件架构环境, 已经成为分析大规模、非规则性图数据的首选高性能平台. 现有研究工作基于Multi-GPU服务器架构设计的图计算系统和算法(如广度优先遍历和最短路径算法),整体性能已显著优于多核CPU计算环境. 然而, 这类图计算系统中, 多GPU协处理器间的图分块数据传输性能受限于PCI-E总线带宽和局部延迟, 导致通过增加GPU设备数量无法达到整体系统性能的类线性增长趋势, 甚至会出现严重的时延抖动, 进而已无法满足大规模图并行计算系统的高可扩展性要求. 经过一系列基准实验验证发现,现有系统存在如下两类缺陷: (1) 现代GPU设备间数据通路的硬件架构发展日益更新(如NVLink-V1, NVLink-V2), 其链路带宽和延迟得到大幅改进, 然而现有系统受限于PCI-E总线进行数据分块通信, 无法充分利用现代GPU链路资源(包括链路拓扑、连通性和路由); (2) 在应对不规则图数据集时, 这类系统常采用过于单一的设备间数据组织和移动策略, 带来大量不必要GPU设备间经PCI-E总线的数据同步开销, 导致本地性计算同步等待时延开销过大.因此, 充分地利用各类现代Multi-GPU服务器通信链路架构来设计可扩展性强的图数据高性能计算系统亟待解决.为了达到Multi-GPU下图计算系统的高可扩展性, 提出一种基于混合感知的细粒度通信来增强Multi-GPU图计算系统的可伸缩性, 即采用架构链路预感知技术对图结构化数据采用模块化数据链路和通信策略, 为大规模图数据(结构型数据、应用型数据)最优化选择数据交换方法. 综合上述优化策略, 提出并设计了一种面向Multi-GPU图并行计算系统ChattyGraph. 通过对GPU图数据缓冲区优化, 基于OPENMP与NCCL优化多核GPU协同计算, ChattyGraph能在Multi-GPU HPC平台上自适应、高效地支持各类图并行计算应用和算法. 在8-GPU NVIDIA DGX服务器上, 对各种真实世界图数据的若干实验评估表明: ChattyGraph显著实现了图计算效率和可扩展性的提升, 并优于其他最先进的竞争对手性能, 计算效率平均提升了1.2×-1.5×, 加速比平均提升了2×-3×, 包括WS-VR和Groute.