• 2024年第35卷第12期文章目次
    全 选
    显示方式: |
    • 大规模图的分布式核分解算法

      2024, 35(12):5341-5362. DOI: 10.13328/j.cnki.jos.007063 CSTR: 32375.14.jos.007063

      摘要 (896) HTML (201) PDF 5.98 M (1786) 评论 (0) 收藏

      摘要:随着互联网信息技术的发展, 社交网络、计算机网络及生物信息网络等领域涌现海量大规模图数据. 鉴于传统图数据管理技术在处理大规模图时存在存储及性能方面的局限, 大规模图的分布式处理技术已成为图数据库领域的研究热点, 并得到工业界和学术界的广泛关注. 图的核分解用于计算图中所有顶点的核值, 有助于挖掘重要图结构信息, 在社区搜索、蛋白质结构分析和网络结构可视化等诸多应用中发挥着关键作用. 当前以顶点为中心计算模式的分布式核分解算法中采用一种广播的消息传递机制, 一方面, 存在大量的冗余通信及计算开销; 另一方面, 处理大规模图核分解过程中易产生内存溢出问题. 为此, 分别提出基于全局激活和层次剥离计算框架, 并提出分布式核分解新算法, 通过引入基于顶点核值局部性特点的消息剪枝策略和以计算节点为中心的计算新模式, 保证算法有效性的同时提升其性能. 在国家超级计算长沙中心分布式集群上, 分别针对大规模真实和合成数据集, 算法总耗时性能提升比例为37%–98%, 验证所提模型和算法的有效性和高效性.

    • 基于TLA+形式化规约的Raft协议测试

      2024, 35(12):5363-5381. DOI: 10.13328/j.cnki.jos.007066 CSTR: 32375.14.jos.007066

      摘要 (489) HTML (143) PDF 8.66 M (1718) 评论 (0) 收藏

      摘要:Raft是最为流行的分布式共识协议之一. 自2014年被提出以来, Raft协议及其变体在各种分布式系统中被广泛应用. 为了证明Raft协议的正确性, 开发者使用TLA+形式化规约对协议设计进行了建模和验证. 但由于抽象的形式化规约与实际的系统实现源码间存在鸿沟, 基于Raft实现的分布式系统中仍然会违背协议设计并引入复杂的缺陷. 设计基于TLA+形式化规约的测试方法来检测Raft协议实现中的缺陷. 具体而言, 将形式化规约匹配到相应的系统实现, 并用形式化规约所定义的状态空间来指导系统实现的测试过程. 为评估所提方法的可行性和有效性, 针对两个不同的Raft实现进行系统化测试, 并发现3个未知缺陷.

    • 基于生成对抗策略的代码搜索

      2024, 35(12):5382-5396. DOI: 10.13328/j.cnki.jos.007067 CSTR: 32375.14.jos.007067

      摘要 (396) HTML (104) PDF 6.23 M (1670) 评论 (0) 收藏

      摘要:基于深度学习的代码搜索方法通过计算代码与描述语句各自表征的相似程度, 实现代码搜索任务. 然而此类方法并未考虑代码和描述语句之间真实存在的相关性概率分布. 针对此问题, 将经典概率模型中代码和描述语句的相关性概率分布与向量空间模型中特征提取相结合, 提出基于生成对抗策略的代码搜索方法. 所提方法首先设计代码和描述语句的特征编码器用于特征提取. 接着采用生成对抗策略, 将代码和描述语句之间的概率分布应用于生成器和判别器的交替训练, 同时实现对代码编码器和描述语句编码器的优化, 生成高质量的代码表征和描述语句表征用于代码搜索任务. 最后在公开的数据集上进行实验验证, 结果表明所提出的方法相比于DeepCS方法在Recall@10, MRR@10和NDCG@10指标上分别提升8.4%、32.5%和24.3%.

    • 基于投影的嵌入式系统需求分析方法

      2024, 35(12):5397-5418. DOI: 10.13328/j.cnki.jos.007081 CSTR: 32375.14.jos.007081

      摘要 (405) HTML (112) PDF 8.51 M (1626) 评论 (0) 收藏

      摘要:嵌入式系统正变得越来越复杂, 其软件系统的需求分析成为嵌入式系统开发的瓶颈问题. 设备依赖性和执行逻辑的交织性是嵌入式软件系统的典型特征, 要求需求分析方法能根据所依赖的设备进行有效的需求解耦. 从基于环境建模的需求工程思想出发, 针对嵌入式软件系统的特征, 提出一种基于投影的从系统需求到软件需求的分析方法, 帮助需求工程师对需求进行有效解耦. 首先总结嵌入式软件系统的系统需求与软件需求描述, 基于交互环境特性定义嵌入式软件系统的需求解耦策略, 并设计从系统需求到软件需求的规约过程. 在航天器太阳搜索系统进行实际案例研究, 并通过耦合度与内聚性两个指标对5个代表性案例场景进行量化评估, 展示所提方法的有效性.

    • 聚合型时序逻辑驱动的复合服务联动定量监测

      2024, 35(12):5419-5451. DOI: 10.13328/j.cnki.jos.007082 CSTR: 32375.14.jos.007082

      摘要 (269) HTML (93) PDF 12.59 M (1263) 评论 (0) 收藏

      摘要:近年来, 面向服务的物联网体系架构受到学术界和工业界的广泛关注. 通过把物联网资源虚拟化为智能物联网服务, 动态互联并融合协同这些资源受限且动态演进的物联网服务, 从而构建物联网应用, 已成为一种被普遍认可且灵活有效的机制. 面向边缘设备资源稀缺且动态时变, 物联网服务在其执行过程中可能发生QoS变化或资源失配, 致使物联网应用难以继续或可能诱使故障发生. 因此, 实现物联网服务的实时定量监测, 已成为保障物联网应用鲁棒性和系统健壮性的关键. 现有相关研究工作提出了不同监测机制, 但其在形式化解释上仍存不足, 表现为较强的领域相关性和经验主观性. 基于形式化方法, 例如信号时序逻辑, 可将物联网服务运行态实时定量监测问题转换为时序逻辑任务. 然而, 现有信号时序逻辑存在信号不可辨性、方法不鲁棒性以及场景不适用性问题. 并且, 在物联网服务以复合服务形式监测时, 现有工作存在整体性、联动性、动态性考虑不足的问题. 为解决上述问题, 提出一种聚合型信号时序逻辑, 以实现单个服务、服务之间以及复合服务上不同QoS约束和时间约束的实时联动定量监测. 所提方法扩展基于正负偏置黎曼和的累加型时间算子, 对整个时间域内所有子公式进行鲁棒性度量, 实现时序鲁棒、信号可辨、动态适用的物联网服务运行态实时定量监测; 并扩展基于约束类型与组合结构的聚合算子, 以及随动态环境可变的动态变量, 实现复合服务在动态环境中的联动定量监测. 由此, 物联网服务及其复合服务的多维度多约束被转换为逻辑公式, 并在运行时以定性和定量化的满意度进行形式化解释. 实验结果表明所提方法具有更好的监测表达能力、场景适用性和结果鲁棒性.

    • IADT: 基于解释分析的深度神经网络差分测试

      2024, 35(12):5452-5469. DOI: 10.13328/j.cnki.jos.007088 CSTR: 32375.14.jos.007088

      摘要 (188) HTML (107) PDF 8.03 M (925) 评论 (0) 收藏

      摘要:随着深度神经网络(deep neural network, DNN)的迅猛发展, 其在某些特定任务上的准确性已可媲美甚至超过人类. 然而, DNN与传统软件一样不可避免地存在缺陷, 若将带缺陷的DNN模型应用于安全攸关的领域甚至可能引发严重事故, 如何有效检测缺陷DNN模型已成为亟需解决的问题. 传统的差分测试方法将测试目标在同一测试输入下的输出结果作为差异分析的依据. 然而, 即使是相同训练程序和数据重复训练的不同DNN模型在同一测试输入下也常会产生不同的输出结果. 因此, 不能认为模型输出具有差异的两个模型中存在缺陷模型, 基于测试对象输出结果的传统差分测试方法难以直接用于DNN模型的缺陷检测. 为解决上述问题, 提出基于解释分析的DNN模型差分测试方法IADT (interpretation-analysis-based differential testing), 利用解释方法分析DNN模型对于测试输入的行为解释, 并使用统计方法分析模型对测试集行为解释的显著性差异来检测缺陷模型. 使用真实缺陷模型进行实验的结果表明, 解释方法的引入使IADT能有效检测缺陷DNN模型, 检测缺陷模型的F1值比DeepCrime高0.8%–6.4%, 而所消耗的时间仅为DeepCrime的4.0%–5.4%.

    • 针对低资源场景下连续情感分析任务的持续注意力建模

      2024, 35(12):5470-5486. DOI: 10.13328/j.cnki.jos.007057 CSTR: 32375.14.jos.007057

      摘要 (369) HTML (100) PDF 6.56 M (1572) 评论 (0) 收藏

      摘要:目前情感分析的研究普遍基于大数据驱动型模型, 严重依赖高昂的标注成本和算力成本, 因此针对低资源场景下的情感分析研究显得尤为迫切. 然而, 存在的低资源场景下的情感分析研究主要集中在单个任务上, 这导致模型难以获取外部任务知识. 因此构建低资源场景下的连续情感分析任务, 旨在利用持续学习方法, 让模型随时间步学习多个情感分析任务. 这样可以充分利用不同任务的数据, 并学习不同任务的情感信息, 从而缓解单个任务训练数据匮乏问题. 认为低资源场景下的连续情感分析任务面临两大核心问题, 一方面是单个任务的情感信息保留问题, 另一方面是不同任务间的情感信息融合问题. 为了解决上述两大问题, 提出针对低资源场景下连续情感分析任务的持续注意力建模方法. 所提方法首先构建情感掩码Adapter, 用于为不同任务生成硬注意力情感掩码, 这可以保留不同任务的情感信息, 从而缓解灾难性遗忘问题. 其次, 所提方法构建动态情感注意力, 根据当前时间步和任务相似度动态融合不同Adapter抽取的特征, 这可以融合不同任务间的情感信息. 在多个数据集上的实验结果表明: 所提方法的性能显著超过了目前最先进的基准方法. 此外, 实验分析表明, 所提方法较其他基准方法具有最优的情感信息能力和情感信息融合能力, 并且能同时保持较高的运行效率.

    • >综述文章
    • 离散语音情感识别研究进展

      2024, 35(12):5487-5508. DOI: 10.13328/j.cnki.jos.007232 CSTR: 32375.14.jos.007232

      摘要 (209) HTML (64) PDF 6.48 M (578) 评论 (0) 收藏

      摘要:语音情感识别是情感计算的重要组成部分, 在人机交互中占据重要的地位. 准确地识别说话人的情感信息, 有助于机器更好地理解用户的意图, 进而提供良好的交互性以提升用户的体验. 以离散语音情感为对象, 对语音情感识别的理论和方法进行综述. 首先在全面回顾情感识别发展历程的同时, 提出一个语音情感识别综述框架. 其次, 介绍情感描述方法以及常用的情感语料库, 旨在为语音情感识别提供基础支撑. 然后, 概述语音情感识别过程, 主要包括特征提取和识别模型, 重点归纳总结传统分类模型、经典深度模型、其他先进模型, 并介绍常用的评价指标, 同时基于评价指标对模型进行总结. 最后, 探讨语音情感识别领域所面临的挑战, 并对未来的发展趋势进行展望.

    • 基于图注意力网络的多意图识别与语义槽填充联合模型

      2024, 35(12):5509-5525. DOI: 10.13328/j.cnki.jos.007062 CSTR: 32375.14.jos.007062

      摘要 (418) HTML (71) PDF 6.62 M (1769) 评论 (0) 收藏

      摘要:口语理解是任务型对话系统的关键任务, 主要由语义槽填充和意图识别两个子任务组成. 目前主流的方法是对语义槽填充和意图识别进行联合建模. 虽然这种方法在语义槽填充和意图识别上都取得了不错的效果, 但依然存在联合建模中意图识别和语义槽填充交互过程的错误传播问题以及多意图场景下多意图信息与语义槽信息的错误对应问题. 针对上述问题, 提出一种基于图注意力网络的多意图识别与语义槽填充联合模型(WISM). WISM模型通过细粒度(单词级)意图与语义槽建立单词级别一对一映射关系以修正多意图信息与语义槽之间的错误对应关系, 然后通过构建单词-意图-语义槽的交互图, 并利用细粒度下的图注意力网络建立两个任务之间的双向联系以此来降低交互过程中错误传播问题. 在MixSINPS和MixATIS数据集上的实验结果表明, WISM相较于现有的最新模型在语义准确率分别提高2.58%和3.53%. 所提模型在提高语义准确率的同时展示了多意图信息与语义槽之间的映射关系.

    • 面向时序图的季节突发性子图挖掘算法

      2024, 35(12):5526-5543. DOI: 10.13328/j.cnki.jos.007064 CSTR: 32375.14.jos.007064

      摘要 (235) HTML (70) PDF 5.90 M (1426) 评论 (0) 收藏

      摘要:时序图是一类边上带有时间戳信息的图. 在时序图中, 季节突发性子图是在多个时间周期内具有突发性特征的稠密子图, 它可以用于社交网络中的活动发现和群体关系分析. 然而以前大多数的研究主要集中在识别没有时间信息的网络中的稠密子图. 为此, 提出一种极大(ω,θ)-稠密子图模型对时序图中的季节突发性子图进行建模. 所提模型表示时序图中在至少ω个长度不小于θ的时间段内快速累积密度的子图. 为了挖掘出时序图中所有的极大(ω,θ)-稠密子图, 将该类挖掘问题转化为一个混合的整数规划问题, 包括挖掘最稠密子图和寻找突发值最大化时间段集合两个子问题, 并给出有效的解决方案. 进一步基于key-核模型和动态规划思想设计两种优化策略来提升算法的性能. 实验表明所提模型能够真实地反映现实世界中具有季节突发性的行为模式. 同时在5个真实时序网络中验证了所提算法的有效性、效率和可扩展性.

    • 基于IMIU的在线类增量对比学习

      2024, 35(12):5544-5557. DOI: 10.13328/j.cnki.jos.007094 CSTR: 32375.14.jos.007094

      摘要 (204) HTML (70) PDF 3.13 M (1024) 评论 (0) 收藏

      摘要:在线类增量连续学习旨在数据流场景下进行有效的新类学习, 并保证模型满足小缓存和小批次约束. 然而由于数据流的单趟(one-pass)特性, 小批次内的类别信息难以如离线学习那样被多趟探索利用. 为缓解该问题, 目前常采用数据多重增广并借助对比回放建模. 但考虑到小缓存和小批次限制, 现有随机选择和保存数据的策略不利于获取多样性的负样本, 制约了模型判别性. 已有研究表明困难负样本是提升对比学习性能的关键, 但这鲜少在在线学习场景被探索. Universum学习提出的概念含混(condued)数据恰好提供一种生成困难负样本的简单直观思路, 据此先前用特定系数插值混合(mixup)诱导出的Universum数据(mixup-induced Universum, MIU)已有效提升了离线对比学习的性能. 受此启发, 尝试将其引入在线场景. 但不同于先前静态生成的Universum, 数据流场景面临着某些额外挑战. 首先随类数的动态增加, 相对基于全局给定类生成的静态Universum不再适用, 需重新加以定义和动态生成, 为此提出仅利用当前数据(局部)递归生成相对已见类熵为最大的MIU (称为增量MIU, IMIU), 并为其提供额外的小缓存从总体上满足内存限制; 其次将生成的IMIU和小批次内的正样本再次插值混合出多样且高质的困难负样本. 最后综合上述各步, 发展出基于IMIU的在线类增量对比学习(incrementally mixup-induced Universum based online class-increment contrastive learning, IUCL)学习算法. 在标准数据集CIFAR-10、CIFAR-100和Mini-ImageNet上的对比实验验证所提算法一致的有效性.

    • 基于声明式推理的高效协同查询处理技术

      2024, 35(12):5558-5581. DOI: 10.13328/j.cnki.jos.007058 CSTR: 32375.14.jos.007058

      摘要 (264) HTML (59) PDF 8.96 M (1414) 评论 (0) 收藏

      摘要:由于深度学习领域的不断进步, 人们对用协同查询处理(CQP)技术扩展关系数据库以处理涉及结构化和非结构化数据的高级分析查询越来越感兴趣. 最先进的CQP方法使用用户定义函数(UDFs)来实现深度神经网络(NN)模型来处理非结构化数据, 并使用关系操作来处理结构化数据. 基于UDF的方法简化了查询书写, 允许用户使用单一的SQL提交分析查询, 但要求在即席数据分析中能够根据所需性能指标手动选择合适且高效的模型, 这对用户提出了很高的挑战. 为了解决该问题, 提出基于声明式推理函数(DIF)的协同查询处理技术, 通过优化模型选择、执行方式、设备绑定等多个查询实现路径构建完整的协同查询处理框架. 基于所提研究设计的成本模型和优化规则, 查询处理器能够计算出不同查询计划的代价, 并自动选择最优的物理查询计划. 在4个数据集上的实验结果证实了提出的基于DIF的CQP方法的有效性和效率.

    • >综述文章
    • 基于异构多核心GPU的高性能密码计算技术研究进展

      2024, 35(12):5582-5608. DOI: 10.13328/j.cnki.jos.007089 CSTR: 32375.14.jos.007089

      摘要 (490) HTML (88) PDF 10.29 M (2341) 评论 (0) 收藏

      摘要:密码学是保障网络安全的核心基础, 其在数据保护、身份验证、加密通信等方面发挥着至关重要的作用. 随着5G和物联网技术的迅速普及, 网络安全面临着空前的挑战, 对密码学性能的要求呈现出爆发式增长. GPU能够利用数以千计的计算核心并行化加速复杂计算问题, 这种并行化特性非常适用于密码学算法的计算密集型特性. 鉴于此, 研究人员广泛探索了在GPU平台上加速各种密码算法的方法, 与CPU、FPGA等平台相比, GPU展现出明显的性能优势. 论述各类密码算法的分类与GPU平台架构, 对各类密码在GPU异构平台上的研究现状进行详细分析, 总结当前基于GPU平台高性能密码学面临的技术难题, 并对未来技术发展进行展望. 通过深入研究和总结, 旨在为密码工程研究从业者提供有关基于GPU的高性能密码计算的最新研究进展和应用实践的综合参考.

    • 基于SM9的撤销加密方案

      2024, 35(12):5609-5620. DOI: 10.13328/j.cnki.jos.007041 CSTR: 32375.14.jos.007041

      摘要 (77) HTML (59) PDF 6.68 M (468) 评论 (0) 收藏

      摘要:撤销加密是一种反向的广播加密技术, 加密算法的输入不是接收者集合而是撤销用户的集合, 系统中所有不在撤销集合中的用户都可以正确解密密文, 撤销集合中的所有用户合谋也无法获取加密数据的内容. 与广播加密相比, 撤销加密更适用于接收者为系统中大多数用户或需要撤销部分用户未来解密权限的场景. 基于我国商用标识密码提出一个基于SM9的撤销加密方案, 密文的长度是固定的, 与撤销用户集合的大小无关. 基于广义群模型中的困难假设, 证明方案在随机谕言机模型下具有选择明文的安全性. 最后, 分析方案的性能对比结果可知, 所提方案与目前基于身份的撤销加密方案在计算复杂度和存储复杂度方面相比性能相当.

    • 面向Web3的SM2私钥保护方案

      2024, 35(12):5621-5635. DOI: 10.13328/j.cnki.jos.007060 CSTR: 32375.14.jos.007060

      摘要 (314) HTML (69) PDF 2.23 M (1454) 评论 (0) 收藏

      摘要:为解决用户私钥安全问题, 将秘密共享方法与边缘计算模式相结合, 提出一种面向用户的、实用的私钥保护框架, 并基于此框架设计针对国密SM2公钥密码的私钥保护方案, 将用户的SM2私钥通过秘密共享分成两个私钥份额, 分别由用户设备和边缘服务器持有. 当用户使用Web3应用服务需要执行公钥密码算法时, 用户设备和边缘服务器利用各自的私钥份额协同执行两方分布式SM2公钥密码算法, 在无需恢复原始私钥的情况下完成密码运算. 当用户设备或边缘服务器之一遭到攻击后, 用户通过份额更新算法更新私钥份额, 从而使存在泄漏风险的份额失效. 实验测试结果表明, 新方案的计算时长在现实环境中常用设备(手机、笔记本电脑)可接受的范围内.

    • 基于跨模态特权信息增强的图像分类方法

      2024, 35(12):5636-5652. DOI: 10.13328/j.cnki.jos.007052 CSTR: 32375.14.jos.007052

      摘要 (390) HTML (68) PDF 10.18 M (1647) 评论 (0) 收藏

      摘要:图像分类算法的性能受限于视觉信息的多样性和背景噪声的影响, 现有研究通常采用跨模态约束或异构特征对齐算法学习可判别力强的视觉表征. 然而, 模态异构带来的特征分布差异等问题限制了视觉表征的有效学习. 针对该问题, 提出一种基于跨模态语义信息推理和融合的图像分类框架(CMIF), 引入图像语义描述及统计先验知识作为特权信息, 使用特权信息学习范式在模型训练阶段指导图像特征从视觉空间向语义空间映射, 提出类感知的信息选择算法(CIS)学习图像的跨模态增强表征. 针对表征学习中的异构特征差异性问题, 使用部分异构对齐算法(PHA)实现视觉特征与特权信息中提取的语义特征的跨模态对齐. 为进一步在语义空间中抑制视觉噪声带来的干扰, 提出基于图融合的CIS算法选取重构语义表征中的关键信息, 从而形成对视觉预测信息的有效补充. 在跨模态分类数据集VireoFood-172和NUS-WIDE上的实验表明, CMIF能够学习鲁棒的图像语义特征, 并且能够作为通用框架在基于卷积的ResNet-50和基于Transformer架构的ViT图像分类模型上取得稳定的性能提升.

    • 针对BMP格式掩盖的JPEG同步重压缩检测方法

      2024, 35(12):5653-5670. DOI: 10.13328/j.cnki.jos.007055 CSTR: 32375.14.jos.007055

      摘要 (242) HTML (70) PDF 8.03 M (1373) 评论 (0) 收藏

      摘要:检测JPEG (joint photographic experts group)同步重压缩是数字图像取证中一项具有挑战性的任务. 已有的研究提出了一些能够有效检测同步JPEG重压缩的方法, 但这些方法基本上都是在JPEG解压缩过程中获取的特征, 如果以BMP格式保存同步JPEG重压缩图像, 则这些方法将难以直接应用. 为了解决该问题, 提出一种基于双阈值的量化步长估计方法, 从而获取量化表并提取特征. 此外, 根据质量因子100时JPEG压缩的特殊性定义最小误差, 通过去除特征中的最小误差, 进一步提高特征的检测性能. 最后, 基于反量化后JPEG系数的收敛特性提取一阶相对误差特征, 进一步提高所提方法在质量因子较低时的检测性能. 实验结果表明, 所提方法在不同质量因子时的性能均优于当前先进算法.

    • 基于中心差分卷积和注意力的空域彩色图像隐写分析

      2024, 35(12):5671-5686. DOI: 10.13328/j.cnki.jos.007068 CSTR: 32375.14.jos.007068

      摘要 (422) HTML (66) PDF 5.57 M (1617) 评论 (0) 收藏

      摘要:目前, 大多数已发表的图像隐写分析方法都是针对灰度图像设计的, 因此这些方法无法有效检测广泛应用于社交媒体的彩色图像. 为解决这一问题, 提出一种基于中心差分卷积和注意力增强的彩色图像隐写分析方法. 首先设计一个包含预处理, 特征提取和特征分类这3个阶段的主干流. 在预处理阶段, 对输入的彩色图像进行颜色通道分离, 并串联各通道经过SRM滤波后的残差图. 在特征提取阶段, 构建3个基于中心差分卷积的卷积块来提取更深层的隐写分析特征图. 在分类阶段, 使用全局协方差池化和带有丢弃操作的两个全连接层来对载体和载密图像进行分类. 此外, 为了进一步增强主干流在不同时期的特征表达能力, 在主干流的前期和后期分别引入一个残差空间注意力增强模块和一个通道注意力增强模块. 其中, 残差空间注意力增强模块首先使用Gabor滤波核对输入图像进行通道分离卷积再串联相应的残差, 然后通过空间注意力机制获取残差特征图的有效信息. 而通道注意力增强模块则通过获取通道间的依赖关系来增强模型最后的特征分类能力. 进行大量的对比实验, 结果表明所提出方法可以显著提高对彩色图像隐写的检测性能, 并取得当前最好的结果. 此外, 还进行相应的消融实验来验证所提出的网络架构的合理性.

    • 面向医学图像融合的多尺度特征频域分解滤波

      2024, 35(12):5687-5709. DOI: 10.13328/j.cnki.jos.007083 CSTR: 32375.14.jos.007083

      摘要 (426) HTML (67) PDF 6.03 M (1580) 评论 (0) 收藏

      摘要:多模态医学图像融合技术可以实现不同模态数据反映的组织结构与病变信息的融合, 为后续医疗诊断、手术导航等临床应用提供更为全面和准确的医学图像分析. 针对现有融合方法中存在的部分光谱退化、黏连病变侵袭区域边缘和细节缺失和色彩还原不足等问题, 提出一种在多尺度特征频域分解滤波域内实现图像多特征增强和色彩保留的多模态医学图像融合方法. 该方法将源图像分解为平滑、纹理、轮廓和边缘这4个特征层, 分别利用特定融合规则并通过图像重构产生融合结果. 特别地, 鉴于平滑层所含潜在特征信息, 提出视觉显著性分解策略, 多尺度多维度地挖掘平滑层图像能量、部分纤维纹理等特征, 提升源图像信息利用率; 在纹理层中, 提出纹理增强算子, 通过空间结构和信息度量提取细节及其层次信息, 解决现有融合方法中对黏连病变区域侵袭状态难以区分等问题. 此外, 针对缺乏公开腹部数据集的问题, 配准403组腹部图像可供公开访问和下载. 在Atlas公开数据集和腹部数据集上与6种基准方法对比及消融实验结果表明, 所提方法相较于最先进的方法在融合图像与源图像相似度提升22.92%, 边缘保持度提升35.79%, 空间频率提升28.79%, 对比度提升32.92%, 并在视觉和计算效率方面有较好的效果, 明显优于其他方法.

    • SDAA: 面向申威智能加速卡的运行时系统

      2024, 35(12):5710-5724. DOI: 10.13328/j.cnki.jos.007084 CSTR: 32375.14.jos.007084

      摘要 (299) HTML (70) PDF 10.02 M (1412) 评论 (0) 收藏

      摘要:自主研制的申威智能加速卡上搭载了脉动阵列增强的申威众核处理器, 其智能计算能力与主流GPU相当, 但仍缺少配套的基础软件. 为降低申威智能加速卡的使用门槛, 有效支撑人工智能应用开发, 设计面向申威智能加速卡的运行时系统SDAA, 语义与主流的CUDA运行时保持一致. 针对内存管理、数据传输、核函数启动等关键路径, 采用软硬协同的设计方法实现卡上段页结合的多级内存分配算法、可分页内存多线程多通道的传输模型、多异构部件自适应的数据传输算法和基于片上阵列通信的快速核函数启动方法, 使得SDAA运行时性能优于主流GPU. 实验结果表明, SDAA运行时系统的内存分配速度是NVIDIA V100对应接口的120倍, 数据传输开销是对应接口的1/2, 数据传输带宽达到对应接口的1.7倍, 核函数启动时间与对应接口相当. SDAA运行时已支撑主流框架和实际模型训练在申威智能加速卡上的高效运行.

    • 跨设备联邦学习中的客户端选择算法

      2024, 35(12):5725-5740. DOI: 10.13328/j.cnki.jos.007085 CSTR: 32375.14.jos.007085

      摘要 (558) HTML (99) PDF 4.98 M (1961) 评论 (0) 收藏

      摘要:联邦学习是一种新型的分布式机器学习范式, 它在满足用户隐私和数据保密性要求的前提下, 充分利用众多分散客户端的计算能力及其本地数据联合训练机器学习模型. 在跨设备联邦学习场景下, 客户端通常由数千甚至万级别的移动设备或端侧设备组成, 由于通信和计算成本的限制, 聚合服务器在每个训练轮次中仅选择少量客户端加入训练. 几种被广泛应用的联邦优化算法均采用完全随机的客户端选择算法, 但这被证明有着很大的优化空间. 近年来, 如何高效可靠地从海量异构客户端中选择合适的集合参与训练, 以优化联邦学习协议的资源消耗和模型性能被广泛研究, 但仍没有文献对这一关键问题进行综合调研. 需要对跨设备联邦学习的客户端选择算法研究进行全面调研. 具体地, 形式化描述客户端选择问题, 然后给出对选择算法的分类并逐一深入讨论分析. 最后, 讨论客户端选择算法的一些未来研究方向.

当期目录


文章目录

过刊浏览

年份

刊期

联系方式
  • 《软件学报 》
  • 主办单位:中国科学院软件研究所
                     中国计算机学会
  • 邮编:100190
  • 电话:010-62562563
  • 电子邮箱:jos@iscas.ac.cn
  • 网址:https://www.jos.org.cn
  • 刊号:ISSN 1000-9825
  •           CN 11-2560/TP
  • 国内定价:70元
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号