2021年第32卷第8期文章目次

2021, 32(8):2287-2288. DOI: 10.13328/j.cnki.jos.006009

摘要 (1660) HTML (1722) PDF 128.29 K (2757) 评论 (0) 收藏

摘要:中国科学院首个 C 类战略性先导科技专项 XDC01000000 主要目标已经达到.在数值软件层面,该先导专项第 1 阶段的主要任务是在复杂异构先进计算系统上研制高水平的基准测试软件 HPL(high performance Linpack)和 HPCG(high performance conjugate gradients). HPL 与 HPCG 是国际上最受关注的用于评测高性能计算机浮点运算性能的两款基准测试软件.HPL 通过高斯消去法求解稠密线性代数方程组来评测高性能计算机浮点性能的实际持续峰值,是目前全球超级计算机TOP500 以及中国高性能计算机 TOP100 排行榜的依据.HPCG 是求解稀疏代数方程组的一种迭代算法.HPCG基准测试在国际上受到广泛关注,与 HPL 相比,在一定程度上更能真实地反映高性能计算机的实际应用性能.全球超级计算机 TOP500 以及中国高性能计算机 TOP100 均提供 HPCG 性能排行榜.如今,以计算速度为目标的HPL 与 HPCG 基准测试,不仅为高性能计算机性能排名提供一种依据,更已成为一种被高性能计算提供商、研究机构与应用部门广为接受的工业标准. 先导专项先后两次开展了 HPL 与 HPCG 基准测试,其效率和可扩展性超过了先导专项的要求.据此,先导专项顺利通过了中国高性能计算机性能 TOP100 排行榜专家组的鉴定,并得到了中国计算机协会专家组的肯定. 为此,《软件学报》编辑部特开设“国产复杂异构高性能数值软件的研制与测试”专题.专题拟聚焦国产复杂异构先进计算系统下的高性能计算软件、算法与测试技术,探讨软硬件总体结构与软件在先进计算系统中的地位与作用.专题定向邀请参与先导专项的兄弟单位研究团队,从学术层面交流复杂异构系统下的高性能计算基础软件的研制和优化的各种关键技术,总结高性能计算软件和应用研究中的挑战与对策.内容重点涵盖先进计算系统基准评测软件 HPL、HPCG 等的研制、调优与测试及相应 BLAS 等基础代数库的优化,也包含了若干高性能应用算法与软件的研制进展. 专题收到 8 篇投稿,先后邀请了十几位领域专家参与审稿,每篇稿件都由 3 位专家历经 2 轮或 3 轮审稿,最终有 7 篇论文入选本专题.

异构HPL算法中CPU端高性能BLAS库优化

蔡雨，孙成国，杜朝晖，刘子行，康梦博，李双双

2021, 32(8):2289-2306. DOI: 10.13328/j.cnki.jos.006002

摘要 (1684) HTML (3101) PDF 979.90 K (3704) 评论 (0) 收藏

摘要:异构HPL（high-performance Linpack）效率的提高需要充分发挥加速部件和通用CPU计算能力，加速部件集成了更多的计算核心，负责主要的计算，通用CPU负责任务调度的同时也参与计算.在合理划分任务、平衡负载的前提下，优化CPU端计算性能对整体效率的提升尤为重要.针对具体平台体系结构特点对BLAS（basic linear algebra subprograms）函数进行优化往往可以更加充分地利用通用CPU计算能力，提高系统整体效率.BLIS（BLAS-like library instantiation software）算法库是开源的BLAS函数框架，具有易开发、易移植和模块化等优点.基于异构系统平台体系结构以及HPL算法特点，充分利用三级缓存、向量化指令和多线程并行等技术手段优化CPU端调用的各级BLAS函数，应用auto-tuning技术优化矩阵分块参数，从而形成了HygonBLIS算法库.与MKL相比，在异构环境下，HPL算法整体性能提高了11.8%.

复杂异构计算系统HPL的优化

黎雷生，杨文浩，马文静，张娅，赵慧，赵海涛，李会元，孙家昶

2021, 32(8):2307-2318. DOI: 10.13328/j.cnki.jos.006003

摘要 (1768) HTML (2945) PDF 794.89 K (3520) 评论 (0) 收藏

摘要:当今世界的主流超级计算机越来越多地使用带有加速器的异构系统.随着加速器的浮点性能不断提高，超级计算机内计算节点的CPU、内存、总线、网络以及系统架构都要与之相适应.HPL（high performance Linpack）是高性能计算机评测的传统基准测试程序，复杂异构系统给HPL评测带来很多机遇与挑战.针对带有GPU的异构超级计算机系统，提出一套新的CPU与加速器计算任务分配方式，提出平衡点理论指导HPL性能优化.为了优化HPL程序，提出了使用CPU与加速器协同工作的look-ahead算法和行交换连续流水算法，实现了加速器、CPU、网络等部件的高度并行.此外，为带有加速器的系统设计了新的panel分解和行交换的实现方法，提高了加速器的利用率.在每个节点带有4个GPU的系统上，单节点HPL效率达到了79.51%.

国产异构系统上HPL的优化与分析

水超洋，于献智，王银山，谭光明

2021, 32(8):2319-2328. DOI: 10.13328/j.cnki.jos.006004

摘要 (1659) HTML (2571) PDF 1.09 M (3399) 评论 (0) 收藏

摘要:随着异构系统成为建造超级计算机的重要选择，如何让CPU与加速器协调工作以充分发挥异构系统的计算性能具有重要意义.HPL是高性能计算领域最重要的基准测试程序，传统面向纯CPU系统的HPL算法通过加速器加速矩阵乘法的做法已经无法取得很好的性能.针对这一问题，提出了基于国产处理器-国产加速器异构系统的HPL性能模型和多线程细粒度流水HPL算法.完成了一个轻量级跨平台异构加速框架HPCX，以实现跨平台的HPL算法.该性能模型能够准确地预测类似异构系统的HPL性能.该HPL算法在NVIDIA GPU平台上性能超过了NVIDIA官方闭源nvhpl程序9%.在国产处理器-国产加速器平台512个节点的规模上，优化的HPL算法实现了2.3 PFLOPS实测峰值性能和71.1%的浮点效率.

面向异构计算机平台的HPL方案

孙乔，孙家昶，马文静，赵玉文

2021, 32(8):2329-2340. DOI: 10.13328/j.cnki.jos.006005

摘要 (1475) HTML (2340) PDF 1.57 M (3055) 评论 (0) 收藏

摘要:HPL（high performance Linpack）是一套被广泛用于测评计算机性能的测试程序，几十年来学术界及产业界十分关注对HPL测试程序的定制化优化工作，以充分反应同时代新兴计算机平台的性能.面向当今主流多设备异构计算平台，尝试为HPL的优化工作提供一种解决方案：Hetero-HPL.在Hetero-HPL中，进程与协处理器的对应关系可被改变，因此HPL算法在单节点独立运行情况下可以完全避免进程间数据传输开销.算法各个重要步骤有能力完全利用物理节点的所有资源，如内存容量、CPU核心、协处理器、PCI-e总线等.Hetero-HPL并不引入冗余计算量及通信量，并在任意设备数量下妥善应对锁页内存分配限制，确保多设备负载均衡和设备内高效的大规模同质运算.在实验平台上，Hetero-HPL效率可以达到平台峰值性能的76.5%（其中，dgemm函数效率为84%）.进一步的实验结果表明，Hetero-HPL在多节点联机运行情况下也是一种可行的方案.

国产异构系统上的HPCG并行算法及高效实现

刘芳芳，王志军，汪荃，吴丽鑫，马文静，杨超，孙家昶

2021, 32(8):2341-2351. DOI: 10.13328/j.cnki.jos.006006

摘要 (1450) HTML (2771) PDF 2.44 M (3189) 评论 (0) 收藏

摘要:HPCG基准测试程序是一种新的超级计算机排名度量标准.该测试基准主要用于衡量超级计算机解决大规模稀疏线性系统的能力，更贴近实际应用，近年来广受关注.基于国产超级计算机研究异构众核并行HPCG软件具有非常重要的意义，其不仅可以提升国产超级计算机HPCG的排名，还对很多应用提供了并行算法、优化技术等方面的参考.面向某国产复杂异构超级计算机开展研究，首先采用了分块图着色算法对HPCG进行并行，并提出一种适用于结构化网格的图着色算法.该算法并行性能高于传统的JPL、CC等算法，且着色质量高，运用于HPCG后，迭代次数减少了3次，整体性能提升了6%.分析了复杂异构系统各个部件传输的开销，提出一套更适用于HPCG的任务划分方法，并从稀疏矩阵存储格式、稀疏矩阵重排、访存等角度开展了细粒度的优化.在多进程计算时，还采用内外区划分算法将核心函数SpMV、SymGS中的邻居通信操作进行了隐藏.最终整机测试时，性能达到了国产超级计算机峰值性能的1.67%，与单节点相比，整机弱可扩展性并行效率达到了92%.

SW26010众核任务并行调度系统及其嵌套并行算法应用

孙乔，黎雷生，赵海涛，赵慧，吴长茂

2021, 32(8):2352-2364. DOI: 10.13328/j.cnki.jos.006007

摘要 (1287) HTML (1951) PDF 1.15 M (2788) 评论 (0) 收藏

摘要:任务并行是并行程序设计的基础设计模式.但由于算法本身的复杂性及目标平台的特殊性，设计实现高效率的任务并行程序对程序员来说往往充满挑战.基于新兴的SW26010众核CPU，提出了支持任务嵌套并行模式的通用运行时框架SWAN.SWAN对任务并行程序的实现提供了高层次的抽象，使程序员能够专注于算法逻辑本身而提高开发效率.在性能方面，SWAN框架对诸多共享资源进行了细粒度的划分，从而有效地避免了众多线程间对共享资源的高强度争用.充分利用平台的高速访存机制、高速可控缓存和原子操作等特性，对SWAN框架的核心数据结构进行优化设计以降低其本身的性能开销.SWAN还具备动态负载均衡能力，使各个处理器核心的资源得以充分利用.基于SWAN框架，在目标平台上实现了若干典型的具有递归特性的嵌套并行算法，包括N-皇后问题、二叉树遍历、快速排序和凸包求解.实验结果表明，这些通过使用SWAN框架得以并行化的算法相对于其串行版本取得了4.5~32倍的加速，充分说明了SWAN框架具有较高的实用性及性能.

面向异构计算的高性能计算算法与软件

徐顺，王武，张鉴，姜金荣，金钟，迟学斌

2021, 32(8):2365-2376. DOI: 10.13328/j.cnki.jos.006008

摘要 (1736) HTML (2433) PDF 1.36 M (4017) 评论 (0) 收藏

摘要:研发适应国产异构计算环境的高性能计算算法与软件是非常重要的课题，对我国高性能计算软件研发匹配高性能计算硬件高水平发展的速度具有重要意义.首先，简要介绍高性能计算应用软件的现状、趋势和面临挑战，并对几类典型高性能计算应用软件开展并行计算算法特征分析，涵盖了宇宙N体模拟、地球系统模式、计算材料相场动力学、分子动力学、量子计算化学和格点量子色力学等多个问题、尺度和领域.其次，讨论了面向国产异构计算系统的对策，提炼出若干典型应用算法和软件的共性问题，涉及核心算法、算法发展、优化策略等.最后，面向异构计算体系结构，对高性能计算算法与软件进行了总结.

泛在嵌入式智能系统专题前言

郭兵，王泉，邓庆绪，陈铭松，张凯龙

2021, 32(8):2377-2378. DOI: 10.13328/j.cnki.jos.006194

摘要 (1235) HTML (1310) PDF 296.25 K (2614) 评论 (0) 收藏

摘要:目前,世界范围的科技革命和产业变革正在孕育兴起,一些重要科学问题和关键核心技术正在呈现革命性的突破先兆.同时,“万物智联”时代正在加速到来,IOT/CPS、AIOT 等蓬勃发展,以泛在感知、泛在互联、泛在智能为特征的各类智慧系统,以嵌入式系统为基础,与大数据、区块链、云计算呈现融合发展趋势.随着人工智能技术和嵌入式AI 芯片技术的发展,人工智能已经开始逐步向嵌入式系统迁移,尤其是伴随着机器人、无人机、无人车等智能设备的技术成熟,越来越多的应用系统需要在以边缘计算为主的嵌入式系统上实现.目前,嵌入式系统应用前景愈发广阔,如5G 通信、智能制造、智能电网、智能交通、国防军事、航空航天、智能网联汽车、数字医疗设备、机器人、智慧家庭、智能建筑等产业的创新发展都与嵌入式系统的技术发展息息相关. 本专题采取定向邀请和自由投稿相结合的方式,共收到 9 篇投稿,其中 8 篇通过了形式审查.特约编辑邀请了13 位领域专家参与审稿,每篇稿件至少邀请2 位专家进行评审,每篇稿件都经过2 轮审稿.共计6 篇稿件通过第1 轮评审,并在CCF 形式化方法专委会年度会议上进行了报告.经过第2 轮终审,最终有6 篇论文入选本专题.

基于1D-CNN联合特征提取的轴承健康监测与故障诊断

刘立，朱健成，韩光洁，毕远国

2021, 32(8):2379-2390. DOI: 10.13328/j.cnki.jos.006188

摘要 (3298) HTML (2967) PDF 1.04 M (5991) 评论 (0) 收藏

摘要:针对特定机械设备构建数据驱动的故障诊断模型缺乏泛化能力，而轴承作为各型机械的共有核心部件，对其健康状态的判定对不同机械的衍生故障分析具有普适性意义.提出了一种基于1D-CNN（one-dimensional convolution neural network）联合特征提取的轴承健康监测与故障诊断算法.算法首先对轴承原始振动信号进行分区裁剪，裁剪获得的信号分区作为特征学习空间并行输入1D-CNN中，以提取各工况下的代表性特征域.为了避免对故障重叠信息的处理，优先使用对健康状态敏感的特征域构建轴承健康状态判别模型，若健康状态判别模型识别轴承未处于健康状态，特征域将与原始信号联合重构，通过耦合自动编码器开展故障模式判定.使用凯斯西储大学（Case Western Reserve University）的轴承数据开展实验，结果表明，该算法继承了深层学习模型的准确性和鲁棒性，具有较高的故障诊断精度和较低的诊断时延.

一种超低损失的深度神经网络量化压缩方法

龚成，卢冶，代素蓉，刘方鑫，陈新伟，李涛

2021, 32(8):2391-2407. DOI: 10.13328/j.cnki.jos.006189

摘要 (2687) HTML (2429) PDF 1.80 M (4675) 评论 (0) 收藏

摘要:深度神经网络（deep neural network，简称DNN）量化是一种高效的模型压缩方法，使用少量位宽表示模型计算过程中的参数和中间结果数据.数据位宽会直接影响内存占用、计算效率和能耗.以往的模型量化研究缺乏有效的定量分析，这导致量化损失难以预测.提出了一种超低损失的DNN量化方法（ultra-low loss quantization，简称μL2Q），以揭示量化位宽与量化损失之间的内在联系，指导量化位宽选择并降低量化损失.首先，将原始数据映射为标准正态分布的数据；然后，在等宽的量化区间中搜索最优量化参数；最后，将μL2Q方法融合进DNN的训练过程，并嵌入到主流的机器学习框架Caffe及Keras中，以支撑端到端模型压缩的设计和训练.实验结果表明，与最新的研究方法相比，在相同的位宽条件下，mL2Q方法能够保证更高的模型精度，在典型的神经网络模型上精度分别提高了1.94%，3.73%和8.24%.显著性物体检测实验结果表明，μL2Q方法能够胜任复杂的计算机视觉任务.

基于强化学习的温度感知多核任务调度

杨世贵，王媛媛，刘韦辰，姜徐，赵明雄，方卉，杨宇，刘迪

2021, 32(8):2408-2424. DOI: 10.13328/j.cnki.jos.006190

摘要 (3030) HTML (2527) PDF 1.99 M (4627) 评论 (0) 收藏

摘要:随着计算机中内核数量的增多，温度感知的多核任务调度算法成为计算机系统中的一个研究热点.近年来，机器学习在各个领域展现出巨大的潜力，很多基于机器学习的系统温度管理研究工作应运而生.其中，强化学习因其较强的自适应性，被广泛地运用于温度感知的任务调度算法中.然而，目前基于强化学习的温度感知任务调度算法系统建模不够准确，很难做到温度、性能和复杂度的较好权衡.因此，提出一种基于强化学习的多核温度感知调度算法——ReLeTA.在该算法中提出了更全面的状态建模方式和更加有效的奖励函数，从而帮助系统进一步降低温度.实验部分通过3个不同的真实计算机平台验证该方法，实验结果表明了该方法的有效性以及可扩展性，与现有方法相比，ReLeTA可以更好地控制系统温度.

面向优先车辆感知的交通灯优化控制方法

邵明莉，曹鹗，胡铭，章玥，陈闻杰，陈铭松

2021, 32(8):2425-2438. DOI: 10.13328/j.cnki.jos.006191

摘要 (2301) HTML (2060) PDF 1.80 M (4214) 评论 (0) 收藏

摘要:智慧交通灯控制能够有效地改善道路交通的秩序和效率.在城市交通网络中，具有紧急任务的特殊车辆对于通行效率的要求更高.目前已有的智慧交通灯控制算法通常对路网中的所有车辆一视同仁，没有考虑到特殊车辆的优先性；而传统的控制特殊车辆优先通行的方法基本上都是采用信号抢占的方式，对普通车辆的通行干扰过大.为此，提出一种面向优先车辆感知的交通灯优化控制方法，通过与道路环境的不断交互来学习交通灯控制策略，在设置状态和奖励函数时增加特殊车辆的权重，并利用Double DQN和Dueling DQN来提升模型表现，最终在城市交通模拟器SUMO中进行仿真实验.在训练趋于稳定之后，与固定时长控制方法的对比实验结果显示，该方法能够将特殊车辆与普通车辆的平均等待时间分别缩短68%与22%左右；与不考虑优先级的方法相比，特殊车辆的平均等待时间也有35%左右的优化.验证了该方法能够在提高车辆通行效率的同时，体现出对特殊车辆的优先处理.同时，实验也表明该方法能够扩展应用于多路口场景中.

一种基于功率调控的WiFi Direct节能优化机制

郭镇北，李福亮，梁博成，张小瑞，孙磊

2021, 32(8):2439-2456. DOI: 10.13328/j.cnki.jos.006192

摘要 (2064) HTML (2714) PDF 1.85 M (3808) 评论 (0) 收藏

摘要:WiFi Direct（WFD）是安卓系统广泛支持的Device-to-Device（D2D）通信技术.相比于蓝牙，WFD在传输速率和连接距离上更具优势；同时，WFD能够比WiFi热点更快速地创建连接.因此被广泛应用于构建D2D通信网络，用以支持边缘计算、流量卸载、移动众包等研究.但是WFD同时带来了更高的能耗，而能耗仍然是电池受限的嵌入式设备所关注的主要问题.现有的研究关注WFD的性能测量和组网技术，很少有对其能耗的研究.提出了一种基于功率调控的WFD节能机制.该机制对WFD默认节能算法进行了补充和优化.首先，搭建了一个基于WFD的D2D通信组，并对WFD默认节能机制进行了测量分析，测量结果表明，组主的消耗始终要高于组员的消耗.然后，详细阐述了所提出的WFD节能机制.该机制能够降低设备的传输能耗，并通过切换设角色来平衡组主的能耗.最后，仿真实验结果表明，该机制降低了11.86%的能耗，同时只损失了2%的吞吐量.

基于木马的方式增强RRAM计算系统的安全性

邹敏辉，周俊龙，孙晋，汪成亮

2021, 32(8):2457-2468. DOI: 10.13328/j.cnki.jos.006193

摘要 (2067) HTML (1995) PDF 1.72 M (3229) 评论 (0) 收藏

摘要:基于新型存储器件RRAM的计算系统因为能够在内存中执行矩阵点乘向量运算而受到广泛的关注.然而，RRAM计算系统的安全性却未受到足够的重视.攻击者通过访问未授权的RRAM计算系统，进而以黑盒攻击的方式来获取存储于RRAM计算系统中的神经网络模型.以阻止此种攻击为目标，所提出的防御方法是基于良性木马，即当RRAM计算系统未授权时，系统中的木马极容易被激活，进而影响系统的输出预测准确性，从而保证系统不能正常运行；当RRAM计算系统被授权时，系统中的木马极难被误激活，从而系统能够正常运行.实验结果表明，该方法能够使未授权的RRAM计算系统的输出预测准确性降低至15%以下，并且硬件开销小于系统中RRAM硬件的4.5%.

浏览器同源策略安全研究综述

罗武，沈晴霓，吴中海，吴鹏飞，董春涛，夏玉堂

2021, 32(8):2469-2504. DOI: 10.13328/j.cnki.jos.006153

摘要 (2781) HTML (2872) PDF 1.48 M (9365) 评论 (0) 收藏

摘要:随着云计算和移动计算的普及，浏览器应用呈现多样化和规模化的特点，浏览器的安全问题也日益突出.为了保证Web应用资源的安全性，浏览器同源策略被提出.目前，RFC6454、W3C和HTML5标准都对同源策略进行了描述与定义，诸如Chrome、Firefox、Safari、Edge等主流浏览器均将其作为基本的访问控制策略.然而，浏览器同源策略在实际应用中面临着无法处理第三方脚本引入的安全威胁、无法限制同源不同frame的权限、与其他浏览器机制协作时还会为不同源的frame赋予过多权限等问题，并且无法保证跨域/跨源通信机制的安全性以及内存攻击下的同源策略安全.对浏览器同源策略安全研究进行综述，介绍了同源策略的规则，并概括了同源策略的威胁模型与研究方向，主要包括同源策略规则不足及应对、跨域与跨源通信机制安全威胁及应对以及内存攻击下的同源策略安全，并且展望了同源策略安全研究的未来发展方向.

检测JavaScript类的内聚耦合Code Smell

黄子杰，陈军华，高建华

2021, 32(8):2505-2521. DOI: 10.13328/j.cnki.jos.006082

摘要 (1339) HTML (992) PDF 1.62 M (2787) 评论 (0) 收藏

摘要:Code Smell是软件程序中存在不良设计和不良实现的征兆.正确地检测和识别Code Smell可以指导软件重构，提高软件的可用性和可靠性.通过Code Smell的度量指标，可以量化软件的设计问题.JavaScript已成为最常用的编程语言之一，类是JavaScript的设计模式，优秀类的设计体现为高内聚和低耦合.现有关于JavaScript内聚耦合的Code Smell研究均在微观的层面，即函数和语句上进行.它们可以提供程序实现的重构建议，但无法分析内聚耦合相关的软件系统设计问题.针对FE、DC和Blob这3种类的内聚耦合Code Smell，提出一种JavaScript类的内聚耦合Code Smell检测方法JS4C.该方法基于静态分析，同时适用于客户端和服务端程序.它通过遍历软件系统中所有的类，利用源程序的文本相似度特征和结构特征，识别Code Smell并检测其强度.在结构特征检测中，JS4C使用了经扩展的对象类型推断及非严格的耦合分散度度量法NSCDISP，有效地降低了解释型语言的静态分析过程中，类型信息缺失对检测产生的影响.实验通过对6个开源项目的分析表明，JS4C对内聚耦合设计问题有良好的检测效果.

视觉问答研究综述

包希港，周春来，肖克晶，覃飙

2021, 32(8):2522-2544. DOI: 10.13328/j.cnki.jos.006215

摘要 (3665) HTML (4763) PDF 972.98 K (6574) 评论 (0) 收藏

摘要:视觉问答是计算机视觉领域和自然语言处理领域的交叉方向，近年来受到了广泛关注.在视觉问答任务中，算法需要回答基于特定图片（或视频）的问题.自2014年第一个视觉问答数据集发布以来，若干大规模数据集在近5年内被陆续发布，并有大量算法在此基础上被提出.已有的综述性研究重点针对视觉问答任务的发展进行了总结，但近年来，有研究发现，视觉问答模型强烈依赖语言偏见和数据集的分布，特别是自VQA-CP数据集发布以来，许多模型的效果大幅度下降.主要详细介绍近年来提出的算法以及发布的数据集，特别是讨论了算法在加强鲁棒性方面的研究.对视觉问答任务的算法进行分类总结，介绍了其动机、细节以及局限性.最后讨论了视觉问答任务的挑战及展望.

基于关联记忆网络的中文细粒度命名实体识别

琚生根，李天宁，孙界平

2021, 32(8):2545-2556. DOI: 10.13328/j.cnki.jos.006114

摘要 (1437) HTML (1496) PDF 510.78 K (2878) 评论 (0) 收藏

摘要:细粒度命名实体识别是对文本中的实体进行定位，并将其分类至预定义的细粒度类别中.目前，中文细粒度命名实体识别仅使用预训练语言模型对句子中的字符进行上下文编码，并没有考虑到类别的标签信息具有区分实体类别的能力.由于预测句子不带有实体标签，使用关联记忆网络来捕获训练集句子的实体标签信息，并将标签信息融入预测句子的字符表示中.该方法将训练集中带实体标签的句子作为记忆单元，利用预训练语言模型获取原句子和记忆单元句子的上下文表示，再通过注意力机制将记忆单元句子的标签信息与原句子的表示结合，从而提升识别效果.在CLUENER 2020中文细粒度命名实体识别任务上，该方法对比基线方法获得了提升.

Storm平台下的线程重分配与数据迁移节能策略

蒲勇霖，于炯，鲁亮，李梓杨，卞琛，廖彬

2021, 32(8):2557-2579. DOI: 10.13328/j.cnki.jos.006074

摘要 (904) HTML (920) PDF 1.45 M (2299) 评论 (0) 收藏

摘要:作为流式大数据计算的主要平台之一，Storm在设计过程中由于缺乏节能的考虑，导致其存在高能耗与低效率的问题.传统的节能策略并未考虑Storm的性能约束，可能会对集群的实时性造成影响.针对这一问题，设计了资源约束模型、最优线程重分配模型以及数据迁移模型.进一步提出了Storm平台下的线程重分配与数据迁移节能策略（energy-efficient strategy based on executor reallocation and data migration in Storm，简称ERDM），包括资源约束算法与数据迁移算法.其中，资源约束算法根据集群各工作节点CPU、内存与网络带宽的资源占用率，判断集群是否允许数据的迁移.数据迁移算法根据资源约束模型与最优线程重分配模型，设计了数据迁移的最优化方法.此外，ERDM通过分配线程减少了节点间的通信开销，并根据大数据流式计算的性能与能效评估ERDM.实验结果表明，与现有研究相比，ERDM能够有效降低节点间通信开销与能耗，并提高集群的性能.

多等级通信半径的无源传感器网络中的覆盖问题

石拓，李建中，高宏

2021, 32(8):2580-2596. DOI: 10.13328/j.cnki.jos.006216

摘要 (1218) HTML (1168) PDF 1.07 M (2402) 评论 (0) 收藏

摘要:无源传感器网络是近年来兴起的一种新型的网络结构，可用于解决传统无线传感器网络能量有限、寿命受限的问题.在无源传感器网络中，每个无源传感器节点配备有能量收集模块，可以从周围环境中获取能量.由于周围环境中的能量是无限的，这样，从能量的角度来讲，无源传感器网络的网络寿命是无限的.这样就解决了传统无线传感器网络寿命受限的问题.然而，由于周围环境中的能量源具有能量低、分布不均匀等特点，导致无源传感器网络中的覆盖问题比传统的无线传感器网络中的覆盖问题更加复杂.为了解决无源传感器网络中的覆盖问题，同时也为了让无源节点更有效地利用环境中的能量，考虑了一种具有多等级通信半径的无源节点，并提出了基于多等级通信半径的无源传感器网络中的覆盖问题.证明了这个问题是NP-Hard问题.提出一种基于贪心策略的近似算法，解决了这个问题，并证明了该算法的近似比.同时，采用模拟实验的方式验证了该算法的性能.根据实验结果，该算法是有效且可靠的.

基于节点运动的机会网络路由算法

张棋飞，桂超，宋莺，孙宝林，戴志锋

2021, 32(8):2597-2612. DOI: 10.13328/j.cnki.jos.005985

摘要 (2144) HTML (1034) PDF 1.58 M (4040) 评论 (0) 收藏

摘要:机会网络利用节点移动带来的接触机会传输数据，数据在节点运动过程中捎带转发，保证了节点独立性，但会给数据传输带来影响.以节点的运动特性为切入点，设计了基于运动的机会网络路由算法.综合考虑数据传输、数据内容以及应用需求等因素，设计了数据转发优先级评价模型，结合节点活动区间划分方案制定数据传输规则；设计了差异化副本传输策略，在数据传输效率和系统开销之间取得折衷；考虑了节点活动范围、中心度及能量水平，构建了运动自由度函数评估节点运动水平.在此基础上设计了效用函数，选择中继节点转发数据.仿真结果表明，该算法能够在满足传输要求的同时限制网络开销，提高分组投递率，降低传输时延.

基于联盟链的物联网跨域认证

魏欣，王心妍，于卓，郭少勇，邱雪松

2021, 32(8):2613-2628. DOI: 10.13328/j.cnki.jos.006033

摘要 (1561) HTML (915) PDF 704.59 K (3282) 评论 (0) 收藏

摘要:针对物联网场景下跨信任域的信息交换需求，结合区块链与边缘计算思想，构建了一种适应于物联网认证的架构.首先，基于联盟链技术设计了适应于物联网跨域认证的架构及流程，构建了安全的跨域信息交互环境；随后引入边缘网关，以屏蔽物联网的底层异构性，并设计了基于网关的跨域认证流程，增强了物联网认证中的隐私保护；最后，针对设计协议的安全性进行了分析，证明其可抵抗物联网场景下的常见攻击.实验结果表明，该设计方案在计算和通信开销上优于传统方案，可用于物联网.

微信服务号

微信订阅号

>专刊文章

>综述文章

>综述文章

当期目录

年份

刊期