2020, 31(9):2625-2626. DOI: 10.13328/j.cnki.jos.005947
摘要:
2020, 31(9):2627-2653. DOI: 10.13328/j.cnki.jos.005942
摘要:深度神经网络已经被证明可以有效地解决图像、自然语言等不同领域的问题.同时,伴随着移动互联网技术的不断发展,便携式设备得到了迅速的普及,用户提出了越来越多的需求.因此,如何设计高效、高性能的轻量级神经网络,是解决问题的关键.详细阐述了3种构建轻量级神经网络的方法,分别是人工设计轻量级神经网络、神经网络模型压缩算法和基于神经网络架构搜索的自动化神经网络架构设计;同时,简要总结和分析了每种方法的特点,并重点介绍了典型的构建轻量级神经网络的算法;最后,总结现有的方法,并给出了未来发展的前景.
2020, 31(9):2654-2677. DOI: 10.13328/j.cnki.jos.005946
摘要:深度学习算法和GPU算力的不断进步,正促进着人工智能技术在包括计算机视觉、语音识别、自然语言处理等领域得到广泛应用.与此同时,深度学习已经开始应用于以自动驾驶为代表的安全攸关领域.但是,近两年接连发生了几起严重的交通事故表明,深度学习技术的成熟度还远未达到安全攸关应用的要求.因此,对可信人工智能系统的研究已经成为了一个热点方向.对现有的面向实时应用的深度学习领域的研究工作进行了综述,首先介绍了深度学习技术应用于实时嵌入式系统所面临的关键设计问题;然后,从深层神经网络的轻量化设计、GPU时间分析与任务调度、CPU+GPU SoC异构平台的资源管理、深层神经网络与网络加速器的协同设计等多个方面对现有的研究工作进行了分析和总结;最后展望了面向实时应用的深度学习领域进一步的研究方向.
2020, 31(9):2678-2690. DOI: 10.13328/j.cnki.jos.005937
摘要:Cartographer是谷歌在2016年开源的一个可以在多传感器配置下实现低计算资源消耗的SLAM算法框架.针对原有Cartographer中位姿融合不准确、存在延迟的问题,首先设计了一种基于位姿增量的多传感器位姿融合方法;随后,针对扫地机器人Player平台,设计并实现了基于增强Cartographer算法的多模块SLAM系统;最后,通过Cartographer数据集的实验分析和真实场景的实际测试,验证了增强Cartographer算法的有效性以及SLAM系统在Player机器人平台上的可用性.
2020, 31(9):2691-2708. DOI: 10.13328/j.cnki.jos.005938
摘要:目标追踪算法虽已在诸多领域得到广泛应用,然而由于实时性和功耗问题,使得基于深度学习模型的算法难以在移动终端设备上部署应用.结合边缘计算技术,从应用部署优化的角度,对目标追踪算法在移动设备上的部署策略进行研究.通过对目标追踪应用特点、移动设备特性以及边缘云网络架构的分析,提出一种面向边缘计算的目标追踪应用部署策略.通过任务分割策略,将目标追踪应用的计算任务合理卸载至边缘云,并利用信息融合策略对计算结果进行分析融合;此外,利用运动检测,进一步降低终端节点的计算压力和功耗.通过对不同部署策略进行对比实验,结果表明:相比计算任务本地计算,该部署策略明显降低了任务响应时间;相比完全卸载至边缘云,该部署策略降低了相同计算任务的处理时间.
2020, 31(9):2709-2722. DOI: 10.13328/j.cnki.jos.005940
摘要:SDN(software-defined network)旨在解决架构复杂且分散的传统网络出现的问题,使网络具有更强的灵活性.P4编程语言的特征在于用户可以直接根据自己对处理数据包的需求定义P4程序,然后经过编译过程,生成适配文件将用户需求配置到网络设备.面向P4编程语言的SDN数据平面一致性测试,是将一致性测试用例发送给P4网络设备,评估实际输出和预期输出的一致程度.一致性测试用例是执行一致性测试的载体,而传统的人工构造测试用例是一项繁琐耗时费力的工作.重点分析了面向P4编程语言的SDN数据平面软件一致性测试用例设计原则和生成方法,给出了一致性测试用例覆盖标准,设计了命令信息实体结构和测试用例实体结构,以装载P4程序的simple_switch虚拟交换机为测试对象,说明一致性测试用例生成过程,实现了一个用于P4网络设备一致性测试的测试用例自动生成工具,并验证了该工具自动生成测试用例的有效性,实现了一致性测试用例构造过程简易性.
2020, 31(9):2723-2740. DOI: 10.13328/j.cnki.jos.005941
摘要:当前,大数据及人工智能技术向嵌入式系统发展,对嵌入式系统的存储访问能力提出了更高的要求.磁畴壁存储器凭借其高读写速度、高密度以及低功耗等优点,可以用于嵌入式系统,以满足数据密集型应用对访问速度、容量及能耗的需求.但是磁畴壁存储器在进行数据访问之前需要进行移动操作,这将极大影响其存储访问性能.而减少移动操作可以有效提升磁畴壁存储器的性能.面向运行数据密集型应用的多读/写头磁畴壁存储器系统,研究减少移动操作的最优指令调度与数据放置技术.首先提出了可获得最小移动次数的整数线性规划(integer linear programming,简称ILP)模型.由于ILP模型不能在多项式时间内求得最优解,所以提出了多项式时间的启发式算法——生成指令调度和数据放置(generation instruction scheduling and data placement,简称GISDP)算法.实验结果表明,ILP模型和GISDP算法可以有效减少移动操作的次数.在配备8个读/写头的磁畴壁存储器上,GISDP算法生成的指令调度与数据放置方案相较其他算法可以平均减少89.7%的移动操作,并且GISDP算法的结果接近ILP模型的最优解.
2020, 31(9):2741-2755. DOI: 10.13328/j.cnki.jos.005939
摘要:AMOLED显示器作为嵌入式设备的高功耗组件,其功耗由显示内容中所有像素点的像素值决定;同时,人类视觉系统通过视觉关注机制对显示内容的重要区域优先解读,对非重要区域关注较低.基于上述特性,提出基于视觉显著性的AMOLED显示器多区域功耗优化方法.方法的核心是:通过视觉显著性算法对显示内容的重要区域进行提取,根据图像重要区域的特征图对AMOLED显示内容进行多区域划分,最后,基于视觉关注度对各区域进行动态像素调节,在不降低显示内容整体视觉效果的同时最小化显示功耗.最后,通过多组图像测试,结果表明:在保持图像较好的视觉效果的同时,可以降低图像显示功耗.
2020, 31(9):2756-2769. DOI: 10.13328/j.cnki.jos.005943
摘要:使用深度神经网络处理物联网设备的急剧增加产生的海量图像数据是大势所趋,但由于深度神经网络对于对抗样本的脆弱性,它容易受到攻击而危及物联网的安全.所以,如何提高模型的鲁棒性,就成了一个非常重要的课题.通常情况下,组合模型的防御表现要优于单模型防御方法,但物联网设备有限的计算能力使得组合模型难以应用.为此,提出一种在单模型上实现组合模型防御效果的模型改造及训练方法:在基础模型上添加额外的分支;使用特征金字塔对分支进行特征融合;引入整体多样性计算辅助训练.通过在MNIST和CIFAR-10这两个图像分类领域最常用的数据集上的实验表明,该方法能够显著提高模型的鲁棒性.在FGSM等4种基于梯度的攻击下的分类正确率有5倍以上的提高,在JSMA,C&W以及EAD攻击下的分类正确率可达到原模型的10倍.同时,不干扰模型对干净样本的分类精度,也可与对抗训练方法联合使用获得更好的防御效果.
2020, 31(9):2770-2784. DOI: 10.13328/j.cnki.jos.005944
摘要:智能仓储的优化一般分为货架优化和路径优化两部分:货架优化针对货物与货架两者的关系,对货物摆放位置进行优化;而路径优化主要寻找自动引导小车(automated guided vehicle,简称AGV)的最优路径.目前,大多的智能仓储优化仅对这两部分进行独立研究.在实际仓储应用中,只能以线性叠加的方式解决问题,导致问题的求解易陷入局部最优中.通过对智能仓储环节中各部分的关系进行耦合分析,提出了货位和AGV路径协同优化数学模型,将货架优化和路径规划归为一个整体;此外,提出了智能仓储协同优化框架的求解算法,包括货品相似度求解算法和改进的路径规划算法;并在以上两种算法的基础上,使用改进的遗传算法实现了货位路径协同优化.实验结果验证了所提出的智能仓储协同优化算法的有效性和稳定性.通过使用该算法,可有效提高仓储的出货效率,降低运输成本.
2020, 31(9):2785-2801. DOI: 10.13328/j.cnki.jos.005945
摘要:随着深度学习在计算机视觉领域的广泛应用,人脸认证、车牌识别、路牌识别等也随之呈现商业化应用趋势.因此,针对深度学习模型的安全性研究至关重要.已有的研究发现:深度学习模型易受精心制作的包含微小扰动的对抗样本攻击,输出完全错误的识别结果.针对深度模型的对抗攻击是致命的,但同时也能帮助研究人员发现模型漏洞,并采取进一步改进措施.基于该思想,针对自动驾驶场景中的基于深度学习的路牌识别模型,提出一种基于粒子群优化的黑盒物理攻击方法(black-box physical attack via PSO,简称BPA-PSO).BPA-PSO在未知模型结构的前提下,不仅可以实现对深度模型的黑盒攻击,还能使得实际物理场景中的路牌识别模型失效.通过在电子空间的数字图像场景、物理空间的实验室及户外路况等场景下的大量实验,验证了所提出的BPA-PSO算法的攻击有效性,可发现模型漏洞,进一步提高深度学习的应用安全性.最后,对BPA-PSO算法存在的问题进行分析,对未来的研究可能面临的挑战进行了展望.
2020, 31(9):2802-2825. DOI: 10.13328/j.cnki.jos.006085
摘要:故障检测率FDR(fault detection rate)是可靠性研究的关键要素,对于测试环境构建、故障检测效率提升、可靠性建模和可靠性增长具有重要作用,对于提高系统可靠性与确定发布时间具有重要现实意义.首先,对基于NHPP(non-homogeneous poisson process,非齐次泊松过程)类的软件可靠性增长模型SRGM(software reliability growth mode)进行概述,给出了建模本质、功用与流程.基于此,引出可靠性建模与研究中的关键参数——FDR,给出定义,对测试环境描述能力进行分析,展示不同模型的差异.着重剖析了FDR与失效强度、冒险率(风险率)的区别,得出三者之间的关联性表述.全面梳理了FDR的大类模型,分别从测试覆盖函数视角、直接设定角度、测试工作量函数参与构成方式这3个方面进行剖析,继而提出统一的FDR相关的可靠性模型.考虑到对真实测试环境描述能力的需要,建立不完美排错框架模型,衍生出不完美排错下多个不同FDR参与的可靠性增长模型.进一步,在12个真实描述应用场景与公开发表的失效数据集上进行实验,验证不同FDR模型相关的可靠性模型效用,对差异性进行分析与讨论.结果表明,FDR模型自身的性能可以支撑可靠性模型性能的提升.最后,指出了未来研究趋势和需要解决的问题.
2020, 31(9):2826-2854. DOI: 10.13328/j.cnki.jos.006087
摘要:缺陷的存在,会影响软件系统的正常使用甚至带来重大危害.为了帮助开发者尽快找到并修复这些缺陷,研究者提出了基于信息检索的缺陷定位方法.这类方法将缺陷定位视为一个检索任务,它为每个缺陷报告生成一份按照程序实体与缺陷相关度降序排序的列表.开发者可以根据列表顺序来审查代码,从而降低审查成本并加速缺陷定位的进程.近年来,该领域的研究工作十分活跃,在改良定位方法和完善评价体系方面取得了较大进展.与此同时,为了能够在实践中更好地应用这类方法,该领域的研究工作仍面临着一些亟待解决的挑战.对近年来国内外学者在该领域的研究成果进行系统性的总结:首先,描述了基于信息检索的缺陷定位方法的研究问题;然后,分别从模型改良和模型评估两方面陈述了相关的研究进展,并对具体的理论和技术途径进行梳理;接着,简要介绍了缺陷定位的其他相关技术;最后,总结了目前该领域研究过程中面临的挑战并给出建议的研究方向.
2020, 31(9):2855-2882. DOI: 10.13328/j.cnki.jos.005820
摘要:由于本体具有强大的知识表示和推理能力,本体已经在很多领域得到了广泛应用.然而,本体的深入应用还面临着很多深层次的共性语义映问题,已有的本体建模方法仅仅提出了一些简单的指导原则和基本步骤,使得知识工程师仍然无从下手.在基于领域专家知识构建领域语义知识库时,针对领域专家知识中的一词多义、多元关系和安全需求等3类共性语义映射问题,从5个方面展开了深入研究,提出了相应的语义映射方法,总结了10条本体建模约定.最后构建了一个完整的应用案例,并对所提出的5类语义映射方法进行了评价.
2020, 31(9):2883-2902. DOI: 10.13328/j.cnki.jos.006083
摘要:近年来,随着智能监控领域的不断发展,行人重识别问题逐渐受到学术界和工业界的广泛关注,其主要研究将不同摄像头下相同身份的行人图像进行关联.当前,大部分研究工作关注在有监督场景下,即给定的训练数据都存在标记信息,然而考虑到数据标注工作的高成本,这在现实应用中往往是难以拓展的.关注于弱监督场景下的行人重识别算法,包括无监督场景和半监督场景,并且对当前先进的方法进行了分类和描述.对于无监督场景的行人重识别算法,根据其技术类型划分为5类,分别为基于伪标记的方法、基于图像生成的方法、基于实例分类的方法、基于领域自适应的方法和其他方法;对于半监督场景的行人重识别方法,根据其场景类型划分为4类,分别为少量的人有标记的场景、每一个人有少量标记的场景、基于tracklet的学习的场景和摄像头内有标记但摄像头间无标记的场景.最后,对当前行人重识别的相关数据集进行了整理,并对现有的弱监督方法的实验结果进行分析与总结.
2020, 31(9):2903-2925. DOI: 10.13328/j.cnki.jos.006091
摘要:最近几年,随着加密货币和去中心化应用的流行,区块链技术受到了各行业极大的关注.从数据管理的角度,区块链可以视作是在一个分布式环境下众多不可信节点共同维护且不可篡改的账本.由于节点间相互不可信,区块链通过共识协议,确保数据存储的一致性,实现去中心化的数据管理.针对区块链的安全性以及共识协议,已有诸多工作进行全面的分析.将从数据管理的角度,分析区块链技术与传统数据库下数据管理技术的异同.分布式数据管理的研究已经持续数十年,涵盖了数据存储模式、事务处理机制、查询执行与验证、系统可扩展性等诸多方面,并已有诸多技术广泛应用于实际的分布式数据库中.该类工作往往假定存在中心可信节点或者节点只可能发生崩溃而不存在恶意攻击.然而在区块链环境中,系统设计需考虑不可信节点可能的攻击行为以及拜占庭容错.这给数据管理带来了新的问题与挑战.因此,将梳理并分析国内外有关区块链数据管理的文献,并展望未来的研究方向.
2020, 31(9):2926-2943. DOI: 10.13328/j.cnki.jos.006035
摘要:近些年,全球范围内的互联网高能耗问题引发了持续关注,节能已成为未来互联网研究的热门议题之一.面向主干网,提出一种网络级绿色节能机制:一方面,在全局视图中使用最小剩余容量优先的绿色路由算法规划全局路由路径,这样使得网络中开启的捆绑链路数目最小,从而实现第一步节能;另一方面,在局部视图中使用绿色降序最佳适应算法将流量负载汇聚到捆绑链路中的最小物理链路集合,这样可以尽可能多地关闭物理链路,从而实现进一步节能.提出的机制在节能的同时兼顾用户QoS需求的满足,在提供QoS保证的前提下最大化节能收益.为了全面评估该机制,选取3个典型主干网拓扑:CERNET2,GéANT和INTERNET2,分别在高负载、中负载和低负载的情形下,与其他3种节能机制从网络功耗和网络性能(平均路由跳数、物理链路关闭数目、路由成功率和运行时间)方面做详尽的对比分析.仿真结果表明:该机制节能效果显著,且有令人满意的性能表现.
2020, 31(9):2944-2964. DOI: 10.13328/j.cnki.jos.006051
摘要:近些年来,深度卷积神经网络在多项任务中展现了惊人的能力,并已经被用在物体检测、自动驾驶和机器翻译等众多应用中.但这些模型往往参数规模庞大,并带来了沉重的计算负担.神经网络的模型剪枝技术能够识别并删除模型中对精度影响较小的参数,从而降低模型的参数数目和理论计算量,给模型的高效执行提供了机会.然而,剪枝后的稀疏模型却难以在GPU上实现高效执行,其性能甚至差于剪枝前的稠密模型,导致模型剪枝难以带来真正的执行性能收益.提出一种稀疏感知的代码生成方法,能够生成高效的稀疏卷积GPU程序.首先为卷积算子设计了算子模板,并结合GPU的特点对模板代码进行了多种优化.算子模板中的源代码经过编译和分析被转换为算子中间表示模板,设计了一种稀疏代码生成方法,能够结合剪枝后的稀疏参数,基于中间表示模板生成对应的稀疏卷积代码.同时,利用神经网络执行过程中的数据访问特点对数据的访问和放置进行了优化,有效提升了访存吞吐量.最后,稀疏参数的位置信息被隐式编码在生成的代码中,不需要额外的索引结构,降低了访存需求.在实验中证明了:相对于GPU上已有的稀疏神经网络执行方法,提出的稀疏感知的代码生成方法能够有效提升稀疏卷积神经网络的性能.
2020, 31(9):2965-2979. DOI: 10.13328/j.cnki.jos.005815
摘要:近年来,在移动计算环境中,异构多核处理器已经逐渐成为主流.与传统同构的处理器设计相比,此类异构多核处理器以更低的功耗成本满足设备的计算需求.但是异构环境下CPU核之间的微架构差异,也为操作系统中的一些基本方法提出了新的挑战.面向性能非对称异构多核环境下调度的负载均衡问题,从系统层面提出了一种负载均衡机制S-Bridge,可以减少处理器微架构差异以及任务执行需求差异对传统负载均衡带来的影响.S-Bridge的主要贡献是从系统层提供了通用的、适配异构性的负载均衡相关接口,使任意调度器都能方便地与异构多核处理器系统进行适配.基于CFS和HMP调度器在ARM平台上进行实验,同时在X86平台上进行S-Bridge通用性的验证,结果表明:S-Bridge可以支持不同真实平台和内核版本的快速实现,平均性能提升超过15%,部分情况下可达65%.