2019, 30(12):3579-3589. DOI: 10.13328/j.cnki.jos.005672 CSTR:
摘要:EPR态作为最基本的量子纠缠态,在量子隐形传态中起着重要作用.研究适应任意类型EPR通道的单量子比特隐形传送通用线路,并推广到任意N比特量子隐形传送通用线路.首先设计出4种EPR态,分别作为量子通道的单比特量子隐形传态,通过分析EPR量子通道与量子操作门之间的关系,设计一种单比特通用线路;然后,设计两比特的标准量子隐形传态线路,并用Mathematica进行仿真验证线路的正确性,再把它推广到N比特量子隐形传送线路;最后,将单量子比特通用线路与N比特量子隐形传送线路进行融合,最终设计出任意N比特量子隐形传送通用线路.N粒子量子比特通用线路通过信息接受者进行带参数的幺正变换,其中,参数由制备出的EPR对类型确定,解决了因EPR制备中心出错导致的信息传送失败问题.
2019, 30(12):3590-3604. DOI: 10.13328/j.cnki.jos.005598 CSTR:
摘要:量词约束满足问题是人工智能和自动推理领域的一个重要问题.寻找多项式时间易解子类,是研究此类问题计算复杂性的关键.通过分析二元量词约束满足问题中的约束关系特征,以及量词前缀中的全称量词排列的顺序,提出了针对全称量词变量子结构的易解性质的分析方法.通过该方法,扩展了已知的基于Broken-Triangle Property的多项式时间易解子类,提出了一个更一般化的量词约束满足问题的混合易解子类.讨论了易解子类在问题结构分析中的一个应用,即通过易解子类确定量词约束满足问题的隐蔽变量集合,并通过实验分析不同易解子类所确定的集合大小.实验改造了基于回溯算法的求解器,在回溯过程中加入了易解子类的识别算法,并采用随机约束满足问题的生成模型作为测试基准.通过对比实验,验证了提出的多项式时间易解子类可以识别出更小的隐蔽变量集合,因此,新提出的易解子类在确定隐蔽变量集合方面更具优势.最后阐述了其他已有的混合易解子类也可以通过类似方法进行扩展,从而得到更多的一般化的理论结果.
2019, 30(12):3605-3621. DOI: 10.13328/j.cnki.jos.005611 CSTR:
摘要:交替(树)自动机因其本身关于取补运算的简洁性及其与非确定型(树)自动机的等价性,成为自动机与模型检测领域研究的一个新方向.在格值交替自动机与经典交替树自动机概念的基础上,引入格值交替树自动机的概念,并研究了格值交替树自动机的代数封闭性和表达能力.首先,证明了对格值交替树自动机的转移函数取对偶运算,终止权重取补之后所得自动机与原自动机接受语言互补这一结论.其次,证明了格值交替树自动机关于交、并运算的封闭性.最后,讨论了格值交替树自动机和格值树自动机、格值非确定型自动机的表达能力;证明了格值交替树自动机与格值树自动机的等价性,并给出了二者相互转化的算法及其复杂度分析;同时,提供了用格值非确定型自动机来模拟格值交替树自动机的方法.
2019, 30(12):3622-3636. DOI: 10.13328/j.cnki.jos.005599 CSTR:
摘要:提出一种并行计算模型——多步前进同步并行(delta-stepping synchronous parallel,简称DSP)模型和一种形式化表示方法.针对大同步并行(bulk synchronous parallel,简称BSP)模型同步次数多、收敛速度慢的特点,该模型能够有效地减少同步次数和通信开销,进而加速算法的收敛.通过形式化表示和迭代过程推导,发现DSP是一种比BSP更一般的并行计算模型.在BSP的基础上,DSP将BSP中执行1次的局部计算变为执行多次.理论分析和验证实验表明,新增加的局部计算步可以进一步挖掘和利用隐藏在数据分区中的局部性.同时,通过“计算换通信”原理增加的局部计算并非越多越好.最后的实验结果显示,DSP模型能够有效地效减少算法的迭代轮数及收敛时间,对BSP的加速可高达到数倍乃至数十倍.
2019, 30(12):3637-3650. DOI: 10.13328/j.cnki.jos.005590 CSTR:
摘要:虽然Takagi-Sugeno-Kang (TSK)模糊分类器在一些重要场合已经取得了广泛应用,但如何提高其分类性能和增强其可解释性,仍然是目前的研究热点.提出一种随机划分与组合特征且规则具有高可解释性的深度TSK模糊分类器(RCC-DTSK-C),但和其他分类器构造不同的是:(1) RCC-DTSK-C由很多基训练单元构成,这些基训练单元可以被独立训练;(2)每一个基训练单元的隐含层通过模糊规则的可解释性来表达,而这些模糊规则又是通过随机划分、随机组合来进行特征选择的;(3)基于栈式结构理论,源数据集作为相同的输入空间被映射到每一个独立的基训练单元中,这样就有效地保证了源数据的所有特征在每一个独立的训练单元中都得以保留.实验结果表明,RCC-DTSK-C具有良好的分类性能和可解释性.
2019, 30(12):3651-3664. DOI: 10.13328/j.cnki.jos.005602 CSTR:
摘要:在多目标进化算法中,如何从后代候选集中选择最优解,显著地影响优化过程.当前,最优解的选择方式主要是基于实际目标值或者代理模型估计目标值.然而,这些选择方式往往是非常耗时或者存在精度差等问题,特别是对于一些实际的复杂优化问题.最近,一些研究人员开始利用有监督分类辅助后代选择,但是这些工作难以准备准确的正例和负例样本,或者存在耗时的参数调整等问题.为了解决这些问题,提出了一种新颖的融合分类与代理的混合个体选择机制,用于从后代候选集中选择最优解.在每一代优化中,首先利用分类器选择优良解;然后设计了一个轻量级的代理模型用于估计优良解的目标值;最后利用这些目标值对优良解进行排序,并选择最优解作为后代解.基于典型的多目标进化算法MOEA/D,利用混合个体选择机制设计了新的算法框架MOEA/D-CS.与当前流行的基于分解多目标进化算法比较,实验结果表明,所提出的算法取得了最好的性能.
2019, 30(12):3665-3682. DOI: 10.13328/j.cnki.jos.005640 CSTR:
摘要:随着互联网广告的飞速发展,如何预测目标用户对互联网广告的点击率(click-through rate,简称CTR),成为精确广告推荐投放的关键技术,并成为计算广告领域的研究热点和深度神经网络的应用热点.为了提高广告点击率预估的精确度,提出了基于深度置信网络的广告点击率预估模型,并通过基于Kaggle数据挖掘平台数据集的1 000万条随机数据的实验,研究不同的隐藏层层数和隐含节点数目对预测结果的影响.为了解决深度置信网络在数据规模较大的工业界解决方案中的训练效率问题,通过实验证明:广告点击率预估中,深度置信网络的损失函数存在大量的驻点,并且这些驻点对网络训练效率有极大的影响.为了提高模型效率,从发掘网络损失函数特性入手,进一步提出了基于随机梯度下降算法和改进型粒子群算法的融合算法,以优化网络训练.融合算法在迭代步长小于阈值时可以跳出驻点平面,继续正常迭代.实验结果表明,与传统的基于梯度提升决策树和逻辑回归的广告点击率预估模型以及模糊深度神经网络模型相比,基于深度置信网络的预估模型具有更好的预估精度,在均方误差、曲线下面积和对数损失函数指标上分别提升2.39%,9.70%,2.46%和1.24%,7.61%,1.30%;使用融合方法训练深度置信网络,训练效率提高30%~70%.
2019, 30(12):3683-3693. DOI: 10.13328/j.cnki.jos.005596 CSTR:
摘要:AGM公设是用于信念修正的(被一个单一信念修正),而DP公设是用于迭代修正的(被一个有限的信念序列修正).李未给出了对于R-构型(configuration)△|Γ的R-演算,其中,△是一个原子公式或原子公式否定的集合,而Γ是一个有限的公式集合.为了在修正过程中能够保留断言中尽可能多的信息,将考虑一种新的极小改变的定义:伪子概念极小改变(≤-极小改变),其中,≤是一种伪子概念的关系;之后,在此基础上给出一种新的R-演算TDL,它是关于≤-极小改变可靠和完备的,使得△|Γ在TDL中可以被约减为一个理论△∪Θ(记作├TDL △|Γ⇒△,Θ)当且仅当Θ是Γ关于△的一个≤-极小改变.
2019, 30(12):3694-3713. DOI: 10.13328/j.cnki.jos.005604 CSTR:
摘要:软件缺陷预测技术通过挖掘和分析软件库训练出软件缺陷预测模型,随后利用该模型来预测出被测软件项目内的缺陷程序模块,因此可以有效地优化测试资源的分配.在基于代价感知的评测指标下,有监督学习方法与无监督学习方法之间的预测性能比较是最近的一个热门研究话题.其中在基于文件粒度的缺陷预测问题中,Yan等人最近对Yang等人考虑的无监督学习方法和有监督学习方法展开了大规模实证研究,结果表明存在一些无监督学习方法,其性能要优于有监督方法.基于来自开源社区的10个项目展开了实证研究.结果表明:在同项目缺陷预测场景中,若基于ACC评测指标,MULTI方法与最好的无监督方法和有监督方法相比,其预测性能平均有105.81%和123.84%的提高;若基于POPT评测指标,MULTI方法与最好的无监督方法和有监督方法相比,其预测性能平均有35.61%和38.70%的提高.在跨项目缺陷预测场景中,若基于ACC评测指标,MULTI方法与最好的无监督方法和有监督方法相比,其预测性能平均有22.42%和34.95%的提高.若基于POPT评测指标,MULTI方法与最好的无监督方法和有监督方法相比,其预测性能平均有11.45%和17.92%的提高.同时,基于Huang等人提出的PMI和IFA评测指标,MULTI方法的表现与代价感知的指标相比存在一定的折衷问题,但仍好于在ACC和POPT评测指标下表现最好的两种无监督学习方法.除此之外,将MULTI方法与最新提出的OneWay和CBS方法进行了比较,结果表明,MULTI方法在性能上仍然可以显著优于这两种方法.同时,基于F1评测指标的结果也验证了MULTI方法在预测性能上的显著优越性.最后,通过分析模型构建的时间开销,表明MULTI方法的模型构建开销对开发人员来说处于可接受的范围之内.
2019, 30(12):3714-3729. DOI: 10.13328/j.cnki.jos.005609 CSTR:
摘要:自然语言文本形式的文档是软件项目的重要组成部分.如何帮助开发者在大量文档中进行高效、准确的信息定位,是软件复用领域中的一个重要研究问题.提出了一种基于代码结构知识的软件文档语义搜索方法.该方法从软件项目的源代码中解析出代码结构图,并以此作为领域特定的知识来帮助机器理解自然语言文本的语义.这一语义信息与信息检索技术相结合,从而实现了对软件文档的语义检索.在StackOverflow问答文档数据集上的实验表明,与多种文本检索方法相比,该方法在平均准确率(mean average precision,简称MAP)上可以取得至少13.77%的提升.
2019, 30(12):3730-3749. DOI: 10.13328/j.cnki.jos.005603 CSTR:
摘要:为了解决深化“互联网+先进制造业”进程中网络可信互连问题,引入了可信连接架构(trusted connect architecture,简称TCA)技术.基于TCA技术思想,针对网络间可信认证需求,设计了一种支持网络间互连的可信连接协议(TCA-SNI).引入了网络间双向认证过程,给出了TCA-SNI协议的交互过程;使用扩展的SVO逻辑系统对协议进行逻辑推理,证明该协议是安全可靠的;使用Dolev-Yao攻击者模型对协议进行攻击测试,实验结果表明,协议的安全目标均已达成,证明该协议可以抵御真实网络中的攻击.
2019, 30(12):3750-3764. DOI: 10.13328/j.cnki.jos.005612 CSTR:
摘要:OpenVPN在现实网络中有广泛应用,对其安全性进行评估具有重要的现实意义.基于自动机理论中模型学习的方法,利用协议状态模糊测试的技术对OpenVPN系统进行黑盒测试分析,自动化推演出目标OpenVPN系统的状态机.提出了状态机时间压缩模型并进行冗余状态和迁移化简,可以准确得到协议状态机中的行为特征.发现了多条期望行为路径外的特别行为路径及可能的安全隐患,为OpenVPN的安全性评估提供了新的思路与方法,同时对类似缺少协议规范但应用广泛的安全协议的内部设计细节分析具有重要参考意义.
2019, 30(12):3765-3781. DOI: 10.13328/j.cnki.jos.005621 CSTR:
摘要:针对如何提高信息中心网络的网内缓存性能,提出了一种基于概念漂移学习(concept drift learning,简称CDL)的自适应缓存策略.考虑到节点数据和内容数据的相互感知对缓存性能的影响,将节点和内容的状态数据流作为网络资源,对提取的多维状态属性数据和缓存匹配数据进行分析挖掘,利用学习到的状态属性与缓存匹配之间的函数映射关系,即概念,对未来时期内的节点与内容间的匹配关系进行预测.为提高匹配算法的准确度,在学习过程中,提出了一种基于信息熵的概念漂移识别算法,当根据状态属性的信息熵变识别出漂移后,利用提出的基于概念重现的缓存算法,重新定义函数映射关系.仿真实验结果表明,该策略与CEE,LCD,prob和OPP策略相比,降低了网络运行成本,提高了用户体验质量.
2019, 30(12):3782-3797. DOI: 10.13328/j.cnki.jos.005583 CSTR:
摘要:针对已有的保护位置隐私路网k近邻查询依赖可信匿名服务器造成的安全隐患,以及服务器端全局路网索引利用效率低的缺陷,提出基于路网局部索引机制的保护位置隐私路网近邻查询方法.查询客户端通过与LBS服务器的一轮通信获取局部路网信息,生成查询位置所在路段满足l-路段多样性的匿名查询序列,并将匿名查询序列提交LBS服务器,从而避免保护位置隐私查询对可信第三方服务器的依赖.在LBS服务器端,提出基于路网基本单元划分的分段式近邻查询处理策略,对频繁查询请求路网基本单元,构建基于路网泰森多边形和R*树的局部Vor-R*索引结构,实现基于索引的快速查找.对非频繁请求路网基本单元,采用常规路网扩张查询处理.有效降低索引存储规模和基于全局索引进行无差异近邻查询的访问代价,在保证查询结果正确的同时,提高了LBS服务器端k近邻查询处理效率.理论分析和实验结果表明,所提方法在兼顾查询准确性的同时,有效地提高了查询处理效率.
2019, 30(12):3798-3814. DOI: 10.13328/j.cnki.jos.005601 CSTR:
摘要:随着移动设备和在线社交网络的快速发展,通过用户的个人属性配置文件匹配,能够帮助用户在邻近的社交网络中迅速找到和自己共同特征的朋友.然而,交友匹配很有可能泄漏用户的敏感信息,因此用户隐私得不到保障.提出一种移动社交网络中交友匹配过程中的隐私保护协议,用户利用混淆矩阵变换算法和内积计算实现交友过程中的隐私安全和高效的匹配;用户可以细粒度定义自己特征属性的特征权重,从而使匹配结果更精确.此外,利用机会分析模型模拟真实交友场景来保证交友的有效性.安全性分析表明,提出的方法更具有隐私性、可用性和更低的通信和计算开销.通过结合真实的社会网络数据进行测试和评估,对比结果显示,比现有解决方案更有效.
2019, 30(12):3815-3828. DOI: 10.13328/j.cnki.jos.005610 CSTR:
摘要:在云环境存储模式中,采用用户端数据加密虽然能够有效降低数据的存储安全风险,但同时会使云服务商丧失重复数据鉴别能力,导致存储开销随数据量增大而不断攀升.加密数据重复删除技术是解决该问题的方法之一,现有方案通常基于可信第三方设计,安全性假设过强,执行效率较低.基于椭圆曲线与密文策略属性加密两种高安全密码学原语,构造了重复加密数据识别与离线密钥共享两种安全算法,进而实现一种无需初始数据上传用户与可信第三方实时在线的加密数据重复删除方法.详细的安全性与仿真实验分析,证明该方法不仅实现数据的语义安全,同时能够保证系统的高效率运行.
许平华 , 胡文斌 , 邱振宇 , 聂聪 , 唐传慧 , 高旷 , 刘中舟
2019, 30(12):3829-3845. DOI: 10.13328/j.cnki.jos.005593 CSTR:
摘要:社区发现是当前社会网络研究领域的一个热点和难点,现有的研究方法包括:(1)优化以网络拓扑结构为基础的社区质量指标;(2)评估节点间的相似性并进行聚类;(3)根据特定网络设计相应的社区模型等.这些方法存在如下问题:(1)通用性不高,难以同时在无向网络和有向网络上发挥出好的效果;(2)无法充分利用网络的结构信息,在真实数据集上表现不佳.针对上述问题,提出一种基于节点不对称转移概率的网络社区发现算法CDATP.该算法通过分析网络拓扑结构来设计节点转移概率,并使用random walk方法评估节点对网络社区的重要性.最后,以重要性较高的节点作为核心构造网络社区.与现有的基于random walk的方法不同,CDATP为网络中节点设计的转移概率具有不对称性,并只通过节点局部转移来评估节点对社区的重要程度.通过大量仿真实验表明,CDATP在人工模拟数据集和真实数据集上均比其他最新算法有更好的表现.
2019, 30(12):3846-3861. DOI: 10.13328/j.cnki.jos.005606 CSTR:
摘要:在信息爆炸时代,大数据处理已成为当前国内外热点研究方向之一.谱分析型算法因其特有的性能而获得了广泛的应用,然而受维数灾难影响,主流的谱分析法对高维数据的处理仍是一个极具挑战的问题.提出一种兼顾维数特征优选和图Laplacian约束的聚类模型,即联合拉普拉斯正则项和自适应特征学习(joint Laplacian regularization and adaptive feature learning,简称LRAFL)的数据聚类算法.基于自适应近邻进行图拉普拉斯学习,并将低维嵌入、特征选择和子空间聚类纳入同一框架,替换传统谱聚类算法先图Laplacian构建、后谱分析求解的两级操作.通过添加非负加和约束以及低秩约束,LRAFL能获得稀疏的特征权值向量并具有块对角结构的Laplacian矩阵.此外,提出一种有效的求解方法用于模型参数优化,并对算法的收敛性、复杂度以及平衡参数设定进行了理论分析.在合成数据和多个公开数据集上的实验结果表明,LRAFL在效果效率及实现便捷性等指标上均优于现有的其他数据聚类算法.
2019, 30(12):3862-3875. DOI: 10.13328/j.cnki.jos.005586 CSTR:
摘要:针对传统基于测地线的泊松融合方法中插值旋转场与尺度场计算量大而影响交互建模的应用,提出了基于复用拉普拉斯算子的高效融合方法.该方法将几何融合、旋转场与尺度场的插值问题均转化为拉普拉斯(泊松)方程进行求解,仅需一次Cholesky分解和多次回代计算,得到融合所需的8个标量场,比起传统基于测地线的插值方法快两个数量级;随后,运用基于约束Delaunay三角化与离散极小曲面的鲁棒方法对融合边界处的网格进行优化,实现网格的高效融合.同时,再次复用拉普拉斯算子,在进行几何融合的同时,实现了纹理坐标的快速融合.该算法不仅能够处理具有复杂拓扑与多个边界模型,并获得与传统泊松融合方法相媲美的实验结果,而且显著地提高了效率,能够满足交互响应的需求.
唐述 , 万盛道 , 杨书丽 , 谢显中 , 夏明 , 张旭
2019, 30(12):3876-3891. DOI: 10.13328/j.cnki.jos.005587 CSTR:
摘要:运动模糊核的准确估计是实现单幅运动模糊图像盲复原成功的关键.但是,因为不能准确提取出有利的图像边缘以及简单的正则化约束项的设计,导致现有运动模糊核(motion blur kernel,简称MBK)的估计并不十分准确,存在瑕疵.因此,为了能够估计出准确的运动模糊核,提出了一种基于空间尺度信息的运动模糊核估计方法.首先,为了准确地提取有利的图像边缘,移除有害的图像结构,提出了一种基于图像空间尺度信息的图像平滑模型,实现有利图像边缘的准确快速提取;然后,从运动模糊核的内在特性出发,将空间域的L0范数和梯度域的L2范数结合到一起,提出了一种正则化约束模型,很好地保证了运动模糊核的稀疏平滑特性,并结合之前提取出的有利的图像边缘,共同实现运动模糊核的准确估计;最后,采用一种半二次性分裂的交互式最优化策略对提出的模型进行最优化求解.在客观的评价指标和主观的视觉效果上进行了大量实验,其结果证明所提出的方法能够估计出更准确的MBK和复原出更高质量的去模糊图像.
2019, 30(12):3892-3906. DOI: 10.13328/j.cnki.jos.005592 CSTR:
摘要:几何主动轮廓模型的缺点是对初始轮廓位置特别敏感,基于距离规则水平集(DRLSE)模型的初始轮廓曲线必须设置在目标边界的内部或者外部.基于边缘的自适应水平集(ALSE)模型,提出了一种提高初始轮廓鲁棒性的方法.但两种模型均容易出现陷入虚假边界、从弱边缘处泄露以及抗噪声能力差等问题.设计了一个结合自适应符号函数和自适应边缘指示函数的模型,使得主动轮廓演化能根据自适应符号函数的方向从初始轮廓开始自动进行膨胀及收缩,很好地改善了水平集对初始轮廓敏感的缺点,提高了鲁棒性,同时解决了水平集对收敛速度慢以及易从弱边缘处泄露的问题.此外,为了使得模型演化更加稳定,提出了一个新的距离规则项.实验结果表明:自适应符号函数的主动轮廓模型不仅可以提高分割质量,缩短图像分割时间,同时提高了对初始轮廓的鲁棒性.