2024年第3期文章目次

面向多模态数据的新型数据库技术专题前言

彭智勇，高云君，李国良，许建秋

2024, 35(3):1049-1050. DOI: 10.13328/j.cnki.jos.007079

摘要 (693) HTML (603) PDF 530.92 K (1580) 评论 (0) 收藏

摘要:

基于邻域k-核的社区模型与查询算法

张琦，程苗苗，李荣华，王国仁

2024, 35(3):1051-1073. DOI: 10.13328/j.cnki.jos.007071

摘要 (714) HTML (463) PDF 2.34 M (1544) 评论 (0) 收藏

摘要:现实生活中的网络通常存在社区结构,社区查询是图数据挖掘的基本任务.现有研究工作提出了多种模型来识别网络中的社区,如基于k-核的模型和基于k-truss的模型.然而,这些模型通常只限制社区内节点或边的邻居数量,忽略了邻居之间的关系,即节点的邻域结构,从而导致社区内节点的局部稠密性较低.针对这一问题,将节点的邻域结构信息融入k-核稠密子图中,提出一种基于邻域连通k-核的社区模型,并定义了社区的稠密度.基于这一新模型,研究了最稠密单社区查询问题,即返回包含查询节点集且具有最高稠密度的社区.在现实生活图数据中,一组查询节点可能会分布在多个不相交的社区中.为此,进一步研究了基于稠密度阈值的多社区查询问题,即返回包含查询节点集的多个社区,且每个社区的稠密度不低于用户指定的阈值.针对最稠密单社区查询和基于稠密度阈值的多社区查询问题,首先定义了边稠密度的概念,并提出了基于边稠密度的基线算法.为了提高查询效率,设计了索引树和改进索引树结构,能够支持在多项式时间内输出结果.通过与基线算法在多组数据集上的对比,验证了基于邻域连通k-核的社区模型的有效性和所提出查询算法的效率.

基于细粒度特征融合的部分多模态哈希

殷崭祚，李博涵，王萌，黄瑞龙，吴文隆，王昊奋

2024, 35(3):1074-1089. DOI: 10.13328/j.cnki.jos.007076

摘要 (660) HTML (426) PDF 1.52 M (1447) 评论 (0) 收藏

摘要:多模态数据的指数级增长使得传统数据库在存储和检索方面遇到挑战,而多模态哈希通过融合多模态特征并映射成二进制哈希码,能够有效地降低数据库的存储开销并提高其检索效率.虽然目前已经有许多针对多模态哈希的工作取得了较好的效果,但是仍然存在着3个重要问题:(1)已有方法偏向于考虑所有样本都是模态完整的,然而在实际检索场景中,样本缺失部分模态的情况依然存在;(2)大多数方法都是基于浅层学习模型,这不可避免地限制了模型的学习能力,从而影响最终的检索效果;(3)针对模型学习能力弱的问题已提出了基于深度学习框架的方法,但是它们在提取各个模态的特征后直接采用了向量拼接等粗粒度特征融合方法,未能有效地捕获深层语义信息,从而弱化了哈希码的表示能力并影响最终的检索效果.针对以上问题,提出了PMH-F³模型.该模型针对样本缺失部分模态的情况,实现了部分多模态哈希.同时,基于深层网络架构,利用Transformer编码器,以自注意力方式捕获深层语义信息,并实现细粒度的多模态特征融合.基于MIR Flickr和MS COCO数据集进行了充分实验并取得了最优的检索效果.实验结果表明:所提出的PMH-F³模型能够有效地实现部分多模态哈希,并可应用于大规模多模态数据检索.

GPPR：跨域分布式个性化PageRank算法

陈子俊，马德龙，王一舒，袁野

2024, 35(3):1090-1106. DOI: 10.13328/j.cnki.jos.007072

摘要 (525) HTML (447) PDF 738.03 K (1148) 评论 (0) 收藏

摘要:个性化PageRank作为大图分析中的基本算法,在搜索引擎、社交推荐、社区检测等领域具有广泛的应用,一直是研究者们关注的热点问题.现有的分布式个性化PageRank算法均假设所有数据位于同一地理位置,且数据所在的计算节点之间具有相同的网络环境.然而在现实世界中,这些数据可能分布在跨洲的多个数据中心中,这些跨域分布(cross-geo-distributed)的数据中心之间通过广域网连接,存在网络带宽异构、硬件差异巨大、通信费用高昂等特点.分布式个性化PageRank算法需要多轮迭代,并在全局图上进行随机游走.因此,现有的分布式个性化PageRank算法不适用于跨域环境.针对此问题,提出了GPPR (cross-geo-distributed personalized PageRank)算法.该算法首先对跨域环境中的大图数据进行预处理,采用启发式算法映射图数据,以降低网络带宽异构对算法迭代速度的影响;其次,GPPR改进了随机游走方式,提出了基于概率的Push算法,通过减少工作节点之间传输数据的带宽负载,进一步减少算法所需的迭代次数.基于Spark框架实现了GPPR算法,并在阿里云中构建真实的跨域环境,在8个开源大图数据上,与现有的多个代表性分布式个性化PageRank算法进行了对比实验.结果显示,GPPR的通信数据量在跨域环境中比其他算法平均减少30%.在算法运行效率方面,GPPR比其他算法平均提升了2.5倍.

融合多模态数据的小样本命名实体识别方法

张天明，张杉，刘曦，曹斌，范菁

2024, 35(3):1107-1124. DOI: 10.13328/j.cnki.jos.007069

摘要 (883) HTML (818) PDF 934.80 K (1958) 评论 (0) 收藏

摘要:作为自然语言处理领域的关键子任务,命名实体识别通过提取文本中的关键信息,帮助机器翻译、文本生成、知识图谱构建以及多模态数据融合等许多下游任务深度理解文本蕴含的复杂语义信息,有效地完成任务.在实际生活中,由于时间和人力等成本问题,命名实体识别任务常常受限于标注样本的稀缺.尽管基于文本的小样本命名实体识别方法已取得较好的泛化表现,但由于样本量有限,使得模型能提取的语义信息也十分受限,进而导致模型预测效果依然不佳.针对标注样本稀缺给基于文本的小样本命名实体识别方法带来的挑战,提出了一种融合多模态数据的小样本命名实体识别模型,借助多模态数据提供额外语义信息,帮助模型提升预测效果,进而可以有效提升多模态数据融合、建模效果.该方法将图像信息转化为文本信息作为辅助模态信息,有效地解决了由文本与图像蕴含语义信息粒度不一致导致的模态对齐效果不佳的问题.为了有效地考虑实体识别中的标签依赖关系,使用CRF框架并使用最先进的元学习方法分别作为发射模块和转移模块.为了缓解辅助模态中的噪声样本对模型的负面影响,提出一种基于元学习的通用去噪网络.该去噪网络在数据量十分有限的情况下,依然可以有效地评估辅助模态中不同样本的差异性以及衡量样本对模型的有益程度.最后,在真实的单模态和多模态数据集上进行了大量的实验.实验结果验证了该方法的预测F1值比基准方法至少提升了10%,并具有良好的泛化性.

面向多模态模型训练的高效样本检索技术

唐秀，伍赛，侯捷，陈刚

2024, 35(3):1125-1139. DOI: 10.13328/j.cnki.jos.007073

摘要 (675) HTML (562) PDF 1.15 M (1647) 评论 (0) 收藏

摘要:深度学习中,多模态模型的训练通常需要大量高质量不同类型的标注数据,如图像、文本、音频等.然而,获取大规模的多模态标注数据是一项具有挑战性和昂贵的任务.为了解决这一问题,主动学习作为一种有效的学习范式被广泛应用,能够通过有针对性地选择最有信息价值的样本进行标注,从而降低标注成本并提高模型性能.现有的主动学习方法往往面临着低效的数据扫描和数据位置调整问题,当索引需要进行大范围的更新时,会带来巨大的维护代价.为解决这些问题,提出了一种面向多模态模型训练的高效样本检索技术So-CBI.该方法通过感知模型训练类间边界点,精确评估样本对模型的价值;设计了半有序的高效样本索引,通过结合数据排序信息和部分有序性,降低了索引维护代价和时间开销.在多组多模态数据集上通过与传统主动学习训练方法实验对比,验证了So-CBI方法在主动学习下的训练样本检索问题上的有效性.

面向视频的细粒度多模态实体链接

赵海全，王续武，李金亮，李直旭，肖仰华

2024, 35(3):1140-1153. DOI: 10.13328/j.cnki.jos.007078

摘要 (571) HTML (474) PDF 1.52 M (1461) 评论 (0) 收藏

摘要:随着互联网和大数据的飞速发展,数据规模越来越大,种类也越来越多.视频作为其中重要的一种信息方式,随着近期短视频的发展,占比越来越大.如何对这些大规模视频进行理解分析,成为学界关注的热点.实体链接作为一种背景知识补全方式,可以提供丰富的外部知识.视频上的实体链接可以有效地帮助理解视频内容,从而实现对视频内容的分类、检索、推荐等.但是现有的视频链接数据集和方法的粒度过粗,因此提出面向视频的细粒度实体链接,并立足于直播场景,构建了细粒度视频实体链接数据集.此外,依据细粒度视频链接任务的难点,提出利用大模型抽取视频中的实体及其属性,并利用对比学习得到视频和对应实体的更好表示.实验结果表明,该方法能够有效地处理视频上的细粒度实体链接任务.

面向云边端协同的多模态数据建模技术及其应用

崔双双，吴限，王宏志，吴昊

2024, 35(3):1154-1172. DOI: 10.13328/j.cnki.jos.007070

摘要 (733) HTML (544) PDF 1.39 M (1932) 评论 (0) 收藏

摘要:云边端协同架构中数据类型多样,各级存储资源与计算资源存在差异,给数据管理带来新的挑战.现有数据模型或者数据模型的简单叠加,都难以同时满足云边端中多模态数据管理和协同管理需求.因此,研究面向云边端协同的多模态数据建模技术成为重要问题.其核心在于,如何高效地从云边端三层架构中得到满足应用所需的查询结果.从云边端三层数据的数据类型出发,提出了面向云边端协同的多模态数据建模技术,给出了基于元组的多模态数据模型定义,设计了6种基类,解决多模态数据统一表征困难的问题;提出了云边端协同查询的基本数据操作体系,以满足云边端业务场景的查询需求;给出了多模态数据模型的完整性约束,为查询优化奠定了理论基础.最后,给出了面向云边端协同多模态数据模型的示范应用,并从数据存储时间、存储空间和查询时间这3个方面对所提出的数据模型存储方法进行了验证.实验结果表明,所提方案能够有效地表示云边端协同架构中的多模态数据.

Apache IoTDB中的多模态数据编码压缩

贺文迪，夏天睿，宋韶旭，黄向东，王建民

2024, 35(3):1173-1193. DOI: 10.13328/j.cnki.jos.007077

摘要 (385) HTML (656) PDF 2.69 M (1240) 评论 (0) 收藏

摘要:时间序列数据在工业制造、气象、船舶、电力、车辆、金融等领域都有着广泛的应用,促进了时间序列数据库管理系统的蓬勃发展.面对愈加庞大的数据规模和多样的数据模态,高效的数据存储和管理方式十分关键,而数据的编码压缩愈发成为一个具有重要意义和价值的问题.现有的编码方法和相关系统未能充分考虑不同模态的数据特点,或者未把一些时序数据的处理方法应用于数据编码问题中.全面阐述了Apache IoTDB时序数据库系统中的多模态数据编码压缩方法及其系统实现,特别是面向工业物联网等应用场景.该编码方法较为全面地考虑包括时间戳数据、数值数据、布尔值数据、频域数据、文本数据等多个不同模态的数据,充分挖掘和利用各自模态数据的特点,特别是包括时间戳模态中时间戳序列间隔近似的特点等,进行有针对性的编码方案设计.同时,将实际应用场景中可能出现的数据质量问题因素纳入编码算法的考量中.在多个数据集上的编码算法层面和系统层面的实验评估和分析,验证了该编码压缩方法及其系统实现的效果.

Navi：基于自然语言交互的数据分析系统

谢宇鹏，骆昱宇，冯建华

2024, 35(3):1194-1206. DOI: 10.13328/j.cnki.jos.007074

摘要 (603) HTML (535) PDF 1.16 M (1535) 评论 (0) 收藏

摘要:随着大数据时代的到来,数据分析的作用日益显著.它能够从海量数据中发现有价值的信息,从而更有效地指导用户决策.然而,数据分析流程中存在三大挑战:分析流程高耦合、交互接口种类多和探索分析高耗时.为了应对上述挑战,提出了基于自然语言交互的数据分析系统Navi.该系统采用模块化的设计原则,抽象出主流数据分析流程的3个核心功能模块:数据查询、可视化生成和可视化探索模块,从而降低系统设计的耦合度.同时,Navi以自然语言作为统一的交互接口,并通过一个任务调度器实现了各功能模块的有效协同.此外,为了解决可视化探索中搜索空间指数级和用户意图不明确的问题,提出了一种基于蒙特卡洛树搜索的可视化自动探索方法,并设计了基于可视化领域知识的剪枝算法和复合奖励函数,提高了搜索效率和结果质量.最后,通过量化实验和用户实验验证了Navi的有效性.

支持深度学习的视觉数据库管理系统研究进展

丁光耀，徐辰，钱卫宁，周傲英

2024, 35(3):1207-1230. DOI: 10.13328/j.cnki.jos.007075

摘要 (644) HTML (821) PDF 1.35 M (1631) 评论 (0) 收藏

摘要:计算机视觉因其强大的学习能力,在各种真实场景中得到了广泛应用.随着数据库的发展,利用数据库中成熟的数据管理技术来处理视觉分析应用,已成为一种日益增长的研究趋势.图像、视频和文本等多模态数据的相互融合处理,也促进了视觉分析应用的多样性和准确性.近年来,因深度学习的兴起,支持深度学习的视觉分析应用开始受到广泛关注.然而,传统的数据库管理技术在深度学习场景下面临着复杂视觉分析语义难以表达、应用执行效率低等问题.因此,支持深度学习的视觉数据库管理系统得到了广泛关注.综述了目前视觉数据库管理系统的研究进展:首先,总结了视觉数据库管理系统在不同层面上面临的挑战,包括编程接口、查询优化、执行调度和数据存储;其次,分别探讨了上述4个层面上的相关技术;最后,对视觉数据库管理系统未来的研究方向进行了展望.

深度神经网络修复策略综述

梁震，刘万伟，吴陶然，薛白，王戟，杨文婧

2024, 35(3):1231-1256. DOI: 10.13328/j.cnki.jos.007061

摘要 (797) HTML (732) PDF 10.10 M (1416) 评论 (0) 收藏

摘要:随着智能信息时代的发展,深度神经网络在人类社会众多领域中的应用,尤其是在自动驾驶、军事国防等安全攸关系统中的部署,引起了学术界和工业界对神经网络模型可能表现出的错误行为的担忧.虽然神经网络验证和神经网络测试可以提供关于错误行为的定性或者定量结论,但这种事后分析并不能防止错误行为的发生,如何修复表现出错误行为的预训练神经网络模型依然是极具挑战性的问题.为此,深度神经网络修复这一领域应运而生,旨在消除有缺陷的神经网络产生的错误预测,使得神经网络满足特定的规约性质.目前为止,典型的神经网络修复范式有3种:重训练、无错误定位的微调和包含错误定位的微调.介绍深度神经网络的发展和神经网络修复的必要性;厘清相近概念;明确神经网络修复的挑战;详尽地调研目前已有的神经网络修复策略,并对内在联系与区别进行分析和比较;调研整理神经网络修复策略常用的评价指标和基准测试;展望未来神经网络修复领域研究中需要重点关注的可行方向.

基于知识图谱的跨项目安全缺陷报告预测方法

郑炜，刘程远，吴潇雪，陈翔，成婧源，孙小兵，孙瑞阳

2024, 35(3):1257-1279. DOI: 10.13328/j.cnki.jos.006812

摘要 (847) HTML (408) PDF 9.98 M (1430) 评论 (0) 收藏

摘要:安全缺陷报告可以描述软件产品中的安全关键漏洞.为了消除软件产品的安全攻击风险,安全缺陷报告(security bug report,SBR)预测越来越受到研究人员的关注.但在实际软件开发场景中,需要进行软件安全漏洞预测的项目可能是来自新公司或属于新启动的项目,没有足够的已标记安全缺陷报告供在实践中构建此软件安全漏洞预测模型.一种简单的解决方案就是使用迁移模型,即利用其他项目已经标记过的数据来构建预测模型.受到该领域最近的两项研究工作的启发,以安全关键字过滤为思路提出一种融合知识图谱的跨项目安全缺陷报告预测方法KG-SBRP (knowledge graph of security bug report prediction).使用安全缺陷报告中的文本信息域结合CWE (common weakness enumeration)与CVE Details (common vulnerabilities and exposures)共同构建三元组规则实体,以三元组规则实体构建安全漏洞知识图谱,在图谱中结合实体及其关系识别安全缺陷报告.将数据分为训练集和测试集进行模型拟合和性能评估.所构建的模型在7个不同规模的安全缺陷报告数据集上展开实证研究,研究结果表明,所提方法与当前主流方法FARSEC和Keyword matrix相比,在跨项目安全缺陷报告预测场景下,性能指标F1-score值可以平均提高11%,除此之外,在项目内安全缺陷报告预测场景下,F1-score值同样可以平均提高30%.

MSA-Lab：模型驱动的微服务集成设计平台

熊靖浏，任秋蓉，Shmuel TYSZBEROWICZ，刘志明，刘波

2024, 35(3):1280-1306. DOI: 10.13328/j.cnki.jos.006813

摘要 (685) HTML (435) PDF 14.27 M (1648) 评论 (0) 收藏

摘要:从单体系统迁移到微服务系统是当前业界对遗留系统实施再工程化的主流选项之一,基于单体遗留系统的微服务体系架构重构则是实现该迁移的关键步骤.目前学界多集中在微服务识别方法的研究上;业界虽有许多面向微服务架构的遗留系统重构的实践,但缺乏系统性的方法及高效鲁棒的工具.鉴于此,在微服务识别与模型驱动开发方法前期研究的基础上,研发一种模型驱动的、可用于单体遗留系统微服务化重构的集成设计平台MSA-Lab.它通过分析单体遗留系统运行日志中的方法调用序列,对其中的类和数据表进行类型识别和聚类以构造抽象微服务,同时生成包括微服务图和微服务序列图在内的系统架构设计模型.它包括用于微服务自动识别与设计模型自动生成的核心部件MSA-Generator,以及用于微服务静态结构模型与动态行为模型可视化展现、交互式建模、模型语法约束检验的核心部件MSA-Modeller.在MSA-Lab平台上,通过对4个开源项目实施有效性、鲁棒性、功能转换完备性等实验以及对3个同类型工具实施性能对比实验,结果表明:所提平台拥有很好的有效性、鲁棒性及实现面向日志的功能转换完备性,且性能更加优越.

单分支线性约束循环程序的终止性分析

李轶，唐桐

2024, 35(3):1307-1320. DOI: 10.13328/j.cnki.jos.006817

摘要 (290) HTML (329) PDF 1.94 M (1184) 评论 (0) 收藏

摘要:秩函数法是循环终止性分析的主要方法,秩函数的存在表明了循环程序是可终止的.针对单分支线性约束循环程序,提出一种方法对此类循环的终止性进行分析.基于增函数法向空间的计算,该方法将原程序空间上的秩函数计算问题归结为其子空间上的秩函数计算问题.实验结果表明,该方法能有效验证现有文献中大部分循环程序的终止性.

基于相关性反馈的开源系统跨层需求追踪方法

田家豪，张莉，连小利，赵倩慧

2024, 35(3):1321-1340. DOI: 10.13328/j.cnki.jos.006820

摘要 (394) HTML (334) PDF 2.89 M (1377) 评论 (0) 收藏

摘要:大型复杂软件系统的需求分析与生成是一个由上而下逐层分解的过程,跨层需求间追踪关系的构建对于项目的管理、开发与演化都至关重要.开源系统的松耦合贡献方式需要每位参与者能便捷地理解需求的来龙去脉及需求状态,这依赖跨层需求间的追踪.问题描述日志是开源系统中需求的常见呈现方式,其无固定模板要求,内容多样(含文本、代码、调试信息等),术语使用自由,跨层需求间抽象层次大,给自动追踪带来极大的挑战.提出一种面向关键特征维度的相关性反馈方法,通过静态分析项目代码结构,抽取代码相关术语及其间的关联强度,构建代码词汇库,以缓解跨层需求的抽象层次差距及用语不统一的问题;通过度量词汇对需求描述的重要性并基于此筛选关键特征维度,以对查询语句进行针对性的优化,有效减少需求描述长度、内容形式等方面的噪音.通过在3个开源系统需求集上针对两个场景的实验,表明所提方法相比基线方法在跨层需求追踪方面的优越性,相比VSM、Standard Rocchio和Trace BERT,F2值的最大提升分别可达29.01%、7.45%和59.21%.

一种预测流程剩余时间的可解释特征分层方法

郭娜，刘聪，李彩虹，陆婷，闻立杰，曾庆田

2024, 35(3):1341-1356. DOI: 10.13328/j.cnki.jos.006824

摘要 (456) HTML (356) PDF 8.25 M (1278) 评论 (0) 收藏

摘要:流程剩余时间预测对于业务异常的预防和干预有着重要的价值和意义.现有的剩余时间预测方法通过深度学习技术达到了更高的准确率,然而大多数深度模型结构复杂难以解释预测结果,即不可解释问题.此外,剩余时间预测除了活动这一关键属性还会根据领域知识选择若干其他属性作为预测模型的输入特征,缺少通用的特征选择方法,对于预测的准确率和模型的可解释性存在一定的影响.针对上述问题,提出基于可解释特征分层模型(explainable feature-based hierarchical model,EFH model)的流程剩余时间预测框架.具体而言,首先提出特征自选择策略,通过基于优先级的后向特征删除和基于特征重要性值的前向特征选择,得到对预测任务具有积极影响的属性作为模型输入.然后提出可解释特征分层模型架构,通过逐层加入不同特征得到每层的预测结果,解释特征值与预测结果的内在联系.采用LightGBM (light gradient boosting machine)和LSTM (long short-term memory)算法实例化所提方法,框架是通用的,不限于选用算法.最后在8个真实事件日志上与最新方法进行比较.实验结果表明所提方法能够选取出有效特征,提高预测的准确率,并解释预测结果.

混合云环境下面向数据生命周期的自适应访问控制

林莉，毛新雅，储振兴，解晓宇

2024, 35(3):1357-1376. DOI: 10.13328/j.cnki.jos.006809

摘要 (368) HTML (333) PDF 7.43 M (1461) 评论 (0) 收藏

摘要:混合云模式下企业业务应用和数据经常跨云流转迁移,面对多样复杂的云服务环境,当前大多数混合云应用仅以主体为中心制定数据的访问控制策略并通过人工调整策略,无法满足数据在全生命周期不同阶段时的细粒度动态访问控制需求.为此,提出一种混合云环境下面向数据生命周期的自适应访问控制方法AHCAC.该方法首先采用基于关键属性的策略描述思想去统一混合云下数据全生命周期的异构策略,尤其引入“阶段”属性显式标识数据的生命周期状态,为实现面向数据生命周期的细粒度访问控制提供基础;其次针对数据生命周期同阶段策略具有相似性和一致性的特点,定义策略距离,引入基于策略距离的层次聚类算法实现数据生命周期各阶段对应访问控制策略的构建;最后通过关键属性匹配实现当数据所处阶段变化时,触发策略评估引擎上数据对应阶段策略的自适应调整和加载,最终实现面向数据生命周期的自适应访问控制.在OpenStack和开源策略评估引擎Balana上通过实验验证了所提方法的有效性和可行性.

情感对话技术综述

赵妍妍，陆鑫，赵伟翔，田一间，秦兵

2024, 35(3):1377-1402. DOI: 10.13328/j.cnki.jos.006807

摘要 (1078) HTML (1212) PDF 8.02 M (2833) 评论 (0) 收藏

摘要:情感对话技术着眼于对话机器人的“情商”,旨在让对话机器人具有像人类一样观察、理解和表达情感的能力.这项技术可以看作是情感计算和对话技术的交叉,兼顾对话机器人的“智商”和“情商”,从而实现对用户的精神陪伴、情感慰藉和心理疏导.结合对话中情感的特点,对情感对话技术进行全面解析:1)规划对话场景下的情感识别、情感管理、情感表达等3个重要的技术点,并拓展多模态场景下的情感对话技术.2)介绍情感对话4项关键技术的最新研究进展,并总结这些技术面临的主要挑战和可能解决方案.3)介绍情感对话技术的数据资源.4)分析情感对话技术的难点,展望其未来发展方向与前景.

基于精细神经元的类脑感知学习模型

张祎晨，何干，杜凯，黄铁军

2024, 35(3):1403-1417. DOI: 10.13328/j.cnki.jos.006816

摘要 (517) HTML (480) PDF 3.10 M (1319) 评论 (0) 收藏

摘要:大脑如何实现学习以及感知功能对于人工智能和神经科学领域均是一个重要问题.现有人工神经网络由于结构和计算机制与真实大脑相差较大,无法直接用于理解真实大脑学习以及处理感知任务的机理.树突神经元模型是一种对大脑神经元树突信息处理过程进行建模仿真的计算模型,相比人工神经网络更接近生物真实.使用树突神经网络模型处理学习感知任务对理解真实大脑的学习过程有重要作用.然而,现有基于树突神经元网络的学习模型大都局限于简化树突模型,无法完整建模树突的信号处理过程.针对这一问题,提出一种基于精细中型多棘神经元网络的学习模型,使得精细神经网络可以通过学习完成相应感知任务.实验表明,在经典的图像分类任务上,所提模型可以达到很好的分类性能.此外,精细神经网络对于噪声干扰有很强的鲁棒性.对网络特性进行进一步分析,发现学习后网络中的神经元表现出了刺激选择性这种神经科学中的经典现象,表明所提模型具有一定的生物可解释性,同时也表明刺激选择特性可能是大脑通过学习完成感知任务的一种重要特性.

理性与可验证的联邦学习框架

吴柿红，田有亮

2024, 35(3):1418-1439. DOI: 10.13328/j.cnki.jos.006819

摘要 (502) HTML (419) PDF 5.51 M (1492) 评论 (0) 收藏

摘要:联邦学习作为解决数据孤岛问题的有效方法,在服务器计算全部梯度的过程中,由于服务器的惰性和自利性会存在全局梯度不正确计算问题,因此需要验证全局梯度的完整性.现有的基于密码算法的方案验证开销过大.针对这些问题,提出一种理性与可验证的联邦学习框架.首先,结合博弈论,设计囚徒合约与背叛合约迫使服务器诚实.其次,所提方案使用基于复制的验证方案实现全局梯度的完整性验证,且支持客户端离线.最后,经分析证明所提方案的正确性,并经实验表明,该方案与已有的验证算法相比,客户端的计算开销降为0,一次迭代的通信轮数由原来的3轮优化到2轮,且训练开销与客户端的离线率成反比.

一种基于算法机制设计的社会法则合成方法

吴骏，曹杰，王崇骏，谢俊元

2024, 35(3):1440-1465. DOI: 10.13328/j.cnki.jos.006825

摘要 (313) HTML (393) PDF 7.48 M (1066) 评论 (0) 收藏

摘要:社会法则是在多Agent系统中为确立某种目标属性而对各个Agent实施的行为限制集合.在Agent具有“个体理性”及“私有信息”的“策略情况”下,社会法则合成问题不应建模成通常的优化问题,而应建模成算法机制设计问题.“最小化副作用”经常是社会法则需要满足的基本要求.从博弈论的角度来看,“最小化副作用”与“最大化社会福利”的概念紧密相关,可以将“最小化副作用的社会法则合成”建模为一种效率机制设计问题.不仅需要为给定目标属性找到有效且社会福利最大的社会法则,还需要向Agent支付适当的金额,以实现激励相容性和个体理性.首先基于VCG机制设计一种名叫VCG-SLM的效率机制,证明它可满足所有必需的形式属性.然而,由于发现可证明该机制的计算是一个FP^NP-完全问题,针对性地提出该机制的一种基于整数规划的实现方式VCG-SLM-ILP,基于ATL语义将分配及支付的计算转化为整数规划,并严格地证明其正确性,从而可有效利用目前已非常成熟的工业级整数规划求解器,成功解决棘手的机制计算问题.

移动边缘计算不确定性任务持续卸载及资源分配方法

许斌，赵云凯，朱剑鸣，刘一川，李烜焘，孙雁飞，季一木

2024, 35(3):1466-1484. DOI: 10.13328/j.cnki.jos.006805

摘要 (594) HTML (606) PDF 11.01 M (1667) 评论 (0) 收藏

摘要:移动边缘计算场景中任务的不确定性增加了任务卸载及资源分配的复杂性和难度.鉴于此,提出一种移动边缘计算不确定性任务持续卸载及资源分配方法.首先,构建一种移动边缘计算不确定性任务持续卸载模型,通过基于持续时间片划分的任务多批次处理技术应对任务的不确定性,并设计多设备计算资源协同机制提升对计算密集型任务的承载能力.其次,提出一种基于负载均衡的自适应策略选择算法,避免计算资源过度分配导致信道拥堵进而产生额外能耗.最后,基于泊松分布实现了对不确定任务场景模型的仿真,大量实验结果表明时间片长度减小能够降低系统总能耗.此外,所提算法能够更有效地实现任务卸载及资源分配,相较于对比算法,最大可降低能耗11.8%.

基于深度强化学习的WRSN动态时空充电调度

王艺均，冯勇，刘明，刘念伯

2024, 35(3):1485-1501. DOI: 10.13328/j.cnki.jos.006814

摘要 (649) HTML (367) PDF 6.64 M (1697) 评论 (0) 收藏

摘要:高效的移动充电调度是构建长生命期、可持续运行的无线可充电传感器网络(WRSN)的关键之一.现有基于强化学习的充电策略只考虑了移动充电调度问题的一个维度,即移动充电器(MC)的路径规划,而忽略了充电调度问题中的另一维度,即充电时长调整,因而仍然存在性能限制.提出一种基于深度强化学习的WRSN动态时空充电调度方法(SCSD),建立充电序列调度和充电时长动态调整的深度强化学习模型.针对移动充电调度中离散的充电序列规划和连续的充电时长调整问题,使用DQN为待充电节点优化充电序列,并基于DDPG计算并动态调整序列中待充电节点的充电时长.通过分别从空间和时间两个维度的优化,在避免节点缺电失效的同时,所提出的SCSD可实现充电性能的有效提高.大量仿真实验结果表明,SCSD与现有的几种有代表性的充电方案相比,其充电性能具有明显的优势.

基于注意力机制的高容量通用图像隐写模型

袁超，王宏霞，何沛松

2024, 35(3):1502-1514. DOI: 10.13328/j.cnki.jos.006815

摘要 (622) HTML (353) PDF 4.04 M (1540) 评论 (0) 收藏

摘要:随着深度学习与隐写技术的发展,深度神经网络在图像隐写领域的应用越发广泛,尤其是图像嵌入图像这一新兴的研究方向.主流的基于深度神经网络的图像嵌入图像隐写方法需要将载体图像和秘密图像一起输入隐写模型生成含密图像,而最近的研究表明,隐写模型仅需要秘密图像作为输入,然后将模型输出的含密扰动添加到载体图像上,即可完成秘密图像的嵌入过程.这种不依赖载体图像的嵌入方式极大地扩展了隐写的应用场景,实现了隐写的通用性.但这种嵌入方式目前仅验证了秘密图像嵌入和恢复的可行性,而对隐写更重要的评价标准,即隐蔽性,未进行考虑和验证.提出一种基于注意力机制的高容量通用图像隐写模型USGAN,利用注意力模块,USGAN的编码器可以在通道维度上对秘密图像中像素位置的扰动强度分布进行调整,从而减小含密扰动对载体图像的影响.此外,利用基于CNN的隐写分析模型作为USGAN的目标模型,通过与目标模型进行对抗训练促使编码器学习生成含密对抗扰动,从而使含密图像同时成为攻击隐写分析模型的对抗样本.实验结果表明,所提模型不仅可以实现不依赖载体图像的通用嵌入方式,还进一步提高了隐写的隐蔽性.

WiFense：从衍射模型到边界监控

刘兆鹏，李晟洁，张越，曾有为，张大庆

2024, 35(3):1515-1533. DOI: 10.13328/j.cnki.jos.006826

摘要 (312) HTML (339) PDF 4.14 M (1239) 评论 (0) 收藏

摘要:近年来,随着普适计算概念的深入人心,智能感知技术已成为研究者们关注的焦点,且基于WiFi的非接触式感知因其优秀的普适性、低廉的部署成本以及良好的用户体验越来越受到学术界和工业界的青睐.典型的WiFi非接触式感知工作有手势识别、呼吸检测、入侵检测、行为识别等,这些工作若实际部署,需首先避免其他无关区域中无关行为的干扰,因此需要判断目标是否进入到特定的感知区域中.这意味着系统应具备精准判断目标在界线哪一侧的能力,然而现有工作未能找到一个可以对某个自由设定的边界进行精确监控的方法,这阻碍了WiFi感知应用的实际落地.基于这一关键问题,从电磁波衍射的物理本质出发,结合菲涅尔衍射模型(Fresnel diffraction model),找到一种目标穿越link (收发设备天线的连线)时的信号特征(Rayleigh distribution in Fresnel diffraction model,RFD),并揭示该信号特征与人体活动之间的数学关系;之后以link作为边界,结合天线间距带来的波形时延以及AGC (automatic gain control)在link被遮挡时的特征,通过越线检测实现对边界的监控.在此基础上,还实现了两个实际应用,即入侵检测系统和居家状态监测系统,前者的精确率超过89%、召回率超过91%,后者的准确率超过89%.在验证所提边界监控算法的可用性和鲁棒性的同时,也展示了所提方法与其他WiFi感知技术相结合的巨大潜力,为WiFi感知技术的实际部署提供了思考方向.

引入智能虚拟讲解员的云展厅构建与交互反馈研究

刘舫，吕天，刘心阁，叶盛，郭锐，张烈，马翠霞，王庆伟，刘永进

2024, 35(3):1534-1551. DOI: 10.13328/j.cnki.jos.006801

摘要 (478) HTML (476) PDF 8.36 M (1390) 评论 (0) 收藏

摘要:奥林匹克遗产是全人类的宝贵财富,利用科技与文化艺术相融合,对实现北京冬奥会及奥林匹克遗产和精神文化的多元呈现和高效传播至关重要.线上云展厅作为信息时代数字博物馆发展的重要趋势,虽然在单项数字博物馆与交互系统技术研究方面已具备较好的基础,但尚未形成体系化、智能化、交互友好的冬奥会奥林匹克数字博物馆系统.面向北京2022年冬季奥林匹克运动会,提出一种具有交互反馈的云展厅系统构建方式,通过构建具有虚拟讲解员的智能交互云展厅,进一步探索交互反馈在知识传播型的数字博物馆中对于非物质文化遗产的传播作用.为了探索视听交互反馈对云展厅的奥林匹克精神文化传播的影响,同时提升知识传播型云展厅中的用户体验,对32名参与者进行用户实验.研究结果表明,所构建的云展厅能够极大地促进奥林匹克文化与精神的传播;同时,在云展厅中引入视听交互反馈能够提高用户的感知控制,从而有效地提升用户体验.

联合吸收马尔可夫链和骨架映射的视频分割

梁云，张宇晴，郑晋图，张勇

2024, 35(3):1552-1568. DOI: 10.13328/j.cnki.jos.006821

摘要 (448) HTML (338) PDF 10.65 M (1344) 评论 (0) 收藏

摘要:因严重遮挡和剧烈形变等挑战长期共存,精准鲁棒的视频分割已成为计算机视觉的热点之一.构建联合吸收马尔可夫链和骨架映射的视频分割方法,经由“预分割—后优化—再提升”逐步递进地生成精准目标轮廓.在预分割阶段,基于孪生网络和区域生成网络获取目标感兴趣区域,建立这些区域内超像素的吸收马尔可夫链,计算出超像素的前景/背景标签.吸收马尔可夫链可灵活有效地感知和传播目标特征,能从复杂场景初步预分割出目标物体.后优化阶段,设计短期时空线索模型和长期时空线索模型,以获取目标的短期变化规律和长期稳定特征,进而优化超像素标签,降低相似物体和噪声带来的误差.在再提升阶段,为减少优化结果的边缘毛刺和不连贯,基于超像素标签和位置,提出前景骨架和背景骨架的自动生成算法,并构建基于编解码的骨架映射网络,以学习出像素级目标轮廓,最终得到精准视频分割结果.标准数据集的大量实验表明:所提方法优于现有主流视频分割方法,能够产生具有更高区域相似度和轮廓精准度的分割结果.

国产SW26010-Pro处理器上3级BLAS函数众核并行优化

胡怡，陈道琨，杨超，马文静，刘芳芳，宋超博，孙强，史俊达

2024, 35(3):1569-1584. DOI: 10.13328/j.cnki.jos.006811

摘要 (490) HTML (342) PDF 12.04 M (1632) 评论 (0) 收藏

摘要:BLAS (basic linear algebra subprograms)是最基本、最重要的底层数学库之一.在一个标准的BLAS库中,BLAS 3级函数涵盖的矩阵-矩阵运算尤为重要,在许多大规模科学与工程计算应用中被广泛调用.另外,BLAS 3级属于计算密集型函数,对充分发挥处理器的计算性能有至关重要的作用.针对国产SW26010-Pro处理器研究BLAS 3级函数的众核并行优化技术.具体而言,根据SW26010-Pro的存储层次结构,设计多级分块算法,挖掘矩阵运算的并行性.在此基础上,基于远程内存访问(remote memory access,RMA)机制设计数据共享策略,提高从核间的数据传输效率.进一步地,采用三缓冲、参数调优等方法对算法进行全面优化,隐藏直接内存访问(direct memory access,DMA)访存开销和RMA通信开销.此外,利用SW26010-Pro的两条硬件流水线和若干向量化计算/访存指令,还对BLAS 3级函数的矩阵-矩阵乘法、矩阵方程组求解、矩阵转置操作等若干运算进行手工汇编优化,提高了函数的浮点计算效率.实验结果显示,所提出的并行优化技术在SW26010-Pro处理器上为BLAS 3级函数带来了明显的性能提升,单核组BLAS 3级函数的浮点计算性能最高可达峰值性能的92%,多核组BLAS 3级函数的浮点计算性能最高可达峰值性能的88%.

微信服务号

微信订阅号

>专刊文章

>综述文章

>综述文章

当期目录

年份

刊期