查 询 高级检索+
共找到相关记录144条
    全 选
    显示方式:|
    • 开源软件供应链漏洞威胁智能感知

      2025, 36(2):511-536.DOI: 10.13328/j.cnki.jos.007163

      关键词:开源软件供应链漏洞威胁感知特征表示知识图谱风险推送
      摘要 (244)HTML (137)PDF 10.94 M (733)收藏

      摘要:开源软件的繁荣推动了软件领域的蓬勃发展, 也促使以开源软件为基础的供应链开发模式的形成. 开源软件供应链本质上是个复杂的供应链拓扑网络, 由开源生态的关键元素及其关联关系构成, 其产品全球化等优势有助于提高软件行业的开发效率. 然而, 开源软件供应链也存在依赖关系复杂、传播范围广泛、攻击面暴露扩大等特点, 带来了新的安全风险. 现有的以安全漏洞、威胁情报为基础的安全管理虽然可以实现安全预警、预先防御, 但是由于漏洞威胁信息获取不及时、缺少攻击技术和缓解措施等信息, 严重影响了漏洞处理效率. 针对上述问题, 设计并实现一种针对开源软件供应链的漏洞威胁智能感知方法, 包括两部分: 1)构建CTI (网络威胁情报)知识图谱, 在其构建的过程中使用到相关技术, 可以实现安全情报的实时分析与处理, 尤其提出SecERNIE模型以及软件包命名矩阵, 分别缓解漏洞威胁关联挖掘的问题和开源软件别名的问题. 2)漏洞风险信息推送, 以软件包命名矩阵为基础, 构建软件包过滤规则, 实现开源系统漏洞实时过滤与推送. 通过实验验证所提方法的有效性和可用性. 实验结果显示, 相较于NVD等传统漏洞平台, 本方法平均感知时间最高提前90.03天; 在操作系统软件覆盖率上提升74.37%, 并利用SecERNIE模型实现63492个CVE漏洞与攻击技术实体之间的关联关系映射. 特别地, 针对openEuler操作系统, 可追踪的系统软件覆盖率达到92.76%, 并累计感知6239个安全漏洞; 同时, 还发现openEuler中891条漏洞与攻击的关联关系, 进而获取到相应的解决方案, 为漏洞处理提供了参考依据. 在真实攻击环境验证2种典型的攻击场景, 证明所提方法在漏洞威胁感知方面的良好的效果.

    • 无监督多视图特征选择研究进展

      2025, 36(2):886-914.DOI: 10.13328/j.cnki.jos.007168

      关键词:多视图数据无监督特征选择聚类结构保持流数据
      摘要 (327)HTML (141)PDF 4.10 M (1731)收藏

      摘要:多视图数据从不同角度描述数据对象, 数据在不同视图中的特征表示之间存在着相关性、互补性及多样性信息. 综合利用这些信息对多视图数据处理至关重要. 然而, 多视图数据通常具有高维度特点, 且常含有噪声特征, 这为多视图数据的处理与分析带来了许多困难. 无监督多视图特征选择无需样本标记信息, 从多个视图源的原始高维特征中学习更紧凑、更准确的特征表示以提高数据分析的效果, 在多视图数据处理领域起着重要作用. 根据已有的无监督多视图特征选择模型的工作机制的异同, 对这些模型进行归纳和总结, 分析其中存在的不足, 并指出未来研究的方向.

    • 基于细粒度特征融合的部分多模态哈希

      2024, 35(3):1074-1089.DOI: 10.13328/j.cnki.jos.007076

      关键词:部分多模态哈希多模态数据检索细粒度特征融合
      摘要 (885)HTML (1368)PDF 1.52 M (3120)收藏

      摘要:多模态数据的指数级增长使得传统数据库在存储和检索方面遇到挑战,而多模态哈希通过融合多模态特征并映射成二进制哈希码,能够有效地降低数据库的存储开销并提高其检索效率.虽然目前已经有许多针对多模态哈希的工作取得了较好的效果,但是仍然存在着3个重要问题:(1)已有方法偏向于考虑所有样本都是模态完整的,然而在实际检索场景中,样本缺失部分模态的情况依然存在;(2)大多数方法都是基于浅层学习模型,这不可避免地限制了模型的学习能力,从而影响最终的检索效果;(3)针对模型学习能力弱的问题已提出了基于深度学习框架的方法,但是它们在提取各个模态的特征后直接采用了向量拼接等粗粒度特征融合方法,未能有效地捕获深层语义信息,从而弱化了哈希码的表示能力并影响最终的检索效果.针对以上问题,提出了PMH-F3模型.该模型针对样本缺失部分模态的情况,实现了部分多模态哈希.同时,基于深层网络架构,利用Transformer编码器,以自注意力方式捕获深层语义信息,并实现细粒度的多模态特征融合.基于MIR Flickr和MS COCO数据集进行了充分实验并取得了最优的检索效果.实验结果表明:所提出的PMH-F3模型能够有效地实现部分多模态哈希,并可应用于大规模多模态数据检索.

    • 一种预测流程剩余时间的可解释特征分层方法

      2024, 35(3):1341-1356.DOI: 10.13328/j.cnki.jos.006824

      关键词:流程挖掘剩余时间预测特征选择可解释分层模型
      摘要 (577)HTML (822)PDF 8.25 M (1916)收藏

      摘要:流程剩余时间预测对于业务异常的预防和干预有着重要的价值和意义.现有的剩余时间预测方法通过深度学习技术达到了更高的准确率,然而大多数深度模型结构复杂难以解释预测结果,即不可解释问题.此外,剩余时间预测除了活动这一关键属性还会根据领域知识选择若干其他属性作为预测模型的输入特征,缺少通用的特征选择方法,对于预测的准确率和模型的可解释性存在一定的影响.针对上述问题,提出基于可解释特征分层模型(explainable feature-based hierarchical model,EFH model)的流程剩余时间预测框架.具体而言,首先提出特征自选择策略,通过基于优先级的后向特征删除和基于特征重要性值的前向特征选择,得到对预测任务具有积极影响的属性作为模型输入.然后提出可解释特征分层模型架构,通过逐层加入不同特征得到每层的预测结果,解释特征值与预测结果的内在联系.采用LightGBM (light gradient boosting machine)和LSTM (long short-term memory)算法实例化所提方法,框架是通用的,不限于选用算法.最后在8个真实事件日志上与最新方法进行比较.实验结果表明所提方法能够选取出有效特征,提高预测的准确率,并解释预测结果.

    • 基于自适应权重的多源部分域适应

      2024, 35(4):1703-1716.DOI: 10.13328/j.cnki.jos.007015

      关键词:多源部分域适应负迁移多样性特征提取多层次分布对齐自适应权重
      摘要 (720)HTML (1315)PDF 2.00 M (3486)收藏

      摘要:作为机器学习的一个新兴领域, 多源部分域适应(MSPDA)问题由于其源域自身的复杂性、领域之间的差异性以及目标域自身的无监督性, 给相关研究带来了挑战, 以致目前鲜有相关工作被提出. 在该场景下, 多个源域中的无关类样本在域适应过程中会造成较大的累积误差和负迁移. 此外, 现有多源域适应方法大多未考虑不同源域对目标域任务的贡献度不同. 因此, 提出基于自适应权重的多源部分域适应方法(AW­MSPDA).首先, 构建了多样性特征提取器以有效利用源域的先验知识; 同时, 设计了多层次分布对齐策略从不同层面消除了分布差异,促进了正迁移; 此外, 为量化不同源域贡献度以及过滤源域无关类样本, 利用相似性度量以及伪标签加权方式构建自适应权重; 最后, 通过大量实验验证了所提出AW­MSPDA算法的泛化性以及优越性.

    • 多标记学习中基于交互表示的深度森林方法

      2024, 35(4):1934-1944.DOI: 10.13328/j.cnki.jos.006841

      关键词:深度森林多标记学习特征交互标记相关性表示学习
      摘要 (411)HTML (735)PDF 4.65 M (1541)收藏

      摘要:在多标记学习中, 每个样本都与多个标记关联, 关键任务是如何在构建模型时利用标记之间的相关性. 多标记深度森林算法尝试在深度集成学习的框架下使用逐层的表示学习来挖掘标记之间的相关性, 并利用得到的标记概率表示提升预测精度. 然而, 一方面标记概率表示与标记信息高度相关, 这会导致其多样性较低. 随着深度森林的深度增加, 性能会下降. 另一方面, 标记概率的计算需要我们存储所有层数的森林结构并在测试阶段逐一使用, 这会造成难以承受的计算和存储开销. 针对这些问题, 提出基于交互表示的多标记深度森林算法(interaction- representation-based multi-label deep forest, iMLDF). iMLDF从森林模型的决策路径中挖掘特征空间中的结构信息, 利用随机交互树抽取决策树路径中的特征交互, 分别得到特征置信度得分和标记概率分布两种交互表示. iMLDF一方面充分利用模型中的特征结构信息来丰富标记间的相关信息, 另一方面通过交互表达式计算所有的表示, 从而使得算法无需存储森林结构, 大大地提升了计算效率. 实验结果表明: 在交互表示基础上进行表示学习的iMLDF算法取得了更好的预测性能, 而且针对样本较多的数据集, 计算效率比MLDF算法提升了一个数量级.

    • 分层特征编解码驱动的视觉引导立体声生成方法

      2024, 35(5):2165-2175.DOI: 10.13328/j.cnki.jos.007027

      关键词:立体声视觉引导的声音生成分层特征编解码多模态学习跳跃连接
      摘要 (568)HTML (1236)PDF 4.93 M (2909)收藏

      摘要:视觉引导的立体声生成是多模态学习中具有广泛应用价值的重要任务之一, 其目标是在给定视觉模态信息及单声道音频模态信息的情况下, 生成符合视听一致性的立体声音频. 针对现有视觉引导的立体声生成方法因编码阶段视听信息利用率不足、解码阶段忽视浅层特征导致的立体声生成效果不理想的问题, 提出一种基于分层特征编解码的视觉引导的立体声生成方法, 有效提升立体声生成的质量. 其中, 为了有效地缩小阻碍视听觉模态数据间关联融合的异构鸿沟, 提出一种视听觉特征分层编码融合的编码器结构, 提高视听模态数据在编码阶段的综合利用效率; 为了实现解码过程中浅层结构特征信息的有效利用, 构建一种由深到浅不同深度特征层间跳跃连接的解码器结构, 实现了对视听觉模态信息的浅层细节特征与深度特征的充分利用. 得益于对视听觉信息的高效利用以及对深层浅层结构特征的分层结合, 所提方法可有效处理复杂视觉场景中的立体声合成, 相较于现有方法, 所提方法生成效果在真实感等方面性能提升超过6%.

    • 特征扩展的随机向量函数链神经网络

      2024, 35(6):2903-2922.DOI: 10.13328/j.cnki.jos.006920

      关键词:宽度学习系统模糊推理系统特征扩展随机向量函数链神经网络 (RVFLNN)Sigmoid激活函数可解释
      摘要 (403)HTML (701)PDF 5.52 M (1667)收藏

      摘要:基于宽度学习的动态模糊推理系统(broad-learning-based dynamic fuzzy inference system , BL-DFIS)能自动构建出精简的模糊规则并获得良好的分类性能. 然而, 当遇到大型复杂的数据集时, BL-DFIS因会使用较多模糊规则来试图达到令人满意的识别精度, 从而对其可解释性造成了不利影响. 对此, 提出一种兼顾分类性能和可解释性的模糊神经网络, 将其称为特征扩展的随机向量函数链神经网络(FA-RVFLNN). 在该网络中, 一个以原始数据为输入的RVFLNN被作为主体结构, BL-DFIS则用作性能补充, 这意味着FA-RVFLNN包含具有性能增强作用的直接链接. 由于主体结构的增强节点使用Sigmoid激活函数, 因此, 其推理过程可借助一种模糊逻辑算子(I-OR)来解释. 而且, 具有明确含义的原始输入数据也有助于解释主体结构的推理规则. 在直接链接的支撑下, FA-RVFLNN可利用增强节点、特征节点和模糊节点学到更丰富的有用信息. 实验表明: FA-RVFLNN既减缓了主体结构RVFLNN中过多增强节点带来的“规则爆炸”问题, 也提高了性能补充结构BL-DFIS的可解释性(平均模糊规则数降低了50%左右), 在泛化性能和网络规模上仍具有竞争力.

    • 高清几何缓存多尺度特征融合的渲染超分方法

      2024, 35(6):3052-3068.DOI: 10.13328/j.cnki.jos.006921

      关键词:神经网络渲染图像超分几何缓存特征融合
      摘要 (584)HTML (680)PDF 10.77 M (1728)收藏

      摘要:人们对图像显示设备高分辨率和逼真视觉感知的需求随着现代信息技术的发展日益增长, 这对计算机软硬件提出了更高要求, 也为渲染技术在性能与工作负载上带来更多挑战. 利用深度神经网络等机器学习技术对渲染图像进行质量改进和性能提升成为了计算机图形学热门的研究方向, 其中通过网络推理将低分辨率图像进行上采样获得更加清晰的高分辨率图像是提升图像生成性能并保证高清细节的一个重要途径. 而渲染引擎在渲染流程中产生的几何缓存(geometry buffer, G-buffer)包含较多的语义信息, 能够帮助网络有效地学习场景信息与特征, 从而提升上采样结果的质量. 设计一个基于深度神经网络的低分辨率渲染内容的超分方法. 除了当前帧的颜色图像, 其使用高分辨率的几何缓存来辅助计算并重建超分后的内容细节. 所提方法引入一种新的策略来融合高清缓存与低清图像的特征信息, 在特定的融合模块中对不同种特征信息进行多尺度融合. 实验验证所提出的融合策略和模块的有效性, 并且, 在和其他图像超分辨率方法的对比中, 所提方法体现出明显的优势, 尤其是在高清细节保持方面.

    • 基于双分支特征提取和自适应胶囊网络的DGA域名检测方法

      2024, 35(8):3626-3646.DOI: 10.13328/j.cnki.jos.007119

      关键词:DGA域名检测深度学习双分支特征提取网络切片金字塔网络自适应胶囊网络
      摘要 (525)HTML (833)PDF 3.26 M (2728)收藏

      摘要:面向域名生成算法(domain generation algorithm, DGA)的域名检测方法普遍具有特征提取能力弱、特征信息压缩比高等特点, 这导致特征信息丢失、特征结构破坏以及域名检测效果较差等诸多不足. 针对上述问题, 提出一种基于双分支特征提取和自适应胶囊网络的DGA域名检测方法. 首先, 通过样本清洗和字典构建重构原始样本并生成重构样本集; 其次, 通过双分支特征提取网络处理重构样本, 在其中, 利用切片金字塔网络提取域名局部特征, 利用Transformer提取域名全局特征, 并利用轻量级注意力融合不同层次的域名特征; 然后, 利用自适应胶囊网络计算域名特征图的重要度系数, 将域名文本特征转换为向量域名特征, 并通过特征转移计算基于文本特征的域名分类概率; 同时, 利用多层感知机处理域名统计特征, 以此计算基于统计特征的域名分类概率; 最后, 通过合并得到的两种不同视角的域名分类概率进行域名检测. 大量的实验表明, 所提方法在DGA域名检测以及DGA域名家族检测分类方面均取得了当前领先的检测效果. 在DGA域名检测中, F1分数提升了0.76%-5.57%; 在DGA域名家族检测分类中, F1分数(宏平均)提升了1.79%-3.68%.

    上一页123456
    共15页144条记录 跳转到GO

您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号