[function_title]

  • 显示方式:
  • 简洁模式
  • 摘要模式
  • 1  视觉问答研究综述
    包希港,周春来,肖克晶,覃飙
    2021, 32(8):2522-2544. DOI: 10.13328/j.cnki.jos.006215
    [摘要](1229) [HTML](37) [PDF 2.63 M](1400)
    摘要:
    视觉问答是计算机视觉领域和自然语言处理领域的交叉方向,近年来受到了广泛关注.在视觉问答任务中,算法需要回答基于特定图片(或视频)的问题.自2014年第一个视觉问答数据集发布以来,若干大规模数据集在近5年内被陆续发布,并有大量算法在此基础上被提出.已有的综述性研究重点针对视觉问答任务的发展进行了总结,但近年来,有研究发现,视觉问答模型强烈依赖语言偏见和数据集的分布,特别是自VQA-CP数据集发布以来,许多模型的效果大幅度下降.主要详细介绍近年来提出的算法以及发布的数据集,特别是讨论了算法在加强鲁棒性方面的研究.对视觉问答任务的算法进行分类总结,介绍了其动机、细节以及局限性.最后讨论了视觉问答任务的挑战及展望.
    2  浏览器同源策略安全研究综述
    罗武,沈晴霓,吴中海,吴鹏飞,董春涛,夏玉堂
    2021, 32(8):2469-2504. DOI: 10.13328/j.cnki.jos.006153
    [摘要](1448) [HTML](30) [PDF 4.30 M](1062)
    摘要:
    随着云计算和移动计算的普及,浏览器应用呈现多样化和规模化的特点,浏览器的安全问题也日益突出.为了保证Web应用资源的安全性,浏览器同源策略被提出.目前,RFC6454、W3C和HTML5标准都对同源策略进行了描述与定义,诸如Chrome、Firefox、Safari、Edge等主流浏览器均将其作为基本的访问控制策略.然而,浏览器同源策略在实际应用中面临着无法处理第三方脚本引入的安全威胁、无法限制同源不同frame的权限、与其他浏览器机制协作时还会为不同源的frame赋予过多权限等问题,并且无法保证跨域/跨源通信机制的安全性以及内存攻击下的同源策略安全.对浏览器同源策略安全研究进行综述,介绍了同源策略的规则,并概括了同源策略的威胁模型与研究方向,主要包括同源策略规则不足及应对、跨域与跨源通信机制安全威胁及应对以及内存攻击下的同源策略安全,并且展望了同源策略安全研究的未来发展方向.
    3  国产复杂异构高性能数值软件的研制与测试专题前言
    孙家昶,李会元
    2021, 32(8):2287-2288. DOI: 10.13328/j.cnki.jos.006009
    [摘要](762) [HTML](37) [PDF 128.29 K](488)
    摘要:
    中国科学院首个 C 类战略性先导科技专项“国产安全可控先进计算系统研制”(419 专项)主要目标已经达到.在数值软件层面,该专项第 1 阶段的主要任务是在国产复杂异构先进计算系统上研制高水平的基准测试软件HPL(high performance Linpack)与HPCG(high performance conjugate gradient). HPL 与 HPCG 是国际上最受关注的用于评测高性能计算机浮点运算性能的两款基准测试软件.HPL 通过高斯消去法求解稠密线性代数方程组来评测高性能计算机浮点性能的实际持续峰值,是目前全球超级计算机TOP 500 以及中国高性能计算机TOP 100 排行榜的依据.HPCG 是求解稀疏代数方程组的一种迭代算法.HPCG基准测试在国际上受到广泛关注,与HPL 相比,在一定程度上更能真实反映高性能计算机的实际应用性能.全球超级计算机 TOP 500 以及中国高性能计算机 TOP 100 均提供 HPCG 性能排行榜.如今,以计算速度为目标的HPL 与 HPCG 基准测试,不仅为高性能计算机性能排名提供一种依据,更已成为一种被高性能计算提供商、研究机构与应用部门广为接受的工业标准. 419 专项先后两次开展了HPL 与HPCG 基准测试.2019 年5 月在北京完成419 专项曙光7000 超级计算机基准测试,HPL 与HPCG 实测性能均一举超过全球超级计算机TOP 500 排名第一的超级计算机Summit,成为事实上的卫冕之王.2019 年11 月在江苏昆山再次完成曙光7000 超级计算机基准测试,HPL 与HPCG 实测性能分别达到TOP 500 蝉联第一的Summit 的1.68 倍和2.06 倍,其中,HPL 效率超过65%,HPCG 整机弱可扩展性并行效率达到93%.据此,419 专项顺利通过中国高性能计算机性能TOP 100 排行榜专家组的鉴定以及中国计算机协会专家组的肯定. 为此,《软件学报》编辑部特开设“国产复杂异构高性能数值软件的研制与测试”专题.专题拟聚焦国产复杂异构先进计算系统下的高性能计算软件、算法与测试技术,探讨软硬件总体结构与软件在先进计算系统中的地位与作用.专题定向邀请中科曙光、中国科学院计算技术研究所、中国科学院软件研究所、中国科学院计算机网络信息中心、中科海光等直接参与419 专项的相关研究团队,从学术层面交流复杂异构系统下的高性能计算基础软件的研制和优化的各种关键技术,总结高性能计算软件和应用研究中的挑战与对策.内容重点涵盖先进计算系统基准评测软件HPL、HPCG 等的研制、调优与测试及相应基础代数库BLAS/BLIS/ROCBLAS 等软件库的优化,也包含了若干高性能应用算法与软件的研制进展. 专题收到8篇投稿,先后邀请了十几位领域专家参与审稿,每篇稿件都由3 位专家历经2轮或3轮审稿,最终有7 篇论文入选本专题.
    4  区块链系统中身份管理技术研究综述
    姚前,张大伟
    2021, 32(7):2260-2286. DOI: 10.13328/j.cnki.jos.006309
    [摘要](2910) [HTML](41) [PDF 2.61 M](1993)
    摘要:
    区块链技术是一种通过块链式结构、共识算法和智能合约来生成、存储、操作和验证数据的新型分布式基础架构和计算范式,其所构建的新型信任机制有助于推动互联网技术由信息互联网向价值互联网的转化.由于区块链中的账本数据采用公开交易记录、多节点共识确认的方式进行存储和验证,因此对系统中的身份管理及隐私保护提出了极大的挑战.首先分析了区块链系统交易模型的特点及其与传统中心化系统在身份认证、数据存储和交易确认方面的不同,阐述了区块链系统中身份管理技术涵盖的主要内容、关键问题及安全挑战;其次,从身份标识、身份认证和身份隐藏3个方面比较分析了目前主流区块链平台中身份管理和隐私保护的不同实现技术;最后,分析了现有区块链系统中身份管理的不足并对未来的研究方向进行了展望.
    5  代码注释自动生成方法综述
    陈翔,杨光,崔展齐,孟国柱,王赞
    2021, 32(7):2118-2141. DOI: 10.13328/j.cnki.jos.006258
    [摘要](2241) [HTML](32) [PDF 2.12 M](1856)
    摘要:
    在软件的开发和维护过程中,与代码对应的注释经常存在缺失、不足或者与代码实际内容不匹配等问题,但手工编写代码注释对开发人员来说费时费力,且注释质量难以保证,因此亟需研究人员提出有效的代码注释自动生成方法.代码注释自动生成问题是当前程序理解研究领域的一个研究热点,对该问题进行了系统综述.主要将已有的自动生成方法细分为3类:基于模板的方法、基于信息检索的方法和基于深度学习的方法.依次对每一类方法的已有研究成果进行了系统的梳理、总结和点评.随后分析了已有的实证研究中经常使用的语料库和主要的注释质量评估方法,以利于针对该问题的后续研究可以进行合理的实验设计.最后进行总结,并对未来值得关注的研究方向进行了展望.
    6  自动驾驶智能系统测试研究综述
    朱向雷,王海弛,尤翰墨,张蔚珩,张颖异,刘爽,陈俊洁,王赞,李克秋
    2021, 32(7):2056-2077. DOI: 10.13328/j.cnki.jos.006266
    [摘要](2162) [HTML](32) [PDF 2.19 M](2731)
    摘要:
    随着人工智能技术的深入发展,自动驾驶已成为人工智能技术的典型应用,近十年来得到了长足的发展,作为一类非确定性系统,自动驾驶车辆的质量和安全性得到越来越多的关注.对自动驾驶系统,特别是自动驾驶智能系统(如感知模块、决策模块、综合功能及整车)的测试技术得到了业界和学界的深入研究.调研了56篇相关领域的学术论文,分别就感知模块、决策模块、综合功能模块及整车系统的测试技术、用例生成方法和测试覆盖度量等维度对目前已有的研究成果进行了梳理,并描述了自动驾驶智能系统测试中的数据集及工具集.最后,对自动驾驶智能系统测试的未来工作进行了展望,从而为该领域的研究人员提供参考.
    7  操作系统内核并发错误检测研究进展
    石剑君,计卫星,石峰
    2021, 32(7):2016-2038. DOI: 10.13328/j.cnki.jos.006265
    [摘要](1391) [HTML](38) [PDF 2.11 M](1037)
    摘要:
    并发错误是程序设计语言和软件工程领域的研究热点之一.近年来,针对应用程序并发错误检测的研究已取得了很大进展.但是由于操作系统内核的并发和同步机制复杂、代码规模庞大,与应用程序级并发错误检测相比,操作系统内核的并发错误检测研究仍面临巨大的挑战.对此,国内外学者提出了各种用于操作系统内核并发错误检测的方法.首先介绍了并发错误的基本类型、检测方法和评价指标,讨论了现有的并发错误检测方法和工具的局限性;然后,从形式化验证、静态分析、动态分析和静态动态相结合4个方面,对现有的操作系统内核并发错误检测的研究工作进行了分类阐述,并作了系统总结和对比分析;最后,探讨了操作系统内核并发错误检测研究面临的挑战,并对该领域未来的研究趋势进行了展望.
    8  面向非确定性的软件质量保障方法与技术专题前言
    陈俊洁,汤恩义,何啸,马晓星
    2021, 32(7):1923-1925. DOI: 10.13328/j.cnki.jos.006273
    [摘要](732) [HTML](23) [PDF 374.89 K](457)
    摘要:
    随着互联网、物联网、云计算等新计算平台、新应用模式、及智能化等新软件模式的广泛运用,软件系统内外各种来源的非确定性不断增强.从软件系统内部的不确定性看,并发程序是一类典型的非确定性软件系统.并发程序由于其随机性高的特点,容易导致并发缺陷且难以调试.从软件系统外部的不确定性看,软件所处的网络环境和所服务的用户需求变得更加动态多变,这就要求软件系统能够主动应对这些动态变化.具有自适应和持续演化能力的软件系统需要在环境和需求的自动感知与理解、适应行为的自主决策、以及适应行为的精准实施等环节处理各种不确定性,以保障系统能够持续稳定地提供服务.从软件构造途径的不确定性看,包含深度神经网络部件的数据驱动智能化软件系统是另一类非确定性软件系统,其非确定性来自于机器学习模型的归纳本质.此类系统日益应用于一些安全相关的领域,这就对其软件质量提出了更高的要求.本专题关注软件质量保障中非确定性问题所面临的挑战以及相关软件质量保障技术. 本专题采取自由投稿的方式,共收到24篇投稿.特约编辑邀请了近20位领域专家参与审稿,每篇稿件至少邀请2位专家进行评审,每篇稿件均经过至少两轮审稿.共计16篇稿件通过评审,并在中国软件大会上进行了报告,最终该16篇论文入选本专题.
    9  形式化方法与应用专题前言
    田聪,邓玉欣,姜宇
    2021, 32(6):1579-1580. DOI: 10.13328/j.cnki.jos.006256
    [摘要](893) [HTML](23) [PDF 297.02 K](546)
    摘要:
    计算机科学的发展主要涉及硬件和软件的发展,而软、硬件发展的核心问题之一是如何保证它们是安全可靠的。如今,硬件性能变得越来越高,运算速度变得越来越快,体系结构变得越来越复杂,软件的功能也变得越来越复杂,如何开发可靠的软、硬件系统,己经成为计算机科学发展的巨大挑战。特别是现在计算机系统广泛应用于许多安全攸关系统中,如高速列车控制系统、航空航天控制系统、核反应堆控制系统、医疗设备控制系统等等,这些系统中的任何错误都可能导致灾难性后果。 形式化方法己经成功应用于各种硬件设计,特别是芯片的设计。各大硬件制造商都有一个非常强大的形式化方法团队为保障系统的可靠性提供技术支持,例如IBM、AMD等等。近年来,随着形式验证技术和工具的发展,特别是在程序验证中的成功应用,形式化方法在处理软件开发复杂性和提高软件可靠性方面已显示出无可取代的潜力。各个著名的研究机构都投入了大量人力和物力从事这方面的研究。例如,美国宇航局NASA拥有一支庞大的形式化方法研究团队,他们在保证美国航天器控制软件正确性方面发挥了巨大作用,在美国研发“好奇号”火星探测器时,为了提高控制软件的可靠性和生产率,广泛使用了形式化方法。在新兴领域,如区块链及人工智能等领域,形式化方法也逐步得到应用,提升系统的整体安全可控。 本专题公开征文,共征得投稿27篇。特约编辑先后邀请了国内外在该领域比较活跃的学者参与审稿工作,每篇投稿至少邀请2位专家进行初审。大部分稿件经过初审和复审两轮评审,部分稿件经过了两轮复审。通过初审的稿件还在FMAC 2020大会上进行了现场报告,作者现场回答了与会者的问题,并听取了与会者的修改建议。最终有18篇论文入选本专题。
    10  区块链系统攻击与防御技术研究进展
    田国华,胡云瀚,陈晓峰
    2021, 32(5):1495-1525. DOI: 10.13328/j.cnki.jos.006213
    [摘要](2233) [HTML](33) [PDF 2.85 M](2476)
    摘要:
    区块链作为一种多技术融合的新兴服务架构,因其去中心化、不可篡改等特点,受到了学术界和工业界的广泛关注.然而,由于区块链技术架构的复杂性,针对区块链的攻击方式层出不穷,逐年增加的安全事件导致了巨大的经济损失,严重影响了区块链技术的发展与应用.从层级分类、攻击关联分析两个维度对区块链已有安全问题的系统架构、攻击原理、防御策略展开研究.首先,按照区块链层级架构对现有区块链攻击进行归类,介绍了这些攻击方式的攻击原理,分析了它们的共性与特性;其次,分析总结了已有解决方案的思路,提出了一些有效的建议和防御措施;最后,通过攻击关联分析归纳出多个区块链攻击簇,构建了一个相对完整的区块链安全防御体系,展望了区块链技术在未来复杂服务场景下的安全态势.
    11  基于深度学习的数字病理图像分割综述与展望
    宋杰,肖亮,练智超,蔡子贇,蒋国平
    2021, 32(5):1427-1460. DOI: 10.13328/j.cnki.jos.006205
    [摘要](2523) [HTML](25) [PDF 3.41 M](4013)
    摘要:
    数字病理图像分析对于乳腺癌、前列腺癌等良恶性分级诊断具有重要意义,其中,组织基元的形态和目标测量是量化分析的重要依据.然而,由于病理数据多样性和复杂性等新特点,其分割任务面临着特征提取困难、实例分割困难等挑战.人工智能辅助病理量化分析将复杂病理数据转化为可挖掘的图像特征,使得自动提取组织基元的定量化信息成为可能.特别是随着计算机计算能力的快速发展,深度学习技术凭借其强大的特征学习、设计灵活等特性在数字病理量化分析领域取得了突破性成果.系统概述目前代表性深度学习方法,包括卷积神经网络、全卷积网络、编码器-解码器模型、循环神经网络、生成对抗网络等方法体系,总结深度学习在病理图像分割等任务中的建模机理和应用,并梳理了现有方法的方法理论、关键技术、优缺点和性能分析.最后讨论了未来数字病理图像分割深度学习建模的开放性挑战和新趋势.
    12  可信机器学习的公平性综述
    刘文炎,沈楚云,王祥丰,金博,卢兴见,王晓玲,查宏远,何积丰
    2021, 32(5):1404-1426. DOI: 10.13328/j.cnki.jos.006214
    [摘要](2681) [HTML](32) [PDF 2.12 M](2160)
    摘要:
    人工智能在与人类生活息息相关的场景中自主决策时,正逐渐面临法律或伦理的问题或风险.可信机器学习是建立安全人工智能系统的核心技术,是人工智能领域的热门研究方向,而公平性是可信机器学习的重要考量.公平性旨在研究机器学习算法决策对个人或群体不存在因其固有或后天属性所引起的偏见或偏爱.从公平表征、公平建模和公平决策这3个角度出发,以典型案例中不公平问题及其危害为驱动,分析数据和算法中造成不公平的潜在原因,建立机器学习中的公平性抽象定义及其分类体系,进一步研究用于消除不公平的机制.可信机器学习中的公平性研究在人工智能多个领域中处于起步阶段,如计算机视觉、自然语言处理、推荐系统、多智能体系统和联邦学习等.建立具备公平决策能力的人工智能算法,是加速推广人工智能落地的必要条件,且极具理论意义和应用价值.
    13  程序智能合成技术研究进展
    顾斌,于波,董晓刚,李晓锋,钟睿明,杨孟飞
    2021, 32(5):1373-1384. DOI: 10.13328/j.cnki.jos.006200
    [摘要](1601) [HTML](29) [PDF 1.34 M](1059)
    摘要:
    近年来,随着信息技术快速发展,软件重要性与日俱增,极大地推动了国民经济的发展.然而,由于软件业务形态越来越复杂和需求变化越来越快,软件的开发和维护成本急剧增加,迫切需要探索新的软件开发模式和技术.目前,各行业在软件活动中积累了规模巨大的软件代码和数据,这些软件资产为软件智能化开发建立了数据基础.与此同时,深度学习等人工智能技术在多个领域取得的成功应用,促使研究者考虑使用智能化技术与软件工程技术相结合,解决程序自动生成问题.程序智能合成方法是程序自动生成的新途径,通过实现软件开发过程的自动化,提高软件的生产率.首先分析了软件工程的发展历程及挑战,进而研究了智能化程序合成技术领域的研究布局以及各方法的优势和劣势.最后,对程序智能合成技术加以总结,并给出了未来的研究建议.
    14  面向持续软件工程的微服务架构技术专题前言
    张贺,王忠杰,陈连平,彭鑫
    2021, 32(5):1229-1230. DOI: 10.13328/j.cnki.jos.006237
    [摘要](1017) [HTML](24) [PDF 284.13 K](684)
    摘要:
    随着软件互联网化和服务化的高度发展,持续性(continuity)成为现代软件系统的基本特性之一,覆盖从商业策划、软件开发、运维、演化的所有环节,使得软件系统在持续稳定提供功能和服务的同时,软件系统的边界和内部结构始终处于不断变化、持续更新和适应之中,持续软件工程(continuous software engineering)由此被提出并迅速得到广泛的实践应用.微服务(microservice)架构作为一种全新的去中心化分布式架构,在软件架构层面成为适应持续软件工程发展的必然趋势,而领域驱动设计(domain-driven design,简称DDD)伴随着微服务架构的兴起也重新获得了业界的广泛关注,二者共同关注服务自顶向下的合理设计和分解.微服务架构与领域驱动设计共同支持实现现代软件系统的持续性特征.为了反映中国学者和实践者在求解以微服务架构为代表的持续软件工程所面临的架构难题和挑战过程中取得的理论、技术或实验方面的创新性、突破性的高水平研究成果,特设立此专题. 本专题采取公开征稿的方式,共收到19篇投稿并通过了形式审查.特约编辑邀请了20余位领域专家参与审稿,每篇稿件至少邀请2位评审专家并经过两轮审稿.共计10篇稿件通过第1轮评审,并在CCF中国软件大会上进行了报告.经过第2轮终审,最终有6篇论文入选本专题.其中, 论文“基于混沌工程的微服务韧性风险识别和分析”研究微服务架构系统的韧性风险识别问题,通过向系统引入随机环境扰动并观察服务性能的变化来寻找潜在韧性风险,向运维人员提供参考. 论文“面向微服务架构的开发组织适应性评估框架”通过系统化文献综述得出了使用微服务架构对组织产生的7个方面的影响,进一步提出了一个用于评估并提高开发组织对于微服务架构的适应性的评估框架. 论文“一种优化的数据流驱动的微服务化拆分方法”提出了一种自动化的微服务拆分与评估方法DFD-A,支持从数据收集分析、服务拆分到候选微服务架构评估的自动化设计过程,并实现了原型工具. 论文“一种监控系统的链路跟踪型日志数据的存储设计”基于开源的应用性能监控系统CAT,提出了一种针对tracing类型日志数据的存储设计方案,提升了存储效率和查询效率,并在美团点评线上系统中得到真实 应用. 论文“基于多源特征空间的微服务可维护性评估”提出了一种多源特征空间模型以统一表示软件维护过程中产生的多源数据.基于该模型提出了微服务代码可维护性度量,并实现了原型工具MicroEvaluator. 论文“多版本共存的微服务系统自适应演化方法”针对微服务系统中的多版本共存现象和用户/运维需求的变化,提出了最优化微服务系统演化方案的设计方法,实现了相应的编程框架以支持微服务系统自适应演化. 本专题面向持续软件工程和微服务架构的研究人员和工程实践人员,内容涵盖系统软件、软件工程等领域,反映了我国学者在以微服务架构为代表的持续软件工程方法、技术以及支持工具等方面的高水平研究成果.感谢《软件学报》编委会、中国计算机学会软件工程专委会与系统软件专委会对专题工作的指导和帮助,感谢专题全体评审专家及时、耐心、细致的评审工作,感谢踊跃投稿的所有作者.希望本专题能够对国内持续软件工程和微服务领域的科研工作有所促进.
    15  多尺度目标检测的深度学习研究综述
    陈科圻,朱志亮,邓小明,马翠霞,王宏安
    2021, 32(4):1201-1227. DOI: 10.13328/j.cnki.jos.006166
    [摘要](2258) [HTML](26) [PDF 3.72 M](2658)
    摘要:
    目标检测一直以来都是计算机视觉领域的研究热点之一,其任务是返回给定图像中的单个或多个特定目标的类别与矩形包围框坐标.随着神经网络研究的飞速进展,R-CNN检测器的诞生标志着目标检测正式进入深度学习时代,速度和精度相较于传统算法均有了极大的提升.但是,目标检测的尺度问题对于深度学习算法而言也始终是一个难题,即检测器对于尺度极大或极小目标的检测精度会显著下降,因此,近年来有不少学者在研究如何才能更好地实现多尺度目标检测.虽然已有一系列的综述文章从算法流程、网络结构、训练方式和数据集等方面对基于深度学习的目标检测算法进行了总结与分析,但对多尺度目标检测的归纳和整理却鲜有人涉足.因此,首先对基于深度学习的目标检测的两个主要算法流派的奠基过程进行了回顾,包括以R-CNN系列为代表的两阶段算法和以YOLO、SSD为代表的一阶段算法;然后,以多尺度目标检测的实现为核心,重点诠释了图像金字塔、构建网络内的特征金字塔等典型策略;最后,对多尺度目标检测的现状进行总结,并针对未来的研究方向进行展望.
    16  后量子密码算法的侧信道攻击与防御综述
    吴伟彬,刘哲,杨昊,张吉鹏
    2021, 32(4):1165-1185. DOI: 10.13328/j.cnki.jos.006165
    [摘要](1069) [HTML](30) [PDF 2.07 M](1092)
    摘要:
    为了解决量子计算对公钥密码安全的威胁,后量子密码成为密码领域的前沿焦点研究问题.后量子密码通过数学理论保证了算法的安全性,但在具体实现和应用中易受侧信道攻击,这严重威胁到后量子密码的安全性.基于美国NIST第2轮候选算法和中国CACR公钥密码竞赛第2轮的候选算法,针对基于格、基于编码、基于哈希、基于多变量等多种后量子密码算法进行分类调研,分析其抗侧信道攻击的安全性现状和现有防护策略.为了深入分析后量子密码的侧信道攻击方法,按照算法核心算子和攻击类型进行分类,总结了针对各类后量子密码常用的攻击手段、攻击点及攻击评价指标.进一步地,根据攻击类型和攻击点,梳理了现有防护策略及相应的开销代价.最后,根据攻击方法、防护手段和防护代价提出了一些安全建议,并且还分析了未来潜在的侧信道攻击手段与防御方案.
    17  学习索引:现状与研究展望
    张洲,金培权,谢希科
    2021, 32(4):1129-1150. DOI: 10.13328/j.cnki.jos.006168
    [摘要](1666) [HTML](25) [PDF 2.04 M](2174)
    摘要:
    索引是数据库系统中用于提升数据存取性能的主要技术之一.在大数据时代,随着数据量的不断增长,传统索引(如B+树)的问题日益突出:(1)空间代价过高.例如,B+树索引需要借助O(n)规模的额外空间来索引原始的数据,这对于大数据环境而言是难以容忍的.(2)每次查询需要多次的间接搜索.例如,B+树中的每次查询都需要访问从树根到叶节点路径上的所有节点,这使得B+树的查找性能受限于数据规模.自2018年以来,人工智能与数据库领域的结合催生了“学习索引”这一新的研究方向.学习索引利用机器学习技术学习数据分布和查询负载特征,并用基于数据分布拟合函数的直接式查找代替传统的间接式索引查找,从而降低了索引的空间代价并提升了查询性能.首先对学习索引技术的现有工作进行了系统梳理和分类;然后,介绍了各种学习索引技术的研究动机与关键技术,对比分析了各种索引结构的优劣;最后,对学习索引的未来研究方向进行了展望.
    18  基于深度学习的语言模型研究进展
    王乃钰,叶育鑫,刘露,凤丽洲,包铁,彭涛
    2021, 32(4):1082-1115. DOI: 10.13328/j.cnki.jos.006169
    [摘要](1869) [HTML](24) [PDF 3.07 M](1655)
    摘要:
    语言模型旨在对语言的内隐知识进行表示,作为自然语言处理的基本问题,一直广受关注.基于深度学习的语言模型是目前自然语言处理领域的研究热点,通过预训练-微调技术展现了内在强大的表示能力,并能够大幅提升下游任务性能.围绕语言模型基本原理和不同应用方向,以神经概率语言模型与预训练语言模型作为深度学习与自然语言处理结合的切入点,从语言模型的基本概念和理论出发,介绍了神经概率与预训练模型的应用情况和当前面临的挑战,对现有神经概率、预训练语言模型及方法进行了对比和分析.同时又从新型训练任务和改进网络结构两方面对预训练语言模型训练方法进行了详细阐述,并对目前预训练模型在规模压缩、知识融合、多模态和跨语言等研究方向进行了概述和评价.最后总结了语言模型在当前自然语言处理应用中的瓶颈,对未来可能的研究重点做出展望.
    19  可靠多模态学习综述
    杨杨,詹德川,姜远,熊辉
    2021, 32(4):1067-1081. DOI: 10.13328/j.cnki.jos.006167
    [摘要](1676) [HTML](25) [PDF 1.59 M](1173)
    摘要:
    近年来,多模态学习逐步成为机器学习、数据挖掘领域的研究热点之一,并成功地应用于诸多现实场景中,如跨媒介搜索、多语言处理、辅助信息点击率预估等.传统多模态学习方法通常利用模态间的一致性或互补性设计相应的损失函数或正则化项进行联合训练,进而提升单模态及集成的性能.而在开放环境下,受数据缺失及噪声等因素的影响,多模态数据呈现不均衡性.具体表现为单模态信息不充分或缺失,从而导致“模态表示强弱不一致”“模态对齐关联不一致”两大挑战,而针对不均衡多模态数据直接利用传统的多模态方法甚至会退化单模态和集成的性能.针对这类问题,可靠多模态学习被提出并进行了广泛研究,系统地总结和分析了目前国内外学者针对可靠多模态学习取得的进展,并对未来研究可能面临的挑战进行展望.
    20  面向领域的软件系统构造与质量保障专题前言
    潘敏学,魏峻,崔展齐
    2021, 32(4):887-888. DOI: 10.13328/j.cnki.jos.006230
    [摘要](885) [HTML](25) [PDF 283.26 K](471)
    摘要:
    软件是推动新一代信息技术发展的驱动力.随着互联网、云计算、人工智能等技术的快速发展,软件与物联网、区块链、自动驾驶等众多领域的融合进一步加强,正引领并促进这些领域向数字化、智能化发展,为社会、经济的加速演进和创新发展带来了新的契机.因此,面向领域的软件技术不仅是软件领域,也是众多其他领域国内外学者的关注焦点和研究重点.与传统的软件系统相比,面向领域的软件系统(简称领域软件)带来了研究与应用上的新挑战.面对领域软件的特点和需求,如何有效地构造领域软件,实现领域应用的软件定义与智能化,如何通过验证、分析、测试等多种手段严格保障系统控制行为的正确性、实时性、协同性等重要质量特性,是一个重大挑战. 本专题采取自由投稿的方式,共收到37篇投稿,其中36篇通过了形式审查.特约编辑邀请了30位领域专家参与审稿,每篇稿件至少邀请2位专家进行评审,每篇稿件都经过两轮审稿.共计16篇稿件通过第1轮评审,并在CCF软件工程专业委员会、系统软件专业委员会、形式化方法专业委员会年会2020 CCF中国软件大会(Chinasoft)上进行了报告.经过第2轮终审,最终有10篇论文入选本专题.其中,   论文“基于反例确认的CPS不确定性模型校准”研究了CPS中不确定性模型的准确性问题,提出了一种基于反例确认的校准方法以提高不确定性模型的准确度并精化CPS系统模型的验证结果.   论文“安全关键异构软件混合建模及代码生成方法”提出了一种AADL和SDL的混合建模方法,支持以自底向上的方式对安全关键软件系统进行混合建模,并给出了面向多核处理器平台的代码自动生成方法.   论文“基于环境建模的物联网系统TAP规则生成方法”提出了一种基于环境建模的TAP规则生成方法,自动地基于环境模型从服务需求中推导系统行为,检测系统行为的完整性与一致性,并最后转换为TAP规则.   论文“区块链赋能的高效物联网数据激励共享方案”提出了一个高效的区块链物联网数据激励共享框架,利用分片技术构建能够并行处理数据共享交易的异步共识区,并在云/边缘服务器和分片异步共识区上部署高效的共识机制,从而提高数据共享交易的处理效率.   论文“时空轨迹数据驱动的自动驾驶场景元建模方法”提出一种面向自动驾驶领域的时空轨迹数据元建模方法以实现数据的统一、处理与重用,并基于自动驾驶安全场景建模语言ADSML讨论了如何使用ADSML实现场景实例化.   论文“基于深度学习的混合模糊测试方法”提出了一个基于深度学习将符号执行与模糊测试相结合的混合测试方法,并实现了相应的混合测试工具SmartFuSE.   论文“一种结构信息增强的代码修改自动转换方法”基于深度学习提出了一种结构信息增强的代码修改自动转换方法,增强了模型对代码的结构信息和依赖信息的捕获能力,从而提升了代码修改自动转换的准确性.   论文“融合代码与文档的软件功能特征挖掘方法”提出了一种融合代码与文档的软件功能特征挖掘方法.通过迭代挖掘软件源代码和以Stack Overflow讨论帖为代表的软件文档,自动提取开源软件的功能特征描述,并构造层次化的软件功能特征视图.   论文“基于偶然正确性概率的错误定位技术”通过对基于代码覆盖的错误定位技术中可疑度的计算方法进行修正,提出了一种错误定位技术,以消除偶然正确性现象对错误定位技术的影响.   论文“面向神经机器翻译系统的多粒度蜕变测试”提出了一种基于蜕变测试的多粒度测试框架,用于在没有参考译文的情况下评估神经机器翻译系统的翻译质量及其翻译鲁棒性.   本专题面向领域软件的研究人员和工程人员,内容涵盖领域软件的需求分析、设计与建模、开发与构造、测试与验证等领域,反映了我国学者在相关领域的高水平研究成果.感谢《软件学报》编委会、CCF软件工程专委会、系统软件专委会、形式化方法专委会对专题工作的指导和帮助,感谢专题全体评审专家及时、耐心、细致的评审工作,感谢踊跃投稿的所有作者.希望本专题能够对领域软件的科研工作有所促进.
    21  GPU数据库核心技术综述
    裴威,李战怀,潘巍
    2021, 32(3):859-885. DOI: 10.13328/j.cnki.jos.006175
    [摘要](1390) [HTML](25) [PDF 2.40 M](1331)
    摘要:
    GPU以其超高速计算能力和超大数据处理带宽受到数据库厂商及研究人员的青睐,以GPU计算为核心的数据库分支(GDBMS)蓬勃发展,以其吞吐量大、响应时间短、成本低廉、易于扩展的特点,与人工智能、时空数据分析、数据可视化、商务智能交互融合能力,彻底改变了数据分析领域的格局.将对GDBMS的四大核心组件——查询编译器、查询处理器、查询优化器和存储管理器进行综述,希望促进未来的GDBMS研究和商业应用.
    22  支撑人工智能的数据管理与分析技术专刊前言
    陈雷,王宏志,童咏昕,高宏
    2021, 32(3):601-603. DOI: 10.13328/j.cnki.jos.006187
    [摘要](1209) [HTML](24) [PDF 385.65 K](719)
    摘要:
    近年来,支撑人工智能的数据管理与分析技术正成为大数据和人工智能领域研究的热点问题之一.利用和发展数据管理与分析理论技术,为提升人工智能系统全生命周期的效率和有效性提供基础性支撑,必将进一步促进基于大数据的人工智能技术发展与其在更大范围的推广应用.本专刊聚焦在数据管理与人工智能融合发展的过程中,数据库技术对人工智能的优化支撑作用,包括两方面:(1) 传统数据管理分析的理论技术对人工智能的数据和计算过程的优化;(2) 传统数据管理系统设计理念对开发通用且易用型人工智能平台的促进作用.因此,需要利用和发展现有数据库理论,构建形成新的技术和系统经验.专刊重点立足于数据库核心技术,探讨数据管理与分析技术对人工智能研究发展推动作用,特别是数据管理分析的理论技术对人工智能在数据和计算密集环节的优化,以及数据管理系统设计理念与开发经验对构建通用型人工智能平台的促进作用,重点关注数据管理与分析技术对人工智能在数据存储、算法优化、模型管理、模型服务、系统构建等方面的支撑作用. 本专刊公开征文,共收到投稿36篇.论文均通过了形式审查,内容涉及支撑人工智能的数据管理、分析、系统与应用.特约编辑先后邀请了 60多位专家参与审稿工作,每篇投稿至少邀请2位专家进行评审.稿件经初审、复审、NDBC 2020会议宣读和终审共4个阶段,历时6个月,最终有17篇论文入选本专刊.根据主题,这些论文可以分为5组.
    23  区块链共识协议综述
    夏清,窦文生,郭凯文,梁赓,左春,张凤军
    2021, 32(2):277-299. DOI: 10.13328/j.cnki.jos.006150
    [摘要](3757) [HTML](25) [PDF 2.19 M](2717)
    摘要:
    共识协议作为区块链的核心技术,近年来已经得到学术界和产业界的广泛重视,并取得了一系列研究成果.当前,关于共识协议的综述研究一般将共识协议作为整体进行比较分析,缺乏对共识协议中主要步骤的解耦与比较.将共识协议分为出块节点选举和主链共识两个主要步骤,并针对每个步骤进行协议间的分析比较.在出块节点选举部分,主要讨论工作量证明和权益证明,分析其中存在的问题以及相应解决方案的分类比较.在主链共识部分,针对概率性共识和确定性共识,总结其安全目标,并进行安全性分析比较.通过对区块链共识协议的系统梳理,最后总结共识协议的发展现状和发展趋势,以及未来的重要研究方向.

    当期目录


    文章目录

    过刊浏览

    年份

    刊期

    联系方式
    • 《软件学报 》
    • 主办单位:中国科学院软件研究所
                       中国计算机学会
    • 邮编:100190
    • 电话:010-62562563
    • 电子邮箱:jos@iscas.ac.cn
    • 网址:http://jos.org.cn/
    • 刊号:ISSN 1000-9825
    •           CN 11-2560/TP
    • 国内定价:70元
    您是第位访问者
    版权所有:中国科学院软件研究所 京ICP备05046678号-3
    地址:北京市海淀区中关村南四街4号,邮政编码:100190
    电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
    技术支持:北京勤云科技发展有限公司

    京公网安备 11040202500063号