2016, 27(5):1059-1060. DOI: 10.13328/j.cnki.jos.004963 CSTR:
摘要:在大数据时代,从浩瀚复杂的数据中快速而准确地获取相关重要信息,是各行各业发展甚至赖以生存的重要基础.为此,可视化及可视分析的研究在全球正方兴未艾,并密切地融于实际应用中,为社会发展与生产实践的进步发挥了巨大的作用.这方面的工作一般分为科学计算可视化、信息可视化及可视分析,各有侧重.近年来,大数据的多样性、复杂性及其应用的适应性对可视化及可视分析领域的基础理论和技术手段提出了很多新的挑战.本专题选题为可视化及可视分析,反映我国学者在这方面工作的部分近期研究成果. 本专题公开征文,并与IEEE PacificVis 2015和第2届中国可视化与可视分析大会(ChinaVis 2015)合作进行专题组稿,共收到稿件65篇.经过会议筛选,并邀请国内外相关领域专家参与审稿工作,历时6个月,经初审、复审、会商和终审各个阶段,最终遴选出12篇高质量的论文入选本专题. 首先,研究新的更高效、更适用的可视化和可视分析方法是这方面工作的重要基础.以下论文在这方面进行了探讨,特别是研究了层次化多维数据的处理. 《基于密度-距离图的交互式体数据分类方法》依据物质中心密度大且物质中心间距离远这一特性,提出新的体数据分类方法,无需预设物质类别的数量,能够快速地实现较高准确度的分类. 《树比较可视化方法综述》对处理层次数据的树比较可视化方法进行了较为全面的分析和评估,探讨了不同方法对于不同数据分析需求的适用性,并展望了将来的发展. 《一种层次结构中多维属性的可视化方法》为具有层次结构且属性多维的复杂数据提出了有效且实用的可视表达方法,并已应用于全国各地区、各超市、各农产品中农药残留检出和超标情况侦测数据的可视化. 《面向层次化数据的变分圆形树图》提出了优化布局多个圆的快速计算方法,提高了圆形树图的空间利用率,并方便支持层次下行、层次上行与焦点+上下文等自然交互方式,有利于交互可视分析的实施. 《基于层次狄利克雷过程的交互式主题建模》对层次狄利克雷过程进行了改进,使其支持单词约束,由此可基于矩阵视图交互迭代地优化主题模型,提高文本数据分析的主题建模质量. 《基于维度扩展的Radviz可视化聚类分析方法》提出了基于数据概率分布的维度增加方法,提高了RadiViz这种径向投影型多维数据可视化方法的聚类表达效果. 其次,多篇论文探讨了可视化及可视分析在具体应用中的实施和系统构建,相关的应用领域包括气象分析、视频分析、文本阅读、移动日志、网络监控等. 《一种全球尺度三维大气数据可视化系统》完成了一个面向气象预报与气象研究需求的可视化分析系统,能够有效地处理具有时变、多源、多维度、数据量大和多尺度等特征的气象数据,流畅地全方位展现气象数据中的信息. 《运动目标三维轨迹可视化与关联分析方法》研究了视频数据中运动目标的跟踪分析,并进而探讨对象之间关联性获取的方法,以提高视频分析的效率. 《基于文本摘要及引用关系的可视辅助文献阅读》描述了一个基于文本摘要和引用关系的可视辅助文献阅读系统,以帮助读者快速找到最重要、最相关的文献,避免阅读过程中的迷失. 《基于移动终端日志数据的人群特征可视化》提出了移动终端日志数据的深度分析与相应的可视化展示方法,能够更加准确地概括出移动终端用户的特征. 《多视图合作的网络流量时序数据可视分析》提出了一个自顶向下的网络流量时序分析流程模型,并实现了一个多视图合作的网络流量时序数据可视分析原型系统,便于网络安全分析人员使用网络流量时序数据检测网络异常情况. 《一种模型驱动的可视化生成系统》给出了一种可视化描述语言,并由此提出一种模型驱动的可视化生成系统,能够实现所见即所得的可视化系统快速生成. 本专题主要面向数据处理、可视化及可视分析等相关领域的研究人员,反映了我国学者在可视化及可视分析等领域的最新研究进展.在此,我们要特别感谢《软件学报》编委会对本专题工作的指导和帮助,感谢编辑部各位老师从征稿启示发布、审稿专家邀请至评审意见汇总、论文定稿、修改及出版所付出的辛勤工作和汗水,感谢本专题评审专家及时、耐心、细致的评审工作.此外,我们还要感谢向本专题踊跃投稿的作者对《软件学报》的信任. 最后,感谢本专题的读者们,希望本专题能够对相关领域的研究工作有所帮助.
2016, 27(5):1061-1073. DOI: 10.13328/j.cnki.jos.004961 CSTR:
摘要:体数据分类是体绘制中传递函数设计的核心问题.标量值-梯度模直方图作为表征体数据的一种经典二维特征空间,已被广泛应用于分类体数据.然而,大部分已有方法存在过于依赖分类算法的参数设置、运算效率低、交互复杂度高等问题.以标量值-梯度模直方图的密度分布为基础,并依据物质中心密度大且物质中心间距离远这一特性,首先快速计算每个数据点的密度及每个数据点到比其密度大的点的最小距离;然后,将所有数据点投影到密度-距离图,并以密度-距离图作为人机接口,使用户能够交互地选择多个密度中心来分类体数据并设置传递函数.通过多组实验验证,所提出的方法无需预设物质类别的数量,分割标量值-梯度模直方图的准确度较高且速度较快,所设计的密度-距离图是一个有效的人机交互接口,可以有效地引导用户完成由粗糙到精细的递进式体数据分类和可视化过程.
2016, 27(5):1074-1090. DOI: 10.13328/j.cnki.jos.004957 CSTR:
摘要:层次数据是生产和生活中常见的一类数据.树可视化通常用于呈现层次数据,是可视分析中的一个重要部分.比较是一种常用的分析方式,而树比较可视化也是可视分析研究中的一个重要课题.树比较可视化从所比较的树的数目角度,分为树内比较、两树比较和多树(3树及以上)比较;从数据特点角度分为静态树比较和动态树比较;从比较分析的任务角度,分为结构比较和属性比较.对现有的树比较可视化方法进行了总结,按照不同方法的表现形式,将树比较可视化分为并置、合并以及动画这3类.同时,结合其他分类方法对树比较可视化方法进行了全面的分析和评估.通过评估和比较,分析了不同方法的优缺点以及在不同的数据分析需求中的适用性.在此基础上,还对树比较可视化中的交互方式进行了总结,并阐述了树比较可视化所面临的挑战.
陈谊 , 甄远刚 , 胡海云 , 梁婕 , Kwan-Liu MA
2016, 27(5):1091-1102. DOI: 10.13328/j.cnki.jos.004956 CSTR:
摘要:在很多领域的统计分析中,通常需要分析既具有层次结构又具有多维属性的复杂数据,如食品安全数据、股票数据、网络安全数据等.针对现有多维数据和层次结构的可视化方法不能满足对同时具有层次和多维两种属性数据的可视分析要求,提出了一种树图中的多维坐标MCT(multi-coordinate in treemap)技术.该技术采用基于Squarified和Strip布局算法的树图表示层次结构,用树图中节点矩形的边作为属性轴,通过属性映射、属性点连接、曲线拟合实现层次结构中多维属性的可视化.将该技术应用于全国农药残留侦测数据,实现了对全国各地区、各超市、各农产品中农药残留检出和超标情况的可视化,为领域人员提供了有效的分析工具.MCT技术也可用于其他领域的层次多属性数据的可视化.
2016, 27(5):1103-1113. DOI: 10.13328/j.cnki.jos.004952 CSTR:
摘要:圆形树图(circular treemap)是面向层次化数据的一种信息可视化方法.提出一种圆形树图构造方法,将圆形树图的布局问题与组合优化中的圆排列(disk packing)问题相结合,以一种基于变分连续优化的算法求解多个半径不同圆的优化布局,由此提高圆形树图的空间利用率,并支持层次下行、层次上行与焦点+上下文等自然交互方式.实验结果表明了该方法的有效性.
2016, 27(5):1114-1126. DOI: 10.13328/j.cnki.jos.004955 CSTR:
摘要:随着信息技术的快速发展,大量的文本数据产生、被收集和存储.主题模型是文本分析的重要工具之一,被广泛地应用于分析大规模文本集.然而,主题模型通常无法直观而有效地结合用户的领域专业知识对模型结果进行修正.针对这一问题,提出了一个交互式可视分析系统,帮助用户对主题模型进行交互修正.首先对层次狄利克雷过程进行了改进,使其支持单词约束;然后,使用矩阵视图对主题模型进行展示,并使用语义相关的词云布局帮助用户寻找单词约束,用户通过添加单词约束迭代优化主题模型;最后,通过案例分析及用户研究来评价该系统的可用性.
2016, 27(5):1127-1139. DOI: 10.13328/j.cnki.jos.004951 CSTR:
摘要:Radviz是一种多维数据可视化技术,它通过径向投影机制将多维数据映射到低维空间,使具有相似特征的数据点投影到相近位置,从而形成可视化聚类效果.Radviz圆周上的维度排列顺序对数据投影结果影响很大,提出将原始维度划分为多个新维度来拓展Radviz圆周上的维度排序空间,从而获得比原始维度条件下更好的可视化聚类效果.该维度划分方法首先计算数据在每个原始维度的概率分布直方图,然后使用均值漂移算法对直方图进行划分,最后根据划分结果将原始维度扩展为多个新维度.提出使用Dunn指数和正确率来量化评估Radviz可视化聚类效果.进行了多组对比实验,结果表明,维度扩展有利于多维数据在Radviz投影中获得更好的可视化聚类效果.
梅鸿辉 , 陈海东 , 肇昕 , 刘昊南 , 朱标 , 陈为
2016, 27(5):1140-1150. DOI: 10.13328/j.cnki.jos.004954 CSTR:
摘要:气象数据具有时变、多源、多维度、数据量大和多尺度等特征,常规的气象数据可视化方法难以满足气象预报与气象研究中的需求.描述了一个新的全球尺度三维大气数据可视化系统——AVIS.系统实现了面向各类密度场、向量场、张量场和非空间数据的可视化方法,设计了适用于大气数据的球面体绘制和混合绘制方法.系统还实现了一套跨平台并行可视化及分析构架,支持在浏览器中或其他显示和交互设备上使用,并利用后端计算集群加速数据的计算与绘制过程.案例分析表明,该系统可以全方位地展现气象数据中的信息,帮助用户综合多种气象信息进行分析.
2016, 27(5):1151-1162. DOI: 10.13328/j.cnki.jos.004953 CSTR:
摘要:随着治安监控系统的普及,越来越多的监控摄像头被安装在各个交通道路和公共场所中,每天都产生大量的监控视频.如今,监控视频分析工作主要是采用人工观看的方式来排查异常,以这种方式来分析视频内容耗费大量的人力和时间.目前,关于视频分析方面的研究大多是针对目标个体的异常行为检测和追踪,缺乏针对对象之间的关联关系的分析,对视频中的一些对象和场景之间的关联关系等还没有较为有效的表示和分析方法.针对这一现状,提出一种基于运动目标三维轨迹的关联视频可视分析方法来辅助人工分析视频,首先对视频资料进行预处理,获取各个目标对象的运动轨迹信息,由于二维轨迹难以处理轨迹的自相交、循环运动和停留等现象,并且没有时间信息就难以对同一空间内多个对象轨迹进行的关联性分析,于是结合时间维度对轨迹进行三维化扩展.该方法支持草图交互方式来操作,在分析过程中进行添加草图注释来辅助分析.可结合场景和对象的时空关系对轨迹进行关联性计算,得出对象及场景之间的关联模型,通过对对象在各个场景出现状况的统计,结合人工预先设定的规则,可实现对异常行为报警,辅助用户决策.
张加万 , 杨思琪 , 李泽宇 , 杨伟强 , 王锦东 , 贺瑞芳 , 黄茂林
2016, 27(5):1163-1173. DOI: 10.13328/j.cnki.jos.004962 CSTR:
摘要:近年来,科技论文发表数量与日俱增,科研人员需要阅读文献的数量也随之迅速增长.如何快速而有效地阅读一篇科技论文,逐渐成为一个重要的研究课题.另一方面,在阅读科技论文时,理解与其相关的重要参考文献可帮助读者更好地理解文章的内容.然而,如何从众多的参考文献中快速找到最重要、最相关的几篇,如何避免在阅读过程中迷失在文档的多维空间,仍是值得研究的问题.为了解决上述问题,提出了一个基于文本摘要和引用关系的可视辅助文献阅读系统.该系统利用一种基于阅读目的的文本摘要技术提取出论文中重要的句子,并采用多尺度的可视化方式进行展示;使用LDA(latent dirichlet allocation)话题模型抽取参考文献的核心话题;记录用户的阅读行为,用于提示其阅读上下文,以保证用户关注点不发生迷失.同时,在一个具体的案例场景中详细介绍了系统的使用方法,并进行了用户研究以验证系统的可用性.
2016, 27(5):1174-1187. DOI: 10.13328/j.cnki.jos.004958 CSTR:
摘要:随着我国移动互联网的迅猛发展,如何从海量移动终端日志数据中提取出有效信息,并进行合理、清晰的可视化分析,为工业界等提供有价值的统计分析功能显得尤为重要.目前,对于移动终端日志数据的研究和分析多是基于对单一属性的统计结果分析,如应用下载排行、用户留存率等.为了进一步挖掘移动终端日志数据背后深层次的隐含信息,更加准确地概括出移动终端用户的特征,提出了一种基于移动应用程序日志数据的人群特征分析与画像计算方法,构造了基于移动应用程序数据的主题模型,并将移动设备用户按照与不同应用主题的相关度进行聚类,得到了具有不同特征的人群,从而提出了基于层次气泡图和Voronoi Treemap的可视化展现与分析方案.进一步将人群特征与时间信息、地理位置信息相结合,从多角度可视化展现人群特征.最后,根据该研究内容,实现了B/S架构的日志数据可视化分析原型系统,并通过案例分析验证了该方法的有效性.
2016, 27(5):1188-1198. DOI: 10.13328/j.cnki.jos.004960 CSTR:
摘要:网络安全可视化作为一个交叉应用研究领域,为传统网络安全数据分析方法注入了新的活力.但已有研究过于注重网络安全数据的可视表达,而忽视了对分析流程的支持.抽象了网络安全分析人员用网络流量时序数据检测网络异常的过程,提出了一个自顶向下的网络流量时序分析流程模型.以该模型为指导,设计并实现了一个多视图合作的网络流量时序数据可视分析原型系统.在分析端口扫描和DDoS攻击等常见网络异常的案例中,该系统中的4个协同交互、简单易用的可视视图,可以较好地支撑分析人员由整体到个体、由点到面以及由历史到未来的网络流量时序数据分析过程.
2016, 27(5):1199-1211. DOI: 10.13328/j.cnki.jos.004959 CSTR:
摘要:随着可视化与可视分析需求的增加,可视化开发所需的总成本不断提高.模型驱动的开发方法能够提高软件开发的效率,但在可视化开发中并没有发挥应有的作用.在此背景下,给出DVDL(data visualization descriptionlanguage)——一种模块化、层次化描述的可视化描述语言,利用DVDL可以对组成可视化的各个部分进行不同抽象层次上的描述.在DVDL基础上,给出一种模型驱动的可视化生成系统DVIZ(data visualization).该系统通过数据源选择、可视化配置、发布与分享这3个步骤以及所见即所得的配置,实现可视化的快速生成;系统支持多可视化图形之间的交互与关联配置;并且该系统基于Web开发,支持多种社交平台,易于分享与传播.
2016, 27(5):1212-1229. DOI: 10.13328/j.cnki.jos.004829 CSTR:
摘要:特征模型是面向特征的软件开发过程的重要概念和制品,该模型以特征为单位,刻画了领域产品的共性和可变性.在日趋频繁的软件演化过程中,保持特征模型的一致演化,对于支持高效的复用开发和按需配置至关重要.目前,大多数的研究是在需求层面进行共性和可变性分析,对特征模型的研究则集中在对共性和可变性的建模上.但是,由于特征变更在建模过程中存在"涟漪"效应,会导致新的共性和可变性演化.现有的分析方法还无法解决这个问题,会导致丢失一些潜在的产品共性,从而影响复用的效率.提出了一种特征模型扩展和演化分析方法.通过扩展特征关联关系和模型演化元操作,实现对特征变更"涟漪"效应的分析.发现潜在的产品共性,提出重构策略和半自动化的共性提取和特征重构支持方法.该方法还针对典型的配置冲突提出了冲突消解规则和策略.最后,通过案例分析验证了该方法的可用性和有效性.
2016, 27(5):1230-1245. DOI: 10.13328/j.cnki.jos.005027 CSTR:
摘要:针对缺陷检测的需求,提出了面向危险操作的动态符号执行方法.依据所关注的缺陷类型,定义危险操作及危险操作相关路径,通过计算覆盖不同上下文中危险操作的能力,协助动态符号执行选择高效初始输入,并利用危险操作相关信息引导测试流程.缺陷检测成为定位待测程序内危险操作以及对危险操作相关路径进行检测的过程.实现了面向Linux平台二进制可执行程序的原型系统CrashFinder,实验结果表明,该方法能够更快地发现更多缺陷.
2016, 27(5):1246-1265. DOI: 10.13328/j.cnki.jos.004828 CSTR:
摘要:通用GPU因其强大的并行计算能力成为新兴的高性能计算平台,并逐渐成为近年来学术界在高性能数据库实现技术领域的研究热点.但当前GPU数据库领域的研究沿袭的是ROLAP(relational OLAP)多维分析模型,研究主要集中在关系操作符在GPU平台上的算法实现和性能优化技术,以哈希连接的GPU并行算法研究为中心.GPU拥有数千个并行计算单元,但其逻辑控制单元较少,相对于CPU具有更强的并行计算能力,但逻辑控制和复杂内存管理能力较弱,因此并不适合需要复杂数据结构和复杂内存管理机制的内存数据库查询处理算法直接移植到GPU平台.提出了面向GPU向量计算特性的混合OLAP多维分析模型semi-MOLAP,将MOLAP(multidimensionalOLAP)模型的直接数组访问和计算特性与ROLAP模型的存储效率结合在一起,实现了一个基于完全数组结构的GPU semi-MOLAP多维分析模型,简化了GPU数据管理,降低了GPU semi-MOLAP算法复杂度,提高了GPU semi-MOLAP算法的代码执行率.同时,基于GPU和CPU计算的特点,将semi-MOLAP操作符拆分为CPU和GPU平台的协同计算,提高了CPU和GPU的利用率以及OLAP的查询整体性能.
2016, 27(5):1266-1284. DOI: 10.13328/j.cnki.jos.004882 CSTR:
摘要:社区推荐从海量社区中为用户过滤出有价值的社区,变得越来越重要.新颖性推荐逐渐得到关注,因为单纯追求准确度的推荐结果存在局限性.已有新颖性推荐方法不适用于社区推荐,因其无法处理Web社区特性,包括社区成员用户通过交互形成的关系网络以及社区主题.提出了一种新颖性社区推荐方法NovelRec,向用户推荐其有潜在兴趣但不知道的社区,旨在拓展用户视野和推动社区发展.NovelRec基于用户交互网络中的邻域关系,利用用户之间在主题上的关联,计算候选社区对用户的准确度;根据用户与社区在邻域和主题上的关联,提出一种用户社区距离度量方式,并利用该距离计算候选社区的新颖度.在此基础上,NovelRec最终进行新颖性社区推荐,并兼顾推荐结果的准确性.真实数据集上的对比实验结果表明,NovelRec方法在新颖性上优于现有方法,同时能够保证推荐结果的准确性.
2016, 27(5):1285-1300. DOI: 10.13328/j.cnki.jos.004824 CSTR:
摘要:覆盖率不仅是评价无线传感器网络体系性能的重要标准之一,也是无线传感器网络所研究的一项重点课题.为此,提出了一种概率模型下优化覆盖算法.该算法通过对概率覆盖模型的计算,给出了传感器节点覆盖的期望值和公差的求解过程以及对所关注目标节点进行首次覆盖后的期望值证明过程.在网络能量方面则通过节点状态调度策略对通信路径进行优化,证明节点能量衰减过程中,拟合函数极限存在的意义,实现了传感器节点能量的有效匹配,抑制了传感器节点能量的消耗,证明了优化后整个监测区域传感器节点覆盖函数之间的关系.仿真实验结果表明,该算法不仅提高了覆盖和网络服务质量,而且有效地抑制了网络能量开销,延长了网络生存周期.
2016, 27(5):1301-1308. DOI: 10.13328/j.cnki.jos.004912 CSTR:
摘要:针对云存储中数据检索和安全问题,提出了一个可验证的基于词典的可搜索加密方案.该方案能够验证搜索结果的完备性.在适应性不可区分安全模型下证明了该方案的安全性.与现有方案相比,该方案具有陷门大小固定、适应性安全、更新无需重新计算、可验证等优势.
2016, 27(5):1309-1324. DOI: 10.13328/j.cnki.jos.005017 CSTR:
摘要:在现代操作系统中,内核运行在最高特权层,管理底层硬件并向上层应用程序提供系统服务,因而安全敏感的应用程序很容易受到来自底层不可信内核的攻击.提出了一种在不可信操作系统内核中保护应用程序的方法AppFort.针对现有方法的高开销问题,AppFort结合x86硬件机制(操作数地址长度)、内核代码完整性保护和内核控制流完整性保护,对不可信内核的硬件操作和软件行为进行截获和验证,从而高效地保证应用程序的内存、控制流和文件I/O安全.实验结果表明:AppFort的开销极小,与现有工作相比明显提高了性能.