2. 北京航空航天大学 计算机学院, 北京 100191;
3. 阿里巴巴iDST, 浙江 杭州 311121;
4. 中国人民大学 信息学院, 北京 100872;
5. 宁波大学 信息科学与工程学院, 浙江 宁波 315211
2. ;
3. ;
4. ;
5.
在当今信息爆炸时代, 随着网络通信、数字电视和计算机技术的快速进步, 图像、视频、声音、文本等多媒体数据的获取、处理、分析和展现技术也得到迅速发展, 多媒体系统的应用已渗透到人们生活的各个领域, 这在很大程度上方便了人们的生活, 也很大程度地改变了人们的工作、生活方式.特别是近年来, 监控视频、娱乐媒体、社交媒体、医学图像、消费者拍摄的图像/视频等多媒体数据量剧增, 已成为互联网大数据的主要数据形式.然而, 随着多媒体大数据的广泛应用, 多媒体信息处理不可避免地面临对象复杂性、数据规模化、应用需求多样化等挑战, 这已成为制约多媒体数据应用和发展的瓶颈.本专题选题为多媒体大数据处理与分析, 突出目前多媒体大数据处理和应用的热点技术, 包括多媒体大数据处理、分析、管理和应用等诸多方面的研究.
专题公开征文, 共征得投稿31篇.这31篇论文通过特约编辑形式审查均进入到评审阶段.上述稿件研究内容涉及多媒体大数据分析、管理和应用的方方面面, 特约编辑先后邀请了59位多媒体和大数据等相关领域的专家参与审稿工作, 每篇投稿邀请2位专家进行评审.稿件评审历经5个月, 经初审、复审、ChinaMM 2017会议宣读和终审4个阶段, 最终有15篇论文入选本专题.
(一)多媒体大数据的预处理是其广泛应用的前提.
多媒体大数据在收集、获取和存储的过程中, 极易受到噪声和样值缺失的影响而导致质量的下降.因此, 对所获取的多媒体大数据进行有效的预处理, 去除噪声、补全缺失的样值、提升分辨率, 从而提高数据质量, 是后续大数据分析与应用的基础.
《数据外补偿的深度网络超分辨率重建》注意到单张图像超分辨率重建受到多对一映射的困扰.对于给定的低分辨率图像块, 存在若干高分辨率图像块与之对应, 极易获得视觉模糊的超分辨率重建结果.为了克服歧义性造成的高频细节损失, 该文提出了基于深度网络, 利用在线检索的数据进行高频信息补偿的图像超分辨率重建算法.
《图神经网络回归的人脸超分辨率重建》注意到, 经典的超分辨率方法通常使用具有规则矩形结构的操作来提取图像中每个像素的局部模式, 忽略了相邻像素间在内容上的相关性.在对下采样倍数较大的结构化物体图像进行超分辨率时, 一般会生成严重影响视觉效果的伪影.针对人脸图像的局部结构一致性特点, 该文提出一种基于图结构的人脸超分辨率神经网络回归方法.
《基于深度反卷积神经网络的图像超分辨率算法》观察到, 现有基于卷积神经网络的方法直接利用传统网络模型, 未对图像超分辨率属于回归问题这一本质进行优化的问题, 提出了基于深度反卷积神经网络的图像超分辨率算法, 采用残差学习以降低网络复杂度, 同时避免了因网络过深导致的网络退化问题.
《基于密度差分的自动聚类算法》观察到实际应用中的数据集往往含有大量噪声数据, 而噪声和有用数据往往具有不同的密度, 有用数据拥有较大的密度值, 噪声数据则具有较小的密度值.利用此特点, 提出了一种基于密度差分的自动聚类算法, 实现了对含有噪声数据集的自动分类.
《多视角数据缺失补全》关注到在数据获取过程中, 由于收集的难度、高额成本或设备故障等问题, 往往导致收集到的多视角数据出现视角缺失, 这使得一些多视角学习方法无法有效进行.为此, 提出了一种基于视角相容性的多视角数据缺失补全方法, 并把所提出的视角补全方法拓展到解决含有噪声的多视角数据的降噪问题.
(二)多媒体大数据的质量评价及内容安全管理是其广泛应用的有效支撑.
海量的多媒体数据在传输、处理与存储过程中由于资源或人为原因均可能会对数据本身的质量和内容产生一定的影响或修改, 如何对所获取的多媒体数据进行质量评价及其内容的真实性进行判断, 是其进一步应用的有力保障.因此, 本专题针对图像质量评价、隐写分析、内容修改取证等进行了相关研究.
同态加密技术可用于保护数据隐私并允许对密文数据进行算术操作, 在云计算安全上有着很好的应用前景.《基于同态加密系统的图像鲁棒可逆水印算法》针对云计算中的隐私保护和数据安全等问题, 提出了一种基于同态加密系统的图像鲁棒可逆水印算法, 实现了在不对原始图像进行预处理的情况下直接在密文图像中嵌入水印, 并可分别在加密域或明文域提取水印和恢复原始密文图像或原始明文图像.
《无参考屏幕内容图像质量评价》观察到, 由于系统资源有限, 屏幕内容图像的分发和处理的各个环节都可能在屏幕内容图像中引入失真, 影响用户体验.因此, 在基于自然场景统计的无参考方法的启发下, 提出了针对屏幕内容图像的无参考评价算法.
现今主流的图像隐写分析方法主要聚焦于设计检测特征, 用以提高通用盲检测模型的检测准确率.这类检测方法与待测图像无关, 难以做到精准检测.《针对特定测试样本的隐写分析方法》针对隐写对图像特征的影响, 找出了隐写分析与图像特征之间的重要关系, 提出了一种为测试样本选择专用训练集的隐写分析方法.
《图像内容感知缩放的检测方法研究》观察到, 如今由相机拍摄的照片中都存在CFA特性, 若对这些照片做去马赛克处理, 则会改变图像像素间的相关性, 而内容感知缩放操作也会导致像素之间的相关性发生变化.因此, 该文提出了一种基于概率Map图统计特征的内容感知缩放检测算法.
(三)多媒体大数据的分析与应用得到了广泛关注.
多媒体大数据的分析和广泛应用给人们的生活和工作带来了很大的改变.因此, 对多媒体大数据进行高效率的深度分析, 将海量复杂的多媒体数据转化为具有明确语义的信息, 进而提取有用的知识, 已成为多媒体大数据分析领域的研究热点.本专题针对目标识别、跟踪、分类及情感识别等内容进行了相关研究.
《低秩重检测的多特征时空上下文的视觉跟踪》观察到时空上下文跟踪算法仅仅利用单一的灰度信息, 使得目标的表观表达缺乏判别性, 并且对于遮挡等问题造成的跟踪漂移后无法进行初始化.据此, 该文提出了一种基于低秩重检测的多特征时空上下文跟踪方法.
《面向大规模图像分类的深度卷积神经网络优化》考虑到深度卷积网络AlexNet在大规模图像分类任务中的优良性能和哈希算法在速度和存储方面的优势, 对AlexNet的网络框架和网络内部结构两个方面进行了优化和改进, 提出了一种基于深度卷积神经网络的深度学习框架.
《基于深度学习的图片中商品参数识别方法研究》观察到目前电商领域的飞速发展产生了大量包含商品参数的图片, 使用传统方法难以有效地提取出图片中的商品参数信息.针对这一问题, 提出了一种将深度学习检测算法与传统OCR技术相结合的方法, 在保证识别速度的同时提升了识别的精度.
云图的有效分割是高效的大气预测的基础, 然而空气中的尘埃、污染物及气溶胶粒子的存在严重影响了云图的分割性能.因此, 《局部聚类分析的FCN-CNN云图分割方法》提出了一种基于超像素分析的全卷积神经网路FCN和深度卷积神经网络CNN的云图分割方法.
《多文化场景下的多模态情感识别》考虑到自动情感识别广泛的应用价值, 针对不同模态和文化因素对情感识别的影响, 提出多模态特征融合和3种训练策略以提高不同模态和多文化条件下的情感识别性能.
《基于创意序列学习的艺术风格学习与绘制系统》考虑到现有艺术风格化方法由于存在人工干预特征选择和模型参数调整等局限、系统学习效率低、效果不理想和艺术风格统一度弱等问题, 基于序列任务学习理论, 提出一套智能艺术风格绘制的理论模型、设计方法以及优化方法.
本专题主要面向多媒体数据、模式识别、数据挖掘和人工智能等相关领域的从事大数据的研究人员, 反映了我国学者在多媒体大数据处理领域最新的研究进展.在此, 我们要特别感谢《软件学报》编委会和中国计算机学会及中国图像图形学学会多媒体专委会对专题工作的指导和帮助, 感谢编辑部和多媒体专委会的各位老师从征稿启示发布、审稿专家邀请至评审意见汇总、论文定稿、修改及出版所付出的辛勤工作和汗水, 感谢专题评审专家及时、耐心、细致的评审工作.此外, 我们还要感谢向本专题踊跃投稿的作者对《软件学报》的信任.
最后, 感谢专题的评审专家、编辑和读者们, 希望本专题能够对大数据相关领域的研究工作有所促进.