基于全局和局部信息的视频记忆度预测

doi:10.13328/j.cnki.jos.005935

微信服务号

微信订阅号

2025年7月21日 22:07 星期一

首页 > 过刊浏览>2020年第31卷第7期 >1969-1979. DOI:10.13328/j.cnki.jos.005935

PDF HTML阅读 XML下载导出引用引用提醒

基于全局和局部信息的视频记忆度预测
DOI:
                        10.13328/j.cnki.jos.005935
                    
CSTR:
                        
                    
作者:
                        王帅王帅
中国人民大学 信息学院, 北京 100872
在期刊界中查找
在百度中查找
在本站中查找
王维莹王维莹
中国人民大学 信息学院, 北京 100872
在期刊界中查找
在百度中查找
在本站中查找
陈师哲陈师哲
中国人民大学 信息学院, 北京 100872
在期刊界中查找
在百度中查找
在本站中查找
金琴金琴
中国人民大学 信息学院, 北京 100872
在期刊界中查找
在百度中查找
在本站中查找

                    
作者单位:
作者简介:王帅(1993-),男,学士,CCF学生会员,主要研究领域为情感计算;陈师哲(1994-),女,学士,CCF学生会员,主要研究领域为多模态内容理解;王维莹(1996-),女,学士,主要研究领域为多媒体计算;金琴(1972-),女,博士,副教授,博士生导师,CCF专业会员,主要研究领域为多媒体语义理解,情感计算.
通讯作者:金琴,E-mail:qjin@ruc.edu.cn
中图分类号:
基金项目:国家自然科学基金（61772535）；北京市自然科学基金（4192028）；国家重点研发计划（2016YFB1001202）

Video Memorability Prediction Based on Global and Local Information

Author:

WANG Shuai
WANG Shuai
School of Information, Renmin University of China, Beijing 100872, China
在期刊界中查找
在百度中查找
在本站中查找
WANG Wei-Ying
WANG Wei-Ying
School of Information, Renmin University of China, Beijing 100872, China
在期刊界中查找
在百度中查找
在本站中查找
CHEN Shi-Zhe
CHEN Shi-Zhe
School of Information, Renmin University of China, Beijing 100872, China
在期刊界中查找
在百度中查找
在本站中查找
JIN Qin
JIN Qin
School of Information, Renmin University of China, Beijing 100872, China
在期刊界中查找
在百度中查找
在本站中查找

Affiliation:

Fund Project:

National Natural Science Foundation of China (61772535); Beijing Natural Science Foundation (4192028); National Key Research and Development Plan,China (2016YFB1001202)

摘要

图/表

访问统计

参考文献

相似文献

引证文献

资源附件

文章评论

摘要:

视频的记忆度是一种度量指标，用来表示一段视频能够普遍被人记住的程度.令人记忆深刻而难忘的视频具有很大的潜在价值，因此对能够进行大规模视频记忆度自动预测的模型将会有广大的应用前景和市场，例如视频检索、数字内容推荐、广告设计、教育系统等等.现有的大部分工作都是直接利用深度神经网络学习到的一个全局表示来进行记忆度的预测，没有给予局部细节足够的重视.提出了一个基于全局和局部信息的视频记忆度预测模型，其中，包含3个模块：全局性的上下文表示模块、空间布局表示模块和局部的物体注意力模块.在实验结果中，全局性的上下文表示模块和局部的物体注意力模块分别具有很好的表现.而空间布局表示模块的预测能力虽不如其他两个模块，但3个模块的融合使结果有了进一步的提升.最后，在MediaEval 2018 Media Memorability Prediction Task的数据集上证明了模型的有效性.

关键词:视频记忆度;注意力机制;物体检测;神经网络

Abstract:

Memorability of a video is a metric to describe that how memorable the video is. Memorable videos contain huge values and automatically predicting the memorability of large numbers of videos can be applied in various applications including digital content recommendation, advertisement design, education system, and so on. This study proposes a global and local information based framework to predict video memorability. The framework consists of three components, namely global context representation, spatial layout, and local object attention. The experimental results of the global context representation and local object attention are remarkable, and the spatial layout also contributes a lot to the prediction. Finally, the proposedmodel improves the performances of thebaseline of MediaEval 2018 Media Memorability Prediction Task.

Key words:video memorability;attention;object detection;neural network

引用本文

王帅,王维莹,陈师哲,金琴.基于全局和局部信息的视频记忆度预测.软件学报,2020,31(7):1969-1979

复制

文章指标

点击次数:
下载次数:
HTML阅读次数:
引用次数:

历史

收稿日期:2019-06-07
最后修改日期:2019-07-11
录用日期:
在线发布日期: 2020-01-17
出版日期: 2020-07-06

微信服务号

微信订阅号

引用本文

相关视频

分享

文章指标

历史

文章二维码

微信服务号

微信订阅号

引用本文

相关视频

分享

微信扫一扫：分享

文章指标

历史

文章二维码