关键词能够反映出一份项目申请书的主要研究内容.统计了国家自然科学基金计算机图像与视频处理领域2014年~2018年申请与资助项目关键词,并分别从关键词标引量、关键词词频等方面进行分析,探讨其与资助率的关系.最后,运用定量的方法,透过热频关键词的内容变化,分析近5年来的计算机图像与视频处理领域的研究热点变化.
Keywords can reflect the main research content of a project application. In this study, the keywords of applications and grants of the National Natural Science Foundation of China in the field of computer image and video processing during 2014-2018 are firstly counted, and then they are analyzed from various perspectives, such as keyword quantity, keyword frequency, and the relationship between them and subsidizing rate. Lastly, the change of research hotspots in the field of computer image and video processing is also discussed based on the frequency of the keywords by using quantitative method.
国家自然科学基金申请书通常反映相关领域目前最新进展和成果.申请书一般都附有关键词, 这些关键词能够迅速、准确地反映出一份申请书的主题内容和重点, 也是函评阶段计算机辅助指派系统进行专家匹配的重要因素之一.对某个研究领域较长时间段的大量基金申请书进行关键词的词频和趋势规律分析, 有助于揭示本领域研究的热点、总体内容特征、内容之间的内在联系、学术研究的发展脉络与发展方向等[
近些年, 随着网络和存储技术的快速发展, 多媒体数据量呈爆炸式增长, 图像和视频数据的研究已成为计算机应用领域研究的热点.2019年, 国家自然科学基金委员会信息科学部明确将“社交媒体大数据分析与处理”作为优先支持的研究领域之一[
在进行项目申报时, 国家自然科学基金委员会要求每个项目标引5个以内(含5个)的关键词.我们统计了2014年~2018年计算机图像与视频处理领域的项目申请量及其标引的关键词数量(本文统计的关键词数量包含了重复出现的关键词)、项目资助量及其标引的关键词数量, 见
2014年~2018年计算机图像与视频处理领域的项目数量和关键词数量
Number of projects and keywords in the field of computer image andvideo processing from 2014 to 2018
年份 | 申请项目 | 资助项目 | |||
项目数量 | 关键词数量 | 项目数量 | 关键词数量 | ||
2014 | 452 | 1 958 | 137 | 596 | |
2015 | 503 | 2 174 | 122 | 529 | |
2016 | 496 | 2 175 | 131 | 575 | |
2017 | 533 | 2 354 | 145 | 641 | |
2018 | 461 | 2 025 | 111 | 503 | |
共计 |
根据
同时, 我们还统计了计算机图像与视频处理领域关键词标引量(关键词标引量:申请书中所标注的关键词的个数)及其对应的项目申请量, 如
关键词标引量及其项目申请量
Number of keywords and corresponding project application
由
此外, 笔者还统计了计算机图像与视频处理领域关键词标引量及其对应的项目资助占比, 如
关键词标引量及其项目资助占比
Number of keywords and corresponding project funding rate
由
(1) 大多数获资助项目的关键词标引量集中在4~5个, 其中, 标注4个和5个关键词的项目共计544项, 占项目总数的84.21%;标引5个关键词的项目资助占比最高, 相对于同为5个关键词的项目申请占比(56.32%)高2.5%;
(2) 结合
以上分析表明, 获资助申请书其关键词标引量绝大多数在4个或以上, 当申请书的关键词标引量为5时, 获资助比例较高.
词频用于定义关键词在某一研究领域中出现的频次高低[
2014年~2018年计算机图像与视频处理领域项目关键词词频TOP10
Top 10 keyword frequency in the field of computer image andvideo processing from 2014 to 2018
排序 | 资助项目 | 申请项目 | |||
关键词 | 词频 | 关键词 | 词频 | ||
1 | 深度学习 | 92 | 深度学习 | 253 | |
2 | 特征提取 | 47 | 特征提取 | 188 | |
3 | 图像理解 | 38 | 目标跟踪 | 138 | |
4 | 目标跟踪 | 36 | 目标检测 | 122 | |
5 | 稀疏表示 | 30 | 图像分割 | 112 | |
6 | 图像识别 | 30 | 图像识别 | 108 | |
7 | 图像分割 | 26 | 图像理解 | 108 | |
8 | 目标检测 | 24 | 稀疏表示 | 103 | |
9 | 计算机视觉 | 23 | 计算机视觉 | 81 | |
10 | 压缩感知 | 17 | 图像检索 | 65 |
由
(1) 从关键词反映出的申请项目的研究热点与专家的认可度基本一致, 例如:申请项目和资助项目词频排序在前2位的均依次为“深度学习”和“特征提取”.然而, 两者其他关键词的研究热度和专家认可度并不一致, 如“图像理解”在资助项目的关键词词频排序中列第3位, 而在申请项目的关键词词频排序中列第7位;
(2) 高频词确实反映了计算机图像与视频处理领域的热点:a)随着AlphaGo战胜人类围棋世界冠军, 人工智能迎来第三次热潮, 深度学习成为本领域备受关注的研究内容, 这在
我们对计算机图像与视频处理领域的项目出现频次较高的关键词的资助率进行统计, 并将统计结果按照资助项目的关键词词频高低进行排序,
2014年~2018年计算机图像与视频处理领域的项目关键词词频与关键词的资助率
Keyword frequency and project funding rate in the field of computer image andvideo processing from 2014 to 2018
关键词 | 资助项目 | 申请项目 | 关键词的资助率 |
||||
词频 | 排序 | 词频 | 排序 | ||||
注:关键词的资助率=(关键词在资助项目中出现的频次/关键词在申请项目中出现的频次)×100 | |||||||
深度学习 | 92 | 1 | 253 | 1 | 36.36 | ||
特征提取 | 47 | 2 | 188 | 2 | 25 | ||
图像理解 | 38 | 3 | 108 | 7 | 35.19 | ||
目标跟踪 | 36 | 4 | 138 | 3 | 26.09 | ||
稀疏表示 | 30 | 5 | 103 | 8 | 29.13 | ||
图像识别 | 30 | 6 | 108 | 6 | 27.78 | ||
图像分割 | 26 | 7 | 112 | 5 | 23.21 | ||
目标检测 | 24 | 8 | 122 | 4 | 19.67 | ||
计算机视觉 | 23 | 9 | 81 | 9 | 28.4 | ||
压缩感知 | 17 | 10 | 55 | 13 | 30.91 |
从
(1) 词频高的项目, 其资助率不一定高.例如:“图像理解”在资助项目的关键词词频排序中列第3位, 在申请项目的词频排序中列第7位, 其资助率较高; “目标检测”在资助项目的关键词词频排序中列第8位, 在申请项目的关键词词频排序中列第4位, 其资助率较低;
(2) 涉及“深度学习”和“图像理解”的项目相对容易得到同行专家的认可.
词频分析法是利用词频来确定该领域研究热点和发展动向的计量学方法[
2014年~2018年计算机图像与视频处理领域项目关键词TOP10逐年统计
Top 10 annual keyword frequency of the field ofcomputer image and video processing from 2014 to 2018
2014年 | 排序 | 资助 | 申请 |
1 | 计算机视觉 | 计算机视觉 | |
2 | 稀疏表示 | 特征提取 | |
3 | 特征提取 | 图像分割 | |
4 | 视频分析 | 稀疏表示 | |
5 | 图像分析 | 数字图像处理 | |
6 | 图像分割 | 图像分析 | |
7 | 视频编码 | 目标跟踪 | |
8 | 深度学习 | 视频分析 | |
9 | 三维重建 | 视频编码 | |
10 | 目标跟踪 | 图像识别 | |
2015年 | 排序 | 资助 | 申请 |
1 | 深度学习 | 深度学习 | |
2 | 图像理解 | 目标跟踪 | |
3 | 特征提取 | 特征提取 | |
4 | 目标跟踪 | 图像分割 | |
5 | 图像分割 | 目标检测 | |
6 | 稀疏表示 | 稀疏表示 | |
7 | 视频压缩 | 行为识别 | |
8 | 图像处理 | 图像检索 | |
9 | 图像融合 | 图像理解 | |
10 | 图像识别 | 图像识别 | |
2016年 | 排序 | 资助 | 申请 |
1 | 深度学习 | 深度学习 | |
2 | 图像理解 | 特征提取 | |
3 | 特征提取 | 目标跟踪 | |
4 | 目标跟踪 | 图像理解 | |
5 | 图像重构 | 目标检测 | |
6 | 压缩感知 | 图像分割 | |
7 | 图像分割 | 图像识别 | |
8 | 特征描述 | 图像去噪 | |
9 | 视频压缩 | 特征描述 | |
10 | 图像去噪 | 压缩感知 | |
2017年 | 排序 | 资助 | 申请 |
1 | 深度学习 | 深度学习 | |
2 | 图像识别 | 图像理解 | |
3 | 图像理解 | 目标检测 | |
4 | 目标跟踪 | 图像识别 | |
5 | 目标检测 | 特征提取 | |
6 | 特征提取 | 目标跟踪 | |
7 | 稀疏表示 | 卷积神经网络 | |
8 | 迁移学习 | 图像分割 | |
9 | 行为识别 | 稀疏表示 | |
10 | 图像检索 | 图像融合 | |
2018年 | 排序 | 资助 | 申请 |
1 | 深度学习 | 深度学习 | |
2 | 特征提取 | 特征提取 | |
3 | 卷积神经网络 | 图像理解 | |
4 | 目标跟踪 | 目标跟踪 | |
5 | 图像理解 | 图像识别 | |
6 | 图像特征 | 目标检测 | |
7 | 生成对抗网络 | 卷积神经网络 | |
8 | 图像分割 | 图像特征 | |
9 | 视频压缩 | 稀疏表示 | |
10 | 图像分辨率增强 | 特征描述 |
(1) 对于词频最高的关键词, 申请项目和资助项目两者完全匹配.例如:2014年, 申请项目和资助项目词频最高的关键词均为“计算机视觉”; 2015年~2018年, 关键词“深度学习”的词频排序持续保持第一.目前, 深度学习发展迅速, 其研究价值和潜力正不断地被挖掘, 在图像检索、语音识别、人脸识别、机器翻译等领域均取得了突出的应用效果;
(2) 对于其他关键词, 申请项目和资助项目两者的词频排序基本不匹配, 具体表现在同一关键词不仅在同一年度的申请和资助的词频排序各不相同, 而且不同年份的词频排序变化波动也较为明显.以“图像检索”关键词为例,
关键词图像检索在2014年~2018各年度的词频排序变化
Change of Word Frequency Ranking towards Image Retrieval from 2014 to 2018
本文从申请项目和资助项目两个方面, 对2014年~2018年计算机图像与视频处理领域的关键词进行统计, 分别对关键词的标引量和词频进行分析, 并探讨了它们与资助率的关系, 最后, 透过热频关键词的变化分析了计算机图像与视频处理领域研究热点的变化.可以看出, “深度学习”在计算机图像与视频处理领域已持续成为大家关注和感兴趣的研究课题.
感谢国家自然科学基金委科学传播中心徐卫国老师在论文撰写和修改过程中给予的悉心指导和帮助.
Li WL, Yang ZG. Analysis on frequencies of keywords in Chinese information science journals papers. Information Science, 2005, 23(1):68-70, 143(in Chinese with English abstract).
李文兰, 杨祖国.中国情报学期刊论文关键词词频分析.情报科学, 2005, 23(1):68-70, 143.
Deng F, Song S, Liu K, Wu GZ, Fu J. Data and research hotspot analyses of national natural science foundation of china in automation field. Acta Automatica Sinica, 2018, 44(2):377-384(in Chinese with English abstract).
邓方, 宋苏, 刘克, 吴国政, 付俊.国家自然科学基金自动化领域数据分析与研究热点变化.自动化学报, 2018, 44(2):377-384.
National Natural Science Foundation of China. National Natural Science Fund Guide to Programs 2019. Beijing:Science Press, 2019(in Chinese).
国家自然科学基金委员会.2019年度国家自然科学基金项目指南.北京:科学出版社, 2019.
Ma FC, Zhang Q. Comparative analysis of knowledge management literature between China and overseas:A bibliometric analysis. Journal of the CHINA Society for Scientific and Technical Information, 2006, 25(2):163-171(in Chinese with English abstract).
马费成, 张勤.国内外知识管理研究热点——基于词频的统计分析.情报学报, 2006, 25(2):163-171.