主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
庄凌,庄越挺,吴江琴,叶振超,吴飞.一种基于稀疏典型性相关分析的图像检索方法.软件学报,2012,23(5):1295-1304
一种基于稀疏典型性相关分析的图像检索方法
Image Retrieval Approach Based on Sparse Canonical Correlation Analysis
投稿时间:2010-10-11  修订日期:2011-04-02
DOI:10.3724/SP.J.1001.2012.04032
中文关键词:  图像检索  文本  语义  稀疏典型性相关分析  视觉单词
英文关键词:image retrieval  text  semantics  sparse canonical correlation analysis  visual word
基金项目:国家自然科学基金(90920303, 61070068); 中央高校基本科研业务费专项资金(KYJD09015)
作者单位E-mail
庄凌 浙江大学 计算机科学与技术学院,浙江 杭州 310027 zhuangling2000@yahoo.com.cn 
庄越挺 浙江大学 计算机科学与技术学院,浙江 杭州 310027  
吴江琴 浙江大学 计算机科学与技术学院,浙江 杭州 310027  
叶振超 浙江大学 计算机科学与技术学院,浙江 杭州 310027  
吴飞 浙江大学 计算机科学与技术学院,浙江 杭州 310027  
摘要点击次数: 3696
全文下载次数: 5224
中文摘要:
      图像语义检索的一个关键问题就是要找到图像底层特征与语义之间的关联,由于文本是表达语义的一种有效手段,因此提出通过研究文本与图像两种模态之间关系来构建反映两者间潜在语义关联的有效模型的思路.基于该模型,可使用自然语言形式(文本语句)来表达检索意图,最终检索到相关图像.该模型基于稀疏典型性相关分析(sparse canonical correlation analysis,简称sparse CCA),按照如下步骤训练得到:首先利用隐语义分析方法构造文本语义空间,然后以视觉词袋(bag of visual words)来表达文本所对应的图像,最后通过Sparse CCA 算法找到一个语义相关空间,以实现文本语义与图像视觉单词间的映射.使用稀疏的相关性分析方法可以提高模型可解释性和保证检索结果稳定性.实验结果验证了Sparse CCA 方法的有效性,同时也证实了所提出的图像语义检索方法的可行性.
英文摘要:
      A key issue of semantic-based image retrieval is how to bridge the semantic gap between the low-level feature of image and high-level semantics, which can be expressed by means of free text effectively. The cross-modal relationship between the text and image is studied by a modeling semantic correlation between text and image. Based on the model, an approach to image retrieval is proposed so that images are retrieved according to meaning of the query text rather than query keywords. First, an algorithm for solving sparse canonical correlation analysis (CCA) is designed in this paper. Then a semantic space is learned by way of latent semantic analysis from text corpus, and images are represented by bag of visual words. After that, a semantic correlation space, by which the map between visual words of image and the high-level semantics is made explicit, can be constructed. The proposed method solves CCA in a sparse framework in order to make the result more interpretable and stable. The experimental result demonstrates that Sparse CCA outperform CCA in the context, and also substantiates the feasibility of the proposed approach to image retrieval.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利