主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
张博,郝杰,马刚,史忠植.基于弱匹配概率典型相关性分析的图像自动标注.软件学报,2017,28(2):292-309
基于弱匹配概率典型相关性分析的图像自动标注
Automatic Image Annotation Based on Semi-Paired Probabilistic Canonical Correlation Analysis
投稿时间:2014-12-18  修订日期:2015-09-10
DOI:10.13328/j.cnki.jos.005047
中文关键词:  典型相关性分析  概率典型相关性分析  弱匹配典型相关性分析  图像自动标注
英文关键词:canonical correlation analysis  probabilistic canonical correlation analysis  semi-paired canonical correlation analysis  automatic image annotation
基金项目:国家重点基础研究发展计划(973)(2013CB329502);国家自然科学基金(61035003);国家高技术研究发展计划(863)(2012AA011003);国家科技支撑计划(2012BA107B02);江苏省自然科学基金(BK20160276)
作者单位E-mail
张博 中国矿业大学 计算机科学与技术学院, 江苏 徐州 221116  
郝杰 徐州医科大学 医学信息学院, 江苏 徐州 221004 haojie@xzmc.edu.cn 
马刚 中国科学院 计算技术研究所 智能信息处理重点实验室, 北京 100190
中国科学院大学, 北京 100049 
 
史忠植 中国科学院 计算技术研究所 智能信息处理重点实验室, 北京 100190  
摘要点击次数: 965
全文下载次数: 888
中文摘要:
      针对弱匹配多模态数据的相关性建模问题,提出了一种弱匹配概率典型相关性分析模型(semi-paired probabilistic CCA,简称SemiPCCA).SemiPCCA模型关注于各模态内部的全局结构,模型参数的估计受到了未匹配样本的影响,而未匹配样本则揭示了各模态样本空间的全局结构.在人工弱匹配多模态数据集上的实验结果表明,SemiPCCA可以有效地解决传统CCA(canonical correlation analysis)和PCCA(probabilistic CCA)在匹配样本不足的情况下出现的过拟合问题,取得了较好的效果.提出了一种基于SemiPCCA的图像自动标注方法.该方法基于关联建模的思想,同时使用标注图像及其关键词和未标注图像学习视觉模态和文本模态之间的关联,从而能够更准确地对未知图像进行标注.
英文摘要:
      Canonical correlation analysis (CCA) is a statistical analysis tool for analyzing the correlation between two sets of random variables. CCA requires the data be rigorously paired or one-to-one correspondence among different views due to its correlation definition. However, such requirement is usually not satisfied in real-world applications due to various reasons. Often, only a few paired and a lot of unpaired multi-view data are given, because unpaired multi-view data are relatively easier to be collected and pairing them is difficult, time consuming and even expensive. Such data is referred as semi-paired multi-view data. When facing semi-paired multi-view data, CCA usually performs poorly. To tackle this problem, a semi-paired variant of CCA, named SemiPCCA, is proposed based on the probabilistic model for CCA. The actual meaning of "semi-" in SemiPCCA is "semi-paired" rather than "semi-supervised" as in popular semi-supervised learning literature. The estimation of SemiPCCA model parameters is affected by the unpaired multi-view data which reveal the global structure within each modality. By using artificially generated semi-paired multi-view data sets, the experiment shows that SemiPCCA effectively overcome the over-fitting problem of traditional CCA and PCCA (probabilistic CCA) under the condition of insufficient paired multi-view data and performs better than the original CCA and PCCA. In addition, an automatic image annotation method based on the SemiPCCA is presented. Through estimating the relevance between images and words by using the labelled and unlabeled images together, this method is shown to be more accurate than previous published methods.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利