捕获局部语义结构和实例辨别的无监督哈希
作者:
作者单位:

作者简介:

李长升(1985-),男,博士,教授,博士生导师,主要研究领域为机器学习.
闵齐星(1996-),女,学士,主要研究领域为视频行为分析.
成雨蓉(1989-),女,博士,副教授,博士生导师,CCF专业会员,主要研究领域为数据库.
袁野(1981-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为数据库.
王国仁(1966-),男,博士,教授,博士生导师,CCF杰出会员,主要研究领域为数据库.

通讯作者:

李长升,E-mail:changshengli507@163.com

中图分类号:

基金项目:

国家自然科学基金(61806044,U2001211,61932004,61732003);北京理工大学青年教师学术启动计划(3070012222010)


Local Semantic Structure Captured and Instance Discriminated by Unsupervised Hashing
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61806044, U2001211, 61932004,61732003); Beijing Institute of Technology Research Fund Program for Young Scholars (3070012222010)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    由于具有低存储成本、高效检索、低标注成本等方面的优势,无监督的哈希技术已经引起了学术界越来越多的关注,并且已经广泛地应用到大规模数据库检索问题中.先前的无监督方法大部分依靠数据集本身的语义结构作为指导信息,要求在哈希空间中,数据的语义信息能够得到保持,从而完成哈希编码的学习.因此,如何精确地表示语义结构以及哈希编码成为了无监督哈希方法成功的关键.提出一种新的基于自监督学习的策略进行无监督哈希编码学习.具体来讲,首先利用对比学习在目标数据集上对网络进行学习,从而能够构建准确的语义相似性结构;接着,提出一个新的目标损失函数,期望在哈希空间中,数据的局部语义相似性结构能够得到保持,同时,哈希编码的辨识力能够得到提升,提出的网络框架是端到端可训练的;最后,提出的算法在两个大规模图像检索数据集上进行了测试,大量的实验验证了所提出算法的有效性.

    Abstract:

    Recently, unsupervised Hashing has attracted much attention in the machine learning and information retrieval communities, due to its low storage and high search efficiency. Most of existing unsupervised Hashing methods rely on the local semantic structure of the data as the guiding information, requiring to preserve such semantic structure in the Hamming space. Thus, how to precisely represent the local structure of the data and Hashing code becomes the key point to success. This study proposes a novel Hashing method based on self-supervised learning. Specifically, it is proposed to utilize the contrast learning to acquire a compact and accurate feature representation for each sample, and then a semantic structure matrix can be constructed for representing the similarity between samples. Meanwhile, a new loss function is proposed to preserve the semantic information and improve the discriminative ability in the Hamming space, by the spirit of the instance discrimination method proposed recently. The proposed framework is end-to-end trainable. Extensive experiments on two large-scale image retrieval datasets show that the proposed method can significantly outperform current state-of-the-art methods.

    参考文献
    相似文献
    引证文献
引用本文

李长升,闵齐星,成雨蓉,袁野,王国仁.捕获局部语义结构和实例辨别的无监督哈希.软件学报,2021,32(3):742-752

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-07-20
  • 最后修改日期:2020-09-03
  • 录用日期:
  • 在线发布日期: 2021-01-21
  • 出版日期: 2021-03-06
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号