注意力引导的标志检测与识别
CSTR:
作者:
作者单位:

作者简介:

张冬明(1977-), 男, 博士, 研究员, 博士生导师, CCF专业会员, 主要研究领域为人工智能, 多媒体内容检索, 视频编码. ;靳国庆(1988-), 男, 博士, 副研究员, 主要研究领域为视频编码, 多媒体内容检索. ;鲁鼎煜(1999-), 男, 硕士生, 主要研究领域为人工智能, 视频处理, 人脸伪造检测. ;张菁(1975-), 女, 博士, 教授, 博士生导师, CCF专业会员, 主要研究领域为多媒体内容分析与处理. ;张勇东(1973-), 男, 博士, 教授, 博士生导师, CCF高级会员, 主要研究领域为网络安全, 多媒体内容分析与处理.

通讯作者:

靳国庆, E-mail: jinguoqing@people.cn

中图分类号:

TP391

基金项目:

国家重点研发计划(2021YFF0901600); 国家自然科学基金(61672495, 61971016); 北京市自然科学基金-市教委联合资助项目(KZ201910005007)


Attention Guided Logo Detection and Recognition
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    自然场景中的实体标志, 如商标、交通标志等, 易受拍摄角度、所依附物体形变、尺度变化等影响, 导致检测精度降低. 为此, 提出一种注意力引导的标志检测与识别网络(attention guided logo detection and recognition network, AGLDN), 联合优化模型对多尺度变化和复杂形变的鲁棒性. 首先通过标志模板图像搜集及掩码生成、标志背景图像选取和标志图像生成创建标志合成数据集; 然后基于RetinaNet和FPN提取多尺度特征并形成高级语义特征映射; 最后利用注意力机制引导网络关注标志区域, 克服目标变形对特征鲁棒性的影响, 实现标志检测与识别. 实验结果表明, 所提方法可以有效降低尺度变化、非刚性形变的影响, 提高标志检测准确率.

    Abstract:

    In natural scenes, logos such as trademarks and traffic signs are susceptible to shooting angle, carrier deformation, and scale changes, which reduces logo detection accuracy. Thus, this study proposes an attention guided logo detection and recognition network (AGLDN) to jointly optimize the model robustness for multi-scale and complex deformation. First, a logo synthesis dataset is established by image collection and mask generation of logo templates, image selection of logo background, and logo image generation. Then, based on RetinaNet and FPN, multi-scale features are extracted and high-level semantic feature mapping is formed. Finally, the attention mechanism guided network is employed to focus on the logo area, and the influence of logo deformation on feature robustness is suppressed to improve logo detection and recognition. Experimental results show that the proposed method can reduce the influence of scale changes and non-rigid deformation, and improve detection accuracy.

    参考文献
    相似文献
    引证文献
引用本文

张冬明,靳国庆,鲁鼎煜,张菁,张勇东.注意力引导的标志检测与识别.软件学报,2024,35(11):5116-5132

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2022-11-21
  • 最后修改日期:2023-03-16
  • 录用日期:
  • 在线发布日期: 2023-12-06
  • 出版日期:
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号