基于深度学习的自然场景文本检测与识别综述
作者:
作者单位:

作者简介:

王建新(1972-),男,山东青岛人,博士,教授,博士生导师,主要研究领域为数据挖掘;王子亚(1992-),男,硕士生,CCF学生会员,主要研究领域为数据挖掘和机器学习;田萱(1976-),女,博士,副教授,CCF高级会员,主要研究领域为数据挖掘与智能信息处理.

通讯作者:

田萱,E-mail:tianxuan@bjfu.edu.cn

基金项目:

国家重点研发计划(2018YFC1603302,2018YFC1603305)


Review of Natural Scene Text Detection and Recognition Based on Deep Learning
Author:
Affiliation:

Fund Project:

National Key Research and Development Program of China (2018YFC1603302, 2018YFC1603305)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别的相关研究背景及主要技术研究路线;然后,根据自然场景文本信息处理的不同阶段,进一步介绍文本检测模型、文本识别模型和端到端的文本识别模型,并阐述和分析每类模型方法的基本思路和优缺点;另外,列举了常见公共标准数据集以及性能评估指标和方法,并对不同模型相关实验结果进行了对比分析;最后总结基于深度学习的自然场景文本检测与识别技术面临的挑战和发展趋势.

    Abstract:

    Natural scene text detection and recognition is important for obtaining information from scenes, and it can be improved by the help of deep learning. In this study, the deep learning-based methods of text detection and recognition in natural scenes are classified, analyzed, and summarized. Firstly, the research background of natural scene text detection and recognition and the main technical research routes are discussed. Then, according to different processing phases of natural scene text information processing, the text detection model, text recognition model and end-to-end text recognition model are further introduced, in which the basic ideas, advantages, and disadvantages of each method are also discussed and analyzed. Furthermore, the common standard datasets and performance evaluation indicators and functions are enumerated, and the experimental results of different models are compared and analyzed. Finally, the challenge and development trends of deep learning-based text detection and recognition in natural scenes are summarized.

    参考文献
    相似文献
    引证文献
引用本文

王建新,王子亚,田萱.基于深度学习的自然场景文本检测与识别综述.软件学报,2020,31(5):1465-1496

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2019-06-09
  • 最后修改日期:2019-11-08
  • 录用日期:
  • 在线发布日期: 2020-04-09
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号