显著性引导及不确定性监督的深度编解码网络
作者:
作者单位:

作者简介:

王雪(1982-), 女, 博士生, 主要研究领域为计算机视觉, 图像处理, 多媒体融合;李占山(1966-), 男, 博士, 教授, CCF专业会员, 主要研究领域为约束优化与约束求解, 机器学习, 图像处理;陈海鹏(1978-), 男, 博士, 教授, CCF专业会员, 主要研究领域为机器学习, 视觉推理

通讯作者:

陈海鹏, E-mail: chenhp@jlu.edu.cn

中图分类号:

TP18

基金项目:

国家重点研发计划(2018YFB0804202, 2018YFB0804203); 国家自然科学基金区域联合基金(U19A2057); 国家自然科学基金面上项目(61876070); 吉林省科技发展计划(20190303134SF)


Deep Encoder-decoder Network with Saliency Guidance and Uncertainty Supervision
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    基于U-Net的编码-解码网络及其变体网络在医学图像语义分割任务中取得了卓越的分割性能. 然而, 网络在特征提取过程中丢失了部分空间细节信息, 影响了分割精度. 另一方面, 在多模态的医学图像语义分割任务中, 这些模型的泛化能力和鲁棒性不理想. 针对以上问题, 提出一种显著性引导及不确定性监督的深度卷积编解码网络, 以解决多模态医学图像语义分割问题. 该算法将初始生成的显著图和不确定概率图作为监督信息来优化语义分割网络的参数. 首先, 通过显著性检测网络生成显著图, 初步定位图像中的目标区域; 然后, 根据显著图计算不确定分类的像素点集合, 生成不确定概率图; 最后, 将显著图和不确定概率图与原图像一同送入多尺度特征融合网络, 引导网络关注目标区域特征的学习, 同时增强网络对不确定分类区域和复杂边界的表征能力, 以提升网络的分割性能. 实验结果表明, 所提算法能够捕获更多的语义信息, 在多模态医学图像语义分割任务中优于其他的语义分割算法, 并具有较好的泛化能力和鲁棒性.

    Abstract:

    The encoder-decoder network based on U-Net and its variants have achieved excellent performance in semantic segmentation of medical images. However, some spatial details are lost during feature extraction, which affects the accuracy of segmentation, and the generalization ability and robustness of these models are unsatisfactory. Therefore, this study proposes a deep convolutional encoder-decoder network with saliency guidance and uncertainty supervision to solve the semantic segmentation problem in multimodal medical images. In this method, the initially generated saliency map and the uncertainty probability map are used as the supervised information to optimize the parameters of the semantic segmentation network. Specifically, the saliency map is generated by the saliency detection network to preliminarily locate the target region in an image, and on this basis, the set of pixel points with uncertain classification is calculated to generate the uncertainty probability map. Then, the two maps are sent into the multi-scale feature fusion network together with the original image to guide the network to focus on the learning of the features in the target region and to enhance the representational capacity of regions with uncertain classification and complex boundaries. In this way, the segmentation performance of the network can be improved. The experimental results reveal that the proposed method can capture more semantic information and outperforms existing semantic segmentation methods in semantic segmentation of multimodal medical images, with strong generalization capability and robustness.

    参考文献
    相似文献
    引证文献
引用本文

王雪,李占山,陈海鹏.显著性引导及不确定性监督的深度编解码网络.软件学报,2022,33(9):3165-3179

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-06-30
  • 最后修改日期:2021-08-15
  • 录用日期:
  • 在线发布日期: 2022-02-22
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号