查 询 高级检索+
共找到相关记录9条
    全 选
    显示方式:|
    • 视觉注意力检测综述

      2019, 30(2):416-439.DOI: 10.13328/j.cnki.jos.005636

      关键词:视觉注意力视觉显著性人眼关注点预测显著物体检测
      摘要 (4994)HTML (5677)PDF 2.65 M (16228)收藏

      摘要:人类能够迅速地选取视野中的关键部分,选择性地将视觉处理资源分配给这些视觉显著的区域.在计算机视觉领域,理解和模拟人类视觉系统的这种注意力机制,得到了学界的大力关注,并显示出了广阔的应用前景.近年来,随着计算能力的增强以及大规模显著性检测数据集的建立,深度学习技术逐渐成为视觉注意力机制计算和建模的主要手段.综述了视觉注意力检测的最新研究进展,包括人眼关注点检测和显著物体检测,并讨论了当前流行的视觉显著性检测数据集和常用的评估指标.对基于深度学习的工作进行了综述,也对之前代表性的非深度学习模型进行了讨论,同时,对这些模型在不同的数据集上的性能进行了详细评估.最后探讨了该领域的研究趋势和未来的发展方向.

    • 一种视觉词软直方图的图像表示方法

      2012, 23(7):1787-1795.DOI: 10.3724/SP.J.1001.2012.04082

      关键词:视觉词软直方图图像表示高斯混合模型判别学习
      摘要 (4082)HTML (0)PDF 602.71 K (6695)收藏

      摘要:基于视觉词的统计建模和判别学习,提出一种视觉词软直方图的图像表示方法.假设属于同一视觉词的图像局部特征服从高斯混合分布,利用最大-最小后验伪概率判别学习方法从样本中估计该分布,计算局部特征与视觉词的相似度.累加图像中每个视觉词与对应局部特征的相似度,在全部视觉词集合上进行结果的归一化,得到图像的视觉词软直方图.讨论了两种具体实现方法:一种是基于分类的软直方图方法,该方法根据相似度最大原则建立局部特征与视觉词的对应关系;另一种是完全软直方图方法,该方法将每个局部特征匹配到所有视觉词.在数据库Caltech-4和PASCAL VOC 2006上的实验结果表明,该方法是有效的.

    • 一种心脏核磁共振图像左室壁内、外膜分割方法

      2009, 20(5):1176-1184.

      关键词:心脏核磁共振图像图像分割Snake模型卷积虚拟静电场形状约束
      摘要 (7757)HTML (0)PDF 1003.87 K (9534)收藏

      摘要:为了充分利用心脏核磁共振图像(magnetic resonance image,简称MRI)中关于左心室的解剖和功能信息,必须先分割左室壁内、外膜.提出一种基于Snake模型的左室壁内、外膜分割方法.首先提出了Snake模型的卷积虚拟静电场外力模型CONVEF(convolutional virtual electric field),该外力场捕捉范围大、抗噪能力强、在C形凹陷区域等问题上性能突出,而且基于卷积运算,采用快速Fourier变换可以实时计算.就左室壁内膜的分割而言,考虑到左室壁的形状近似为圆形,引入基于圆形约束的能量项.对于左室壁外膜的分割,充分挖掘了左室壁内、外膜形状上的相似性和位置上的相关性,构造了形状相似性内能和一个新的边缘图,该边缘图用来计算新的外力场.基于所有这些策略并采用内膜的分割结果初始化,可以自动、准确地分割外膜.通过对一套活体心脏MR(magnetic resonance)图像进行分割并和手工分割结果和GGVF(generalized gradient vector flow) Snake模型的分割结果进行比较,结果表明该方法是有效的.

    • 基于表情相似性的人脸表情流形

      2009, 20(8):2191-2198.

      关键词:人脸表情识别流形模糊隶属度函数
      摘要 (5259)HTML (0)PDF 676.91 K (7224)收藏

      摘要:在图嵌入(graph embedding)的框架下提出一种根据表情相似度构建邻接权重图的方法来学习人脸表情子空间.数据集中人脸图像的表情以半监督-学习的方式来估计,人脸图像之间的表情相似性由表情模糊隶属度矢量之间的内积来度量,与个体、光照、姿态等人脸差异无关.在得到的子空间内,相似表情的人脸图像位于流形上的邻近位置,表情数据在子空间内按语义的分布很好地揭示了表情模糊、演变的特性.在Cohn-Kanade人脸表情数据库和实验室自行采集的人脸表情数据集上的实验结果说明了该方法的有效性.因此,该方法可以很好地应用于各种基于人脸表情识别的人机交互中.

    • 基于流形学习与隐条件随机场的人体动作识别

      2008, 19(zk):69-77.

      关键词:动作识别流形学习判别式模型隐条件随机场
      摘要 (4568)HTML (0)PDF 656.23 K (8152)收藏

      摘要:提出了一种基于流形学习与隐条件随机场(hidden conditional random fields,简称HCRF)的动作识别方法.算法提取人体剪影作为输入特征,采用有监督的保持邻域嵌入(neighborhood preserving embedding,简称NPE)的子空间学习算法获得高维运动特征的低维流形表示,基于HCRF建模运动特征与动作语义之间的映射关系.在降维过程中,通过保持数据的局部邻接关系,NPE可以获取动作特征在低维流形空间上的本质分布特性.与HMM(hidden Markov model)等产生式模型相比,HCRF侧重从样本数据中抽取共有特征以获取正确的分类边界,不需要假定观测过程条件独立,可以更加自然地对动作的时空邻域关系进行建模.实验结果表明,即便对于特征差异较大或存在噪声干扰的动作序列,算法也能取得较好的识别效果.

    • 基于最大-最小相似度学习方法的文本提取

      2008, 19(3):621-629.

      关键词:文本提取高斯混合模型判别学习最大-最小相似度学习最小分类错误学习
      摘要 (5331)HTML (0)PDF 657.78 K (5842)收藏

      摘要:应用最大-最小相似度(maximum-minimum similarity,简称MMS)学习方法,对基于高斯混合模型的文本区域提取方法中的有关参数进行优化.该学习方法通过最大化正样本相似度和最小化反样本相似度获得最佳分类能力.根据这种判别学习思想,建立了相应的目标函数,并利用最速梯度下降法寻找目标函数最小值,以得到文本区域提取方法的最优参数集合.文本区域提取实验结果表明:在用期望最大化(expectation maximization,简称EM)算法获得参数的极大似然估计值后,使用最大-最小相似度学习方法,使文本提取综合性能明显提高,开放实验的召回率和准确率分别达到98.55%和93.56%.在实验中,最大-最小相似度学习方法的表现还优于常用的判别学习方法——最小分类错误(minimum classification error,简称MCE)学习方法.

    • 基于自适应聚合的立体视觉合作算法

      2008, 19(7):1674-1682.

      关键词:立体视觉三目摄像机合作算法自适应聚合
      摘要 (4575)HTML (0)PDF 1.74 M (6317)收藏

      摘要:提出了一种恢复高质量稠密视差图的立体视觉合作算法.该算法采用基于形态学相似性的自适应加权方法,迭代地进行局部邻域的自适应聚合和抑制放大,实现高效率和高质量稠密视差图计算.将该算法推广到三目摄像机立体匹配系统中,通过重建摄像机坐标系实现图像校正,并根据连续性假设和唯一性假设,建立视差空间中的支持关系和三目摄像机之间的抑制关系.实验结果表明,三目立体合作算法能够得到精确的场景视差映射,并可以实现多基线方向的遮挡检测.该算法特别适用于由多个廉价摄像机组成的立体视觉系统,在几乎不增加软件和硬件资源的情况下,就可以得到高质量的稠密视差图.

    • 梯度矢量流Snake模型临界点剖析

      2006, 17(9):1915-1921.

      关键词:GVF(gradient vector flow,简称GVF) Snake临界点图像分割Navier-Stokes方程粘性流体力学
      摘要 (4664)HTML (0)PDF 489.41 K (6266)收藏

      摘要:作为经典Snake模型的一个变体,梯度矢量流(gradient vector flow,简称GVF)Snake在扩大Snake轮廓的捕捉范围和深度凹陷区域的收敛上具有卓越的性能.但GVF Snake在初始化时存在一个临界点问题:在目标内部的临界点必须在初始Snake轮廓的内部;在目标外部的临界点必须在Snake轮廓的外部.否则,Snake轮廓将不能收敛到正确的结果.对GVF Snake的临界点问题进行探讨,详细分析了临界点的影响因素,指出GVF场只有在合适的条件下才是有效的;证明了相关文献中从粘性流体力学

    • 一种基于最小割的稠密视差图恢复算法

      2005, 16(6):1090-1095.

      关键词:稠密深度图优化最小割连通区域受限α-扩展
      摘要 (4588)HTML (0)PDF 886.12 K (6156)收藏

      摘要:针对经典最小割算法计算量大和适应性不足的问题,提出一种改进的基于网络最小割计算稠密深度图的全局优化方法.首先,根据视差变化与不连续区域之间的关系,定义了具有一定适应性的平滑约束和遮挡约束,然后使用网络最小割算法,求解遮挡情况下的稠密视差.其次,在分析最小割算法复杂性的基础上,给出了一种受限α-扩展(α-expansion)操作,该操作根据灰度连通性和特征点匹配的结果对每次网络构造的顶点进行控制,减少网络中顶点和边的数目,可有效提高计算效率.实验结果显示,该算法在保证视差恢复准确性的前提下,能以较快的速度计算出较理想的稠密视差图.

    上一页1下一页
    共1页9条记录 跳转到GO

您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号