查 询 高级检索+
共找到相关记录7条
    全 选
    显示方式:|
    • 类属型数据核子空间聚类算法

      2020, 31(11):3492-3505.DOI: 10.13328/j.cnki.jos.005819

      关键词:聚类类属型数据核方法非线性度量子空间
      摘要 (1151)HTML (1716)PDF 1.67 M (4101)收藏

      摘要:现有的类属型数据子空间聚类方法大多基于特征间相互独立假设,未考虑属性间存在的线性或非线性相关性.提出一种类属型数据核子空间聚类方法.首先引入原作用于连续型数据的核函数将类属型数据投影到核空间,定义了核空间中特征加权的类属型数据相似性度量.其次,基于该度量推导了类属型数据核子空间聚类目标函数,并提出一种高效求解该目标函数的优化方法.最后,定义了一种类属型数据核子空间聚类算法.该算法不仅在非线性空间中考虑了属性间的关系,而且在聚类过程中赋予每个属性衡量其与簇类相关程度的特征权重,实现了类属型属性的嵌入式特征选择.还定义了一个聚类有效性指标,以评价类属型数据聚类结果的质量.在合成数据和实际数据集上的实验结果表明,与现有子空间聚类算法相比,核子空间聚类算法可以发掘类属型属性间的非线性关系,并有效提高了聚类结果的质量.

    • 一种解决连续空间问题的真实在线自然梯度AC算法

      2018, 29(2):267-282.DOI: 10.13328/j.cnki.jos.005251

      关键词:策略梯度自然梯度行动者-评论家真实在线TD核方法
      摘要 (3474)HTML (1349)PDF 1.75 M (5564)收藏

      摘要:策略梯度作为一种能够有效解决连续空间决策问题的方法得到了广泛研究,但由于在策略估计过程中存在较大方差,因此,基于策略梯度的方法往往受到样本利用率低、收敛速度慢等限制.针对该问题,在行动者-评论家(actor-critic,简称AC)算法框架下,提出了真实在线增量式自然梯度AC(true online incremental natural actor-critic,简称TOINAC)算法.TOINAC算法采用优于传统梯度的自然梯度,在真实在线时间差分(true online time difference,简称TOTD)算法的基础上,提出了一种新型的前向观点,改进了自然梯度行动者-评论家算法.在评论家部分,利用TOTD算法高效性的特点来估计值函数;在行动者部分,引入一种新的前向观点来估计自然梯度,再利用资格迹将自然梯度估计变为在线估计,提高了自然梯度估计的准确性和算法的效率.将TOINAC算法与核方法以及正态策略分布相结合,解决了连续空间问题.最后,在平衡杆、Mountain Car以及Acrobot等连续问题上进行了仿真实验,验证了算法的有效性.

    • 普适性核度量标准比较研究

      2015, 26(11):2856-2868.DOI: 10.13328/j.cnki.jos.004905

      关键词:核方法核选择核参数优化普适性核度量标准
      摘要 (4663)HTML (2350)PDF 927.38 K (6921)收藏

      摘要:核方法是一类应用较为广泛的机器学习算法,已被应用于分类、聚类、回归和特征选择等方面.核函数的选择与参数优化一直是影响核方法效果的核心问题,从而推动了核度量标准,特别是普适性核度量标准的研究.对应用最为广泛的5种普适性核度量标准进行了分析与比较研究,包括KTA,EKTA,CKTA,FSM和KCSM.发现上述5种普适性度量标准的度量内容为特征空间中线性假设的平均间隔,与支持向量机最大化最小间隔的优化标准存在偏差.然后,使用模拟数据分析了上述标准的类别分布敏感性、线性平移敏感性、异方差数据敏感性,发现上述标准仅是核度量的充分非必要条件,好的核函数可能获得较低的度量值.最后,在9个UCI数据集和20Newsgroups数据集上比较了上述标准的度量效果,发现CKTA是度量效果最好的普适性核度量标准.

    • 支持向量学习的多参数同时调节

      2014, 25(9):2149-2159.DOI: 10.13328/j.cnki.jos.004650

      关键词:核方法支持向量学习模型选择参数调节序贯无约束极小化技术
      摘要 (5282)HTML (2458)PDF 658.46 K (6458)收藏

      摘要:模型选择是支持向量学习的关键问题.已有模型选择方法采用嵌套的双层优化框架,内层执行支持向量学习,外层通过最小化泛化误差的估计进行模型选择.该框架过程复杂,计算效率低.简化传统的双层优化框架,提出一个支持向量学习的多参数同时调节方法,在同一优化过程中实现模型选择和学习器训练.首先,将支持向量学习中的参数和超参数合并为一个参数向量,利用序贯无约束极小化技术(sequential unconstrained minimization technique,简称SUMT)分别改写支持向量分类和回归的有约束优化问题,得到多参数同时调节模型的多元无约束形式定义;然后,证明多参数同时调节模型目标函数的局部Lipschitz连续性及水平集有界性.在此基础上,应用变尺度方法(variable metric method,简称VMM)设计并实现了多参数同时调节算法.进一步地,基于多参数同时调节模型的性质,证明了算法收敛性,对比分析了算法复杂性.最后,实验验证同时调节算法的收敛性,并实验对比同时调节算法的有效性.理论证明和实验分析表明,同时调节方法是一种坚实、高效的支持向量模型选择方法.

    • 支撑向量数据域描述优化问题最优解理论分析

      2011, 22(7):1551-1560.DOI: 10.3724/SP.J.1001.2011.03856

      关键词:核方法支撑向量数据域描述凸优化唯一性
      摘要 (4753)HTML (0)PDF 603.36 K (5778)收藏

      摘要:支撑向量数据域描述(support vector data description,简称SVDD)作为一种已经得到广泛应用的核方法,研究主要集中在其性能和效率的提高上,然而该算法优化问题最优解性质的理论性质却没有得到足够的关注.,首先把SVDD 定义的原始优化问题等价转化为一个凸约束二次优化问题,然后从理论上证明了其构建的超球具有唯一性,然而超球半径在一定条件下却存在不唯一性,并且给出了半径存在不唯一性的充分必要条件.还从优化问题的角度分析了超球的圆心和半径性质,并且给出了SVDD 算法中在根据优化问题最优解构建超球半唯一情况下计算超球半径的方法.完善了该算法的理论和方法体系,从而为其更深入的研究和应用奠定了理础.

    • 基于机器学习的文本分类技术研究进展

      2006, 17(9):1848-1859.

      关键词:自动文本分类机器学习降维核方法未标注集偏斜数据集分级分类大规模文本分类Web页分类
      摘要 (12869)HTML (0)PDF 770.40 K (23143)收藏

      摘要:文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,近年来得到了广泛的关注和快速的发展.提出了基于机器学习的文本分类技术所面临的互联网内容信息处理等复杂应用的挑战,从模型、算法和评测等方面对其研究进展进行综述评论.认为非线性、数据集偏斜、标注瓶颈、多层分类、算法的扩展性及Web页分类等问题是目前文本分类研究的关键问题,并讨论了这些问题可能采取的方法.最后对研究的方向进行了展望.

    • 回归支持向量机的改进序列最小优化学习算法

      2003, 14(12):2006-2013.

      关键词:支持向量机核方法回归序列最小优化
      摘要 (4347)HTML (0)PDF 700.39 K (7585)收藏

      摘要:支持向量机(support vector machine,简称SVM)是一种基于结构风险最小化原理的学习技术,也是一种新的具有很好泛化性能的回归方法,提出了实现回归支持向量机的一种改进的SMO(sequential minimal optimization)算法,给出了两变量子优化问题的解析解,设计了新的工作集选择方法和停止条件,仿真实例说明,所提出的SMO算法比原始SMO算法具有更快的运算速度.

    上一页1下一页
    共1页7条记录 跳转到GO

您是第19734058位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号