主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2021年第1期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
许航,张师超,吴兆江,李佳烨.噪音数据的属性选择算法.软件学报,0,(0):0
噪音数据的属性选择算法
Feature Selection Algorithm for Noise Data
投稿时间:2019-12-26  修订日期:2020-01-17
DOI:10.13328/j.cnki.jos.006041
中文关键词:  属性选择|自步学习|局部保留投影
英文关键词:feature selection|self-paced learning|locality preserving projections
基金项目:国家自然科学基金(61836016,61672177);中南大学中央高校基本科研业务费专项资金资助(2019zzts964)
作者单位E-mail
许航 中南大学 计算机学院, 湖南 长沙 410083  
张师超 中南大学 计算机学院, 湖南 长沙 410083 zhangsc@csu.edu.cn 
吴兆江 中南大学 计算机学院, 湖南 长沙 410083  
李佳烨 广西师范大学 计算机科学与信息工程学院, 广西 桂林 541004  
摘要点击次数: 94
全文下载次数: 65
中文摘要:
      正则化属性选择算法减小噪音数据影响的效果不佳,而且,样本空间的局部结构几乎没有被考虑,在将样本映射到属性子空间后,样本之间的联系与原空间不一致,导致数据挖掘算法的效果不能令人满意.本文提出一个抗噪音属性选择方法,可以有效的解决传统算法的这两个缺陷.该方法首先采用自步学习的训练方式,这不仅能大幅度降低离群点进入训练的可能性,而且有利于模型的快速收敛.然后,采用加入l2,1正则项的回归学习器进行嵌入式属性选择,兼顾“求得稀疏解”和“解决过拟合”,使模型更稳健.最后,融合局部保留投影的技术,将其投影矩阵转换成模型的回归参数矩阵,在属性选择的同时保持样本之间的原有局部结构.采用一系列基准数据集合测试该算法,在aCC和aRMSE上的实验结果表明了该属性选择方法的有效性.
英文摘要:
      The regularization feature selection algorithm is not effective in reducing the impact of noisy data. Moreover, the local structure of the sample space is hardly considered. After the samples are mapped to the feature subspace, the relationship between samples is inconsistent with the original space, resulting in unsatisfactory results of the data mining algorithm. This paper proposes an anti-noise feature selection method that can effectively solve these two shortcomings of traditional algorithms. This method first uses a self-paced learning training method, which not only greatly reduces the possibility of outliers entering training, but also facilitates the rapid convergence of the model. Then, a regression learner with regular terms is used to select the embedded features, taking into account the "sparse solution" and "solving over-fitting" to make the model more robust. Finally, the technique of locality preserving projections is integrated, and its projection matrix is transformed into the regression parameter matrix of the model, while maintaining the original local structure between the samples while selecting the features. Some experiments are conducted for evaluating the algorithm with a series of benchmark data sets. Experimental results show the effectiveness of the proposed algorithm in term of the aCC and aRMSE.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利