主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2018年第12期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
陈朝威,常冬霞.基于密度差分的自动聚类算法.软件学报,2018,29(4):935-944
基于密度差分的自动聚类算法
Automatic Clustering Algorithm Based on Density Difference
投稿时间:2017-05-03  修订日期:2017-06-26
DOI:10.13328/j.cnki.jos.005415
中文关键词:  聚类  数据挖掘  离散点检测  差分  CDD
英文关键词:clustering  data mining  outliers detection  difference  CDD
基金项目:国家自然科学基金(61532005)
作者单位E-mail
陈朝威 北京交通大学 计算机与信息技术学院, 北京 100044
北京交通大学 信息科学研究所, 北京 100044 
 
常冬霞 北京交通大学 计算机与信息技术学院, 北京 100044
北京交通大学 信息科学研究所, 北京 100044 
dxchang@bjtu.edu.cn 
摘要点击次数: 933
全文下载次数: 775
中文摘要:
      聚类作为监督学习技术,已在实际中得到了广泛的应用.但是对于带有噪声的数据集,一些主流算法仍然存在着噪声去除不彻底和聚类结果不准确等问题.提出了一种基于密度差分的自动聚类算法(clustering based on density difference,简称CDD),实现了对含有噪声数据集的自动分类.所提算法根据噪声数据和有用数据密度的不同,实现了去噪声和数据的分类,并通过构建数据间的邻域,进一步实现了对有用数据间不同类别的划分.通过实验验证了所提算法的有效性.
英文摘要:
      As an unsupervised learning technology, clustering has been widely used in practice. However, some mainstream algorithms still have problems such as incomplete noise removal and inaccurate clustering results for the datasets with noise. In this paper, an automatic clustering algorithm based on density difference (CDD) is proposed to realize automatic classification of the datasets containing the noise. The algorithm is based on the density difference between noise data and useful data to achieve removing noise and data classification. Moreover, the useful data are classified into different classes through the neighborhood construction procedure. Experimental results demonstrate that the CDD algorithm has high performance.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利