主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第4期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
杨宜东,孙志挥,朱玉全,杨明,张柏礼.基于动态网格的数据流离群点快速检测算法.软件学报,2006,17(8):1796-1803
基于动态网格的数据流离群点快速检测算法
A Fast Outlier Detection Algorithm for Data Streams Based on Dynamic Grids
投稿时间:2004-09-30  修订日期:2005-10-11
DOI:
中文关键词:  数据流  离群点检测  时间相关动态网格划分
英文关键词:data stream  outlier detection  time-sensitive dynamic grids partitioning
基金项目:Supported by the National Natural Science Foundation of China under Grant No.60572112(国家自然科学基金)
作者单位
杨宜东 东南大学,计算机科学与工程系,江苏,南京,210096 
孙志挥 东南大学,计算机科学与工程系,江苏,南京,210096 
朱玉全 江苏大学,计算机科学与通信工程学院,江苏,镇江,212013 
杨明 南京师范大学,计算机科学系,江苏,南京,210000 
张柏礼 东南大学,计算机科学与工程系,江苏,南京,210096 
摘要点击次数: 3166
全文下载次数: 3039
中文摘要:
      离群点检测问题作为数据挖掘的一个重要任务,在众多领域中得到了应用.近年来,基于数据流数据的挖掘算法研究受到越来越多的重视.为了解决数据流数据中的离群点检测问题,提出了一种基于数据空间动态网格划分的快速数据流离群点检测算法.算法利用动态网格对空间中的稠密和稀疏区域进行划分,过滤处于稠密区域的大量主体数据,有效地减少了算法所需考察的数据对象的规模.而对于稀疏区域中的候选离群点,采用近似方法计算其离群度,具有高离群度的数据作为离群点输出.在保证一定精确度的条件下,算法的运行效率可以得到大幅度提高.对模拟数据集和真实数据集的实验检测均验证了该算法具有良好的适用性和有效性.
英文摘要:
      As an important task of data mining, outlier detection has been applied to many fields. Recently, research on mining in data stream is receiving more and more attention. For solving outlier detection in data stream, a new fast outlier detection algorithm is presented. Based on dynamically grid partitioning data space, the method separates dense areas from sparse areas. Data in dense areas are filtered simply, which reduces greatly the size of objects the algorithm should consider. Outliernesses of candidates in sparse areas are approximated efficiently. Data with high outlierness are outputted as outliers. Results of experiments on synthetic and real data sets show promising availabilities of the approaches.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利