主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
陈华辉,施伯乐,钱江波,陈叶芳.基于小波概要的并行数据流聚类.软件学报,2010,21(4):644-658
基于小波概要的并行数据流聚类
Wavelet Synopsis Based Clustering of Parallel Data Streams
投稿时间:2008-05-15  修订日期:2008-11-28
DOI:
中文关键词:  聚类  概要  遗忘特性  离散小波变换  数据流
英文关键词:clustering  synopsis  amnesic feature  discrete wavelet transform  data stream
基金项目:Supported by the National Natural Science Foundation of China under Grant Nos.60803021, 60973047 (国家自然科学基金); the Zhejiang Provincial Natural Science Foundation of China under Grant No.Y1091189 (浙江省自然科学基金); the Ningbo Municipal Natural Science Foundation of China under Grant Nos.2007A610007, 2009A610072 (宁波市自然科学基金)
作者单位
陈华辉 复旦大学 计算机科学技术学院,上海 200433
宁波大学 信息科学与工程学院,浙江 宁波 315211 
施伯乐 复旦大学 计算机科学技术学院,上海 200433 
钱江波 宁波大学 信息科学与工程学院,浙江 宁波 315211 
陈叶芳 宁波大学 信息科学与工程学院,浙江 宁波 315211 
摘要点击次数: 3720
全文下载次数: 3769
中文摘要:
      许多应用中会连续不断产生大量随时间演变的序列型数据,构成时间序列数据流,如传感器网络、实时股票行情、网络及通信监控等场合.聚类是分析这类并行多数据流的一种有力工具.但数据流长度无限、随时间演变和大数据量的特点,使得传统的聚类方法无法直接应用.利用数据流的遗忘特性,应用离散小波变换,分层、动态地维护每个数据流的概要结构.基于该概要结构,快速计算数据流与聚类中心之间的近似距离,实现了一种适合并行多数据流的K-means聚类方法.所进行的实验验证了该聚类方法的有效性.
英文摘要:
      In many real-life applications, such as stock markets, network monitoring, and sensor networks, data are modeled as dynamic evolving time series which is continuous and unbounded in nature, and many such data streams concur usually. Clustering is useful in analyzing such paralleled data streams. This paper is interested in grouping these evolving data streams. For this purpose, a synopsis is maintained dynamically for each data stream. The construction of the synopsis is based on Discrete Wavelet Transform and utilizes the amnesic feature of data stream. By using the synopsis, a fast computation of approximate distances between streams and the cluster center can be implemented, and an efficient online version of the classical K-means clustering algorithm is developed. Experiments have proved the effectiveness of the proposed method.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利