基于网格耦合的数据流聚类
作者:
作者单位:

作者简介:

张东月(1993-),男,河北衡水人,硕士,主要研究领域为数据挖掘;吴湘云(1964-),男,讲师,主要研究领域为微分方程,概率论与数理统计,数据分析;周丽华(1968-),女,博士,教授,博士生导师,CCF专业会员,主要研究领域为数据挖掘,社交网络分析;赵丽红(1974-),女,讲师,主要研究领域为数据挖掘.

通讯作者:

周丽华,E-mail:lhzhou@ynu.edu.cn

中图分类号:

基金项目:

国家自然科学基金(61762090,61262069,61472346,61662086);云南省自然科学基金(2016FA026,2015FB114);云南省创新研究团队项目(2018HC019);云南省高等学校科技创新团队项目(IRTSTYN)


Data Stream Clustering Based on Grid Coupling
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61762090, 61262069, 61472346, 61662086); Natural Science Foundation of Yunnan Province (2016FA026, 2015FB114); Project of Innovative Research Team of Yunnan Province; Program for Innovation Research Team (in Science and Technology) in University of Yunnan Province (IRTSTYN)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    随着越来越多的应用程序产生数据流,数据流聚类分析的研究受到了广泛关注.基于网格的聚类通过将数据流映射到网格结构中形成数据概要,进而对概要进行聚类.这种方法通常具有较高的效率,但是每个网格独立处理,没有考虑网格之间的相互影响,因此聚类质量有待提高.在聚类过程中不再独立处理网格,而是考虑了网格之间的耦合关系,提出了一种基于网格耦合的数据流聚类算法.网格的耦合更加准确地表达了数据之间的相关性,从而提高了聚类的质量.在合成和真实数据流上的实验结果表明,所提算法具有较高的聚类质量和效率.

    Abstract:

    As more and more applications generate data streams, the research on data stream clustering analysis has received extensive attention. Grid-based clustering maps data streams into grid structures to form data summaries, and then clusters data summaries. This method usually has high efficiency, but each grid is processed independently, and the interaction between the grids is not considered, so the clustering quality needs to be improved. In this study, the coupling relationship between grids is considered rather than processed independently in the clustering process, and an algorithm for clustering data stream based on grid coupling is proposed. The proposed approach improves the quality of clusters as the coupling of the grid more accurately captures the correlation amongst the data. Experimental evaluations on synthetic and real data streams illustrate the superiority of the proposed approach compared with the state-of-the-arts approaches.

    参考文献
    相似文献
    引证文献
引用本文

张东月,周丽华,吴湘云,赵丽红.基于网格耦合的数据流聚类.软件学报,2019,30(3):667-683

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-07-20
  • 最后修改日期:2018-09-20
  • 录用日期:
  • 在线发布日期: 2019-03-06
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号