数据流中频繁模式的评估与维护
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

Supported by the National Grand Fundamental Research 973 Program of China under Grant No.G1999032705(国家重点基础研究发展规划(973))


Estimation and Maintenance of Frequent Pattern on Data Streams
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    研究了数据流中频繁模式的挖掘问题,主要贡献在于:(1)基于启发式思想方法和抽样理论的基础上,提出了基于数据流样本集的分步模式估计方法;(2)算法求解所有长度的模式,而不仅仅是单项集模式;(3)为了找到满足精度要求的恰当的数据流样本集长度,引入了Hoeffding bound理论,并进行了修正,从而使之更适合于这一问题:(4) 提出了对估计模式进行在线维护的方法.基于上述方法的基础上,提出了模式估计和维护算法.最后,通过和已有算法进行实验对比分析,结果表明,该算法在结果精度、空间、时间复杂性等方面都适合进行数据流的分析.

    Abstract:

    In this paper, the methods are investigate for online,frequent paRem mining of stream data,with the following contributions:(1) based on heuristic methodology and sample theory,step-by-step data stream mining method is used to estimate potential paRern set;(2)will find any length paRern not only single item pattern;(3)to find more appropriate length of each segment satisfying accuracy requirement,Hoeffding bound theory was introduced and revised to make it more suit for pattern mining;(4)a maintenance approach for estimating frequent patterns is developed for on.1ine analysis.Based on this design,estimation and maintenance algorithms are proposed for efficient analysis of data streams.This performance study compares the proposed algorithms and identifies the most accuracy-,memory-and time-efficient algorithms for stream data analysis.

    参考文献
    相似文献
    引证文献
引用本文

宋国杰,唐世渭,杨冬青,王腾蛟.数据流中频繁模式的评估与维护.软件学报,2004,15(zk):20-27

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期:
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号