主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2020年专刊出版计划 微信服务介绍 最新一期:2019年第12期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
宋国杰,唐世渭,杨冬青,王腾蛟.数据流中频繁模式的评估与维护.软件学报,2004,15(zk):20-27
数据流中频繁模式的评估与维护
Estimation and Maintenance of Frequent Pattern on Data Streams
  
DOI:
中文关键词:  数据流挖掘  抽样  频繁模式  Hoeffding bounds  启发式方法
英文关键词:data streammining  sample  frequentpattern  Hoeffdingbounds:heuristicmethod
基金项目:Supported by the National Grand Fundamental Research 973 Program of China under Grant No.G1999032705(国家重点基础研究发展规划(973))
作者单位
宋国杰 北京大学信息科学技术学院北京 100871 
唐世渭 北京大学信息科学技术学院北京 100871 
杨冬青 北京大学信息科学技术学院北京 100871 
王腾蛟 北京大学信息科学技术学院北京 100871 
摘要点击次数: 2024
全文下载次数: 2543
中文摘要:
      研究了数据流中频繁模式的挖掘问题,主要贡献在于:(1)基于启发式思想方法和抽样理论的基础上,提出了基于数据流样本集的分步模式估计方法;(2)算法求解所有长度的模式,而不仅仅是单项集模式;(3)为了找到满足精度要求的恰当的数据流样本集长度,引入了Hoeffding bound理论,并进行了修正,从而使之更适合于这一问题:(4) 提出了对估计模式进行在线维护的方法.基于上述方法的基础上,提出了模式估计和维护算法.最后,通过和已有算法进行实验对比分析,结果表明,该算法在结果精度、空间、时间复杂性等方面都适合进行数据流的分析.
英文摘要:
      In this paper, the methods are investigate for online,frequent paRem mining of stream data,with the following contributions:(1) based on heuristic methodology and sample theory,step-by-step data stream mining method is used to estimate potential paRern set;(2)will find any length paRern not only single item pattern;(3)to find more appropriate length of each segment satisfying accuracy requirement,Hoeffding bound theory was introduced and revised to make it more suit for pattern mining;(4)a maintenance approach for estimating frequent patterns is developed for on.1ine analysis.Based on this design,estimation and maintenance algorithms are proposed for efficient analysis of data streams.This performance study compares the proposed algorithms and identifies the most accuracy-,memory-and time-efficient algorithms for stream data analysis.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利