主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
张昕,李晓光,王大玲,于戈.数据流中一种快速启发式频繁模式挖掘方法.软件学报,2005,16(12):2099-2105
数据流中一种快速启发式频繁模式挖掘方法
A High-Speed Heuristic Algorithm for Mining Frequent Patterns in Data Stream
投稿时间:2004-11-29  修订日期:2005-03-11
DOI:
中文关键词:  数据挖掘  数据流  频繁模式  倾斜窗口
英文关键词:data mining  data stream  frequent pattern  tilted window
基金项目:Supported bytheNationalNatural Science Foundation of China under Grant Nos.60473073,60573090,60503036(国家自然科学基金)
作者单位
张昕 东北大学,信息科学与工程学院,辽宁,沈阳,110004 
李晓光 东北大学,信息科学与工程学院,辽宁,沈阳,110004 
王大玲 东北大学,信息科学与工程学院,辽宁,沈阳,110004 
于戈 东北大学,信息科学与工程学院,辽宁,沈阳,110004 
摘要点击次数: 2998
全文下载次数: 3230
中文摘要:
      在现有的数据流频繁模式挖掘算法中,批处理方法平均处理时间短,但需要积攒足够的数据,使得其实时性差且查询粒度粗;而启发式方法可以直接处理数据流,但处理速度慢.提出一种改进的字典树结构--IL-TREE(improved lexicographic tree),并在其基础上提出一种新的启发式算法FPIL-Stream(frequent pattem mining based on improved lexicographic tree),在更新模式和生成新模式的过程中,可以快速定位历史模式.算法结合了倾斜窗口策略,可以详细记录历史信息.该算法在及时处理数据流的前提下,也降低了数据的平均处理时间,并且提供了更细的查询粒度.
英文摘要:
      Of the current approaches to frequent pattern discovery in stream data, the batch approach requires enough data, while the heuristic approach can deal with stream data directly. Although the average speed of the batch approach is higher, it cannot response on time and the query granularity is rough. This paper proposes an improved Lexicographic tree, IL-TREE (improved lexicographic tree), and gives a novel heuristic algorithm, called FPIL-Stream (frequent pattern mining based on improved lexicographic tree), which locates the historical patterns rapidly in the stage of updating the patterns and generating the new ones. Moreover, a policy for the titled window is integrated into the algorithm for recording the historical information in details. With the promise of the processing stream data on time, the algorithm reduce the average processing time greatly and provides a finer granularity of query.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利