主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
陆介平,杨明,孙志挥,鞠时光.快速挖掘全局最大频繁项目集.软件学报,2005,16(4):553-560
快速挖掘全局最大频繁项目集
Fast Mining of Global Maximum Frequent Itemsets
投稿时间:2004-06-03  修订日期:2004-07-02
DOI:
中文关键词:  分布式数据库  数据挖掘  频繁模式树  全局最大频繁项目集
英文关键词:distribute database  data mining  frequent pattern tree  global maximum frequent itemset
基金项目:Supported by the National Natural Science Foundation of China under Grant No.70371015(国家自然科学基金);the NationalNatural Science Foundation of Jiangsu Province under Grant No.BK2004058(江苏省自然科学基金)
作者单位
陆介平 东南大学,计算机科学与工程系,江苏,南京,210096 
杨明 东南大学,计算机科学与工程系,江苏,南京,210096 
孙志挥 东南大学,计算机科学与工程系,江苏,南京,210096 
鞠时光 江苏大学,计算机科学与通信工程学院,江苏,镇江,212013 
摘要点击次数: 3128
全文下载次数: 3235
中文摘要:
      挖掘最大频繁项目集是多种数据挖掘应用中的关键问题.现行可用的最大频繁项目集挖掘算法大多基于单机环境,针对分布式环境下的全局最大频繁项目集挖掘尚不多见.若将基于单机环境的最大频繁项目集挖掘算法运用于分布式环境,或运用分布式环境下的全局频繁项目集挖掘算法来挖掘全局最大频繁项目集,均会产生大量的候选频繁项目集,且网络通信代价高.为此,提出了快速挖掘全局最大频繁项目集算法FMGMFI(fast mining global maximum frequent itemsets),该算法采用FP-tree存储结构,可方便地从各局部FP-tree的相关路径中得到项目集的频度,同时采用自顶向下和自底向上的双向搜索策略,可有效地降低网络通信代价.实验结果表明,FMGMF算法是有效、可行的.
英文摘要:
      Mining maximum frequent itemsets is a key problem in data mining field with numerous important applications. The existing algorithms of mining maximum frequent itemsets are based on local databases, and very little work has been done in distributed databases. However, using the existing algorithms for the maximum frequent itemsets or using the algorithms proposed for the global frequent itemsets needs to generate a lots of candidate itemsets and requires a large amount of communication overhead. Therefore, this paper proposes an algorithm for fast mining global maximum frequent itemsets (FMGMFI), which can conveniently get the global frequency of any itemset from the corresponding paths of every local FP-tree by using frequent pattern tree and require far less communication overhead by the searching strategy of bottom-up and top-down. Experimental results show that FMGMFI is effective and efficient.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利