主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第4期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
王实,高文,李锦涛.基于用户访问事务文法的序列关联规则发现.软件学报,2001,12(10):1503-1509
基于用户访问事务文法的序列关联规则发现
Sequence Association Rule Discovery Based on User Access Transaction Grammar
投稿时间:2000-03-06  修订日期:2000-05-30
DOI:
中文关键词:  Web数据挖掘  文法  序列关联规则
英文关键词:web mining  grammar  sequence association rule
基金项目:国家重点基础研究发展规划973资助项目(G1998030405);国家863高科技发展计划资助项目(863-306-JD06-03-4)
作者单位
王实 中国科学院计算技术研究所,北京 100080 
高文 中国科学院计算技术研究所,北京 100080 
李锦涛 中国科学院计算技术研究所,北京 100080 
摘要点击次数: 2503
全文下载次数: 2671
中文摘要:
      在Web挖掘中,应用关联规则发现方法可以发现Web页面之间用户访问的关联度.由于Web站点内含丰富的页面结构信息,也由于用户的访问总是要遵循一定的访问顺序,因此提出一种新的可以发现用户访问序列之间关联度的方法——序列关联规则发现方法.该方法首先得到用户访问事务;然后根据正则文法,定义了一种新的用户访问事务文法,用于从用户访问事务中得到用户序列访问事务;最后应用关联规则发现算法进而发现序列关联规则.为了进一步评价所发现的序列关联规则,引入了互信息的概念.发现的序列关联规则可以帮助Web站点的设计者更好地理解用户的访问,以用于调整Web站点的结构.
英文摘要:
      In web mining, applying association rule discovery can discover the association between different web pages accessed by users. Because there is the rich structure information in the website and the access of the users conforms to some kinds of sequences, a new approach is presented in this paper to discover the association between the access sequences, which is the sequence association rule discovery. In this approach, first the Log is mined in the web server to get the user access transactions, and then according to the regular grammar, a new user access transaction grammar is defined in order to get the sequence access transactions from the user access transactions. Subsequently, the association rule discovery algorithm is employed to discover the sequence association rules. To evaluate these rules, the mutual information is proposed. The result of this approach can help the designer of the website to understand the user access patterns better, and according to this result, the designer can adjust the structure of the web site.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利