主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
黎玲利,王宏志,高宏,李建中.XML 数据流上Top-K 关键字查询处理.软件学报,2012,23(6):1561-1577
XML 数据流上Top-K 关键字查询处理
Efficient Top-K Keyword Search on XML Streams
投稿时间:2010-04-28  修订日期:2011-09-02
DOI:10.3724/SP.J.1001.2012.04114
中文关键词:  XML  数据流  关键字查询  Top-K  skyline
英文关键词:XML  streams  keyword search  Top-K  skyline
基金项目:国家自然科学基金(61003046, 61111130189); 国家重点基础研究发展计划(973)(2012CB316200); 高等学校博士学科点专项科研基金(20102302120054)
作者单位E-mail
黎玲利 哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001 lwsbrr@gmail.com 
王宏志 哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001  
高宏 哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001  
李建中 哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001  
摘要点击次数: 2756
全文下载次数: 3042
中文摘要:
      利用关键字可以在模式未知的情况下对XML 数据进行查询.在当前的XML数据流上的关键字查询处理中,打分函数往往不能都满足各种用户不同的需求.提出了一种基于skyline 的XML 数据流上的Top-K 关键字查询.对于这种查询,不需要考虑影响结果与查询相关性的复杂因素,只需利用skyline 挑选与查询最相关的结果.提出了两种XML 数据流上的有效的基于skyline 的Top-K 关键查询处理算法,包括对单查询和多查询的处理算法.通过扩展实验对两种算法的有效性和可扩展性进行了验证.经过实验验证,所提出的查询处理算法的效率几乎不受关键字个数、查询结果数量、查询数量等参数的影响,运行时间和文档大小大致呈线性关系.
英文摘要:
      Keywords are suitable for query XML streams without schema information. In current forms of keywords search on XML streams and rank functions do not always represent users' intensions. This paper addresses this problem in another aspect. In this paper, the skyline Top-K keyword queries, a novel kind of keyword queries on XML streams, are presented. For such queries, skyline is used to choose results on XML streams without considering the complicated factors influencing the relevance to queries. With skyline query processing techniques, two techniques, are presented to process skyline Top-K keyword single queries and multi-queries on XML streams efficiently. Extensive experiments are performed to verify the effectiveness and efficiency of these techniques presented in this paper. According to the experimental results, the algorithms are not sensitive to the parameters such as the number of keywords, the number of results, the number of queries, and the runtime is approximately linear to the size of document.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利