主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2020年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
覃遵跃,汤庸,徐洪智,黄云.基于关键字密度的XML关键字检索.软件学报,2019,30(4):1062-1077
基于关键字密度的XML关键字检索
Study on Keyword Retrieval Based on Keyword Density for XML Data
投稿时间:2016-07-22  修订日期:2017-06-09
DOI:10.13328/j.cnki.jos.005390
中文关键词:  XML关键字检索  边密度  路径密度  TopLCA-K算法
英文关键词:XML keyword retrieval  edge density  path density  TopLCA-K algorithm
基金项目:国家高技术研究发展计划(863)(2013AA01A212);国家自然科学基金(61772211,60970044,61272067,61363073);广东省自然科学基金团队研究项目(2014B010116002,2015B010109003,2013B090800024,S2012030006242,2015B010129009)
作者单位E-mail
覃遵跃 中山大学 数据科学与计算机学院, 广东 广州 510006
吉首大学 软件学院, 湖南 张家界 427000 
 
汤庸 中山大学 数据科学与计算机学院, 广东 广州 510006
华南师范大学 计算机学院, 广东 广州 510631 
ytang4@qq.com 
徐洪智 吉首大学 软件学院, 湖南 张家界 427000  
黄云 吉首大学 软件学院, 湖南 张家界 427000  
摘要点击次数: 1069
全文下载次数: 764
中文摘要:
      关键字检索具有友好的用户操作体验,该检索方式已在文本信息检索领域得到了广泛而深入的应用.对XML数据采用关键字检索是目前研究的热点.基于查询语义的XML关键字检索方法存在返回大量与用户查询意图无关的查询片段或者丢失符合用户查询意图的片段这两个问题.针对这些问题,在考虑LCA横向和纵向两个维度的基础上,提出了用户查询意图与LCA相关性的两个规则,根据两个规则定义了LCA的边密度和路径密度,建立了综合的LCA节点评分公式,最后设计TopLCA-K算法对LCA进行排名,并利用中心位置索引CI提高了TopLCA-K算法的效率.实验结果显示,利用所提出的方法返回的查询节点更加符合用户需求.
英文摘要:
      Keyword search has a friendly user experience; the method has been widely used in the field of text information retrieval. Keyword search on XML data is a hot research topic presently. The XML keyword search method based on query semantics have two problems:(1) a large number of query fragments which are not related to the user's query intention have been returned; (2) the fragments which are consistent with the user's query intention have been missed. Aiming at these problems, two rules of user query intention and LCA correlation are proposed on the basis of the two (horizontal and vertical) dimensions of LCA. The edge density and path density of LCA are defined according to the two rules, and a comprehensive scoring formula on LCA nodes is established, finally, the TopLCA-K algorithm is designed to rank LCA. To improve the efficiency of the algorithm, center location index is designed. Experimental results show that the nodes returned by this method are more in line with the needs of users.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利