主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第8期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
李求实,王秋月,王珊.XML 关键词检索的查询理解.软件学报,2012,23(8):2002-2017
XML 关键词检索的查询理解
Query Understanding for XML Keyword Search
投稿时间:2010-12-20  修订日期:2011-09-01
DOI:10.3724/SP.J.1001.2012.04122
中文关键词:  XML 关键词检索  查询理解  目标节点类型  条件节点类型
英文关键词:XML keyword search  query understanding  target node type  conditional node type
基金项目:“核心电子器件、高端通用芯片及基础软件产品”国家科技重大专项(08XNG040); 国家高技术研究发展计划(863)(2009AA01Z149)
作者单位E-mail
李求实 数据工程与知识工程教育部重点实验室(中国人民大学),北京 100872
中国人民大学 信息学院,北京 100872 
frankduns@126.com 
王秋月 数据工程与知识工程教育部重点实验室(中国人民大学),北京 100872
中国人民大学 信息学院,北京 100872 
 
王珊 数据工程与知识工程教育部重点实验室(中国人民大学),北京 100872
中国人民大学 信息学院,北京 100872 
 
摘要点击次数: 2526
全文下载次数: 3149
中文摘要:
      与纯文本文档集相比,使用语义标签标注的半结构化的XML 文档集,有助于信息检索系统更好地理解待检索文档.同样,结构化查询,比如SQL,XQuery 和Xpath,相对于纯关键词查询更加清晰地表达了用户的查询意图.这二者都能够帮助信息检索系统获得更好的检索精度.但关键词查询因其简单和易用性,仍被广泛使用.提出了XNodeRelation 算法,以自动推断关键词查询的结构化信息(条件/目标节点类型).与已有的推断算法相比,综合了XML 文档集的模式和统计信息以及查询关键词出现的上下文及其关联关系等推断用户的查询意图.大量的实验验证了该算法的有效性.
英文摘要:
      Compared with flat textual documents, XML documents are annotated with many meaningful tags, which give information retrieval systems a clearer understanding on queried documents. In addition to structured query languages, such as SQL, XQuery and XPath, keyword queries are widely used for XML retrieval because of their simplicity and ease of use. Although a single keyword and its query intention may be ambiguous, two or more keywords can clarify the query intention if possible occurring contexts and interrelationships are considered. This paper proposes the XNodeRelation algorithm to understand users’ keyword queries in XML retrieval. In contrast to existing approaches, the study infers users’ query intention by taking into account both schematic and statistical information of the XML data and considering the possible occurring contexts and interrelationships of query keywords. Extensive experiments verify the effectiveness of this algorithm.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利