主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
李卫疆,赵铁军,臧文茂.基于文摘的信息检索模型.软件学报,2008,19(9):2329-2338
基于文摘的信息检索模型
Summary-Based Information Retrieval Model
投稿时间:2007-06-14  修订日期:2007-09-30
DOI:
中文关键词:  信息检索  语言模型  文摘  文摘检索模型  平滑方法
英文关键词:information retrieval  language model  summarization  summary-based model  smoothing method
基金项目:Supported by the National Natural Science Foundation of China under Grant No.60736044 (国家自然科学基金); the National High-Tech Research and Development Plan of China under Grant Nos.863-317-01-04-99, 2006AA01Z150 (国家高技术研究发展计划(863))
作者单位
李卫疆 哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001 
赵铁军 哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001 
臧文茂 哈尔滨工业大学 计算机科学与技术学院,黑龙江 哈尔滨 150001 
摘要点击次数: 3294
全文下载次数: 3662
中文摘要:
      基于文摘的检索模型是基于一个假设,即出现在文摘中的词要比未出现在文摘中的词更能表达文章的主题,因此对检索贡献更大.提出了两个基于文摘的语言检索模型,一个是用文摘模型代替文档模型直接检索文件(SQL),另一个是用文摘模型平滑文档模型(SBDM).在TREC数据集上的实验表明,该模型能够提高检索的性能.其中,SBDM的性能一致接近或优于传统的标准文档查询相似模型.有两个方面的贡献,一方面提出了面向检索的文摘抽取方法并考察了这些文摘方法对检索性能的影响;另一方面提出了新的检索模型,即基于文摘的检索模型.
英文摘要:
      Summary-Based retrieval is based on the hypothesis that terms in summary should be more important than other terms not in summary. Recent developments in the language modeling approach to information retrieval have motivated the study of this problem within this new retrieval framework. In the proposed research, two approaches to summary-based retrieval, namely ranking documents directly (SQL) and smoothing documents with summaries (SBDM) are investigated. Results on TREC collections show that, with the proposed models, summary-based retrieval models can perform consistently across collections and significant improvements over document-based retrieval can be obtained. There are two main contributions in this paper. On the one hand, summarization method of retrieval-oriented is examed and effect of this method on information retrieval. On the other hand, the new retrieval model for summary-based information retrieval models is proposed.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利