主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2020年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
夏迎炬,黄萱菁,胡恬,吴立德.自适应信息过滤中使用少量正例进行阈值优化.软件学报,2003,14(10):1697-1705
自适应信息过滤中使用少量正例进行阈值优化
Threshold Optimization with a Small Number of Samples in Adaptive Information Filtering
投稿时间:2002-06-01  修订日期:2002-09-04
DOI:
中文关键词:  自适应信息过滤  向量空间模型  阈值优化  检出率  相关反馈
英文关键词:adaptive information filtering  vector space model  threshold optimization  delivery ratio  relevance feedback
基金项目:Supported by the Supported by the National Natural Science Foundation of China under Grant Nos.69873011, 69935010, 60103014 (国家自然科学基金); the National High-Tech Research and Development Plan of China under Grant Nos.2002AA142090, 2001AA114120 (国家高技术研究发展计划(863))
作者单位
夏迎炬 复旦大学,计算机科学系,上海,200433 
黄萱菁 复旦大学,计算机科学系,上海,200433 
胡恬 复旦大学,计算机科学系,上海,200433 
吴立德 复旦大学,计算机科学系,上海,200433 
摘要点击次数: 3104
全文下载次数: 3145
中文摘要:
      自适应信息过滤中一个大的挑战在于其数据稀疏问题.因此,在对输入的文本流进行过滤的同时学习最优阈值非常重要.提出了一种新颖的阈值优化算法.该算法可以通过少量的正例进行快速的学习,所需数据的获得具有增量性,故而其计算量及所需的存储空间很小.此外,该算法还具有高效、健壮、实用性强等优点.在第10届国际文本检索会议(TREC10)上,复旦大学的自适应信息过滤系统使用了该阈值优化算法,并取得了第3名的成绩.其T10U和T10F分别达到了0.215和0.414.
英文摘要:
      One special challenge in adaptive information filtering is the problem of extremely sparse data. So it is very important to learn optimal threshold while filtering the input textual stream. In this paper, an algorithm is presented for the threshold optimization. The algorithm learns fast by using few positive samples. Moreover, most of the quantities the algorithm requires can be updated incrementally, so its memory and computational power requirements are low. It also has the merits of effective, robust, and practically useful. Fudan University's adaptive text filtering system used this algorithm for the first time and came in third in all runs of TREC10. Its T10U and T10F are 0.215 and 0.414 respectively.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利