主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2019年第6期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
王晓宇,熊方,凌波,周傲英.一种基于相似度分析的主题提取和发现算法.软件学报,2003,14(9):1578-1585
一种基于相似度分析的主题提取和发现算法
A Similarity-Based Algorithm for Topic Exploration and Distillation
投稿时间:2002-06-05  修订日期:2002-08-14
DOI:
中文关键词:  主题提取  主题发现  链接分析  Web搜索
英文关键词:topic distillation  topic exploration  linkage analysis  Web searching
基金项目:Supported by the National Natural Science Foundation of China under Grant No.60003016 (国家自然科学基金); the National Grand Fundamental Research 973 Program of China under Grant No.G1998030404 (国家重点基础研究发展规划(973))
作者单位
王晓宇 复旦大学,计算机科学与工程系,上海,200433
同济大学,汽车电子研究所,上海,200092 
熊方 复旦大学,计算机科学与工程系,上海,200433 
凌波 复旦大学,计算机科学与工程系,上海,200433 
周傲英 复旦大学,计算机科学与工程系,上海,200433
同济大学,汽车电子研究所,上海,200092 
摘要点击次数: 3484
全文下载次数: 4100
中文摘要:
      试图从另一个角度来考察主题提取算法HITS,即提出一种基于相似度的链接分析模型来观察主题提取的过程.通过给出一种一般化的相似度定义,提出了一种仅使用链接分析来改善主题提取的质量的主题提取算法.同时,还将主题发现的功能也结合到了算法的框架中.通过该功能,用户可以搜索到次流行的主题.实验结果显示了这一新算法的两个优点:不必使用内容分析即能改善主题提取的质量以及能够进一步发现在查询结果中显现出来的不同主题.
英文摘要:
      In this paper, the authors attempt to revisit the behaviour of HITS from a different point of view. Namely, a similarity-based analysis model is proposed to observe the distillation procedure. By defining a generalized similarity, an algorithm is presented, which can improve the quality of distillation using only hyperlinks. A topic exploration function is also integrated into the algorithm framework, which enables end-users to search less popular topics when multi-topics are involved in queries. The experimental results reveal two benefits from the new algorithm: the improvement of distillation quality without utilizing any content information of pages, and an additional ability to explore the topics emerging in the query results.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利