主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2020年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
汪美玲,周翔,陶秋铭,赵琛.增强覆盖度与非相似性的标签选择多样化方法.软件学报,2015,26(9):2326-2338
增强覆盖度与非相似性的标签选择多样化方法
Diversifying Tag Selection Result by Improving Both Coverage and Dissimilarity
投稿时间:2013-09-22  修订日期:2014-07-09
DOI:10.13328/j.cnki.jos.004736
中文关键词:  标签云  标签选择  结果多样化  信息覆盖度  非相似性
英文关键词:tag cloud  tag selection  result diversification  information coverage  dissimilarity
基金项目:国家自然科学基金(61100067); 中国科学院先导专项(XDA06010600)
作者单位E-mail
汪美玲 中国科学院 软件研究所, 北京 100190
中国科学院 研究生院, 北京 100049 
meiling@nfs.iscas.ac.cn 
周翔 中国科学院 软件研究所, 北京 100190  
陶秋铭 中国科学院 软件研究所, 北京 100190  
赵琛 中国科学院 软件研究所, 北京 100190  
摘要点击次数: 2021
全文下载次数: 1913
中文摘要:
      标签云是社交网站提供在线资源说明与导航功能的一种流行机制.标签选择即从大量标签中选出有代表性的有限标签,是创建标签云的核心任务.标签选择结果的多样性,是影响用户满意度的一个重要因素.信息覆盖度与标签非相似性是在标签选择中引入多样性的两个主要角度.为了进一步提高标签选择结果的信息覆盖度与标签非相似性,提出了3种标签选择方法.在每种方法中,定义了目标函数以同时量化标签集合的信息覆盖度与标签非相似性,并设计了近似算法以求解相应的最大化问题;同时,还分析了近似算法的近似比.利用CiteULike网站与Last.fm网站的标注数据集,将所提出的方法与已有方法进行了比较.实验结果表明,所提出的方法在信息覆盖度与标签非相似性方面都具有较好的效果.
英文摘要:
      Tag cloud has been a popular facility used by social networks for online resource summarization and navigation. Tag selection, which aims to select a limited number of representative tags from a large set of tags, is the core task for creating tag clouds. Diversity of tag selection result is an important factor that affects user satisfaction. Information coverage and tag dissimilarity are two major perspectives for introducing diversity in tag selection. To improve information coverage and tag dissimilarity of tag selection result, this paper proposes three new tag selection approaches. In each approach, an objective function is defined to quantify both information coverage and tag dissimilarity of tags, and an approximate algorithm is designed to solve the corresponding maximization problem. Further the approximate ratio for each approximate algorithm is analyzed. The proposed and existing approaches are compared using tagging datasets extracted from the websites of CiteULike and Last.fm. The experimental results show that the new approaches perform better in terms of both information coverage and tag dissimilarity.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利