主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2018-2019年专刊出版计划 微信服务介绍 最新一期:2018年第12期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
李劲,岳昆,蔡娇,张志坚,刘惟一.基于距离度量的多样性图排序方法.软件学报,2018,29(3):599-613
基于距离度量的多样性图排序方法
Distance Metric Based Diversified Ranking on Large Graphs
投稿时间:2017-08-02  修订日期:2017-09-05
DOI:10.13328/j.cnki.jos.005455
中文关键词:  图数据  个性化PageRank  多样性图排序  最大和k-dispersion  MapReduce
英文关键词:graph data  personalized PageRank  diversified graph ranking  max-sum k-dispersion  MapReduce
基金项目:国家自然科学基金(61562091,61472345);第二批"云岭学者"培养项目(C6153001);云南省应用基础研究计划(2014FA023,2016FB110);云南大学中青年骨干教师培养计划项目;云南大学青年英才培育计划(WX173602);云南大学数据驱动的软件工程科技创新团队项目(2017HC012)
作者单位E-mail
李劲 云南大学 软件学院, 云南 昆明 650091
云南省软件工程重点实验室, 云南 昆明 650091 
 
岳昆 云南大学 信息学院, 云南 昆明 650091 kyue@ynu.edu.cn 
蔡娇 云南大学 软件学院, 云南 昆明 650091  
张志坚 云南大学 信息学院, 云南 昆明 650091  
刘惟一 云南大学 信息学院, 云南 昆明 650091  
摘要点击次数: 823
全文下载次数: 912
中文摘要:
      有效结合查询相关性和多样性的扩展相关性,是多样性图排序问题的一种优化目标.基于扩展相关性的多样性图排序可建模为一个子模函数优化问题,贪心子模优化算法可近似求解该问题.然而,扩展相关性不能直接度量节点间的不相似性.子模优化算法是串行算法,不能充分利用诸如Spark等集群计算平台有效提高算法效率.针对这些问题,提出一种描述节点间不相似性的距离度量.基于该距离度量,将多样性图排序问题建模为一个在查询相关节点集上构造的带权完全图的最大和k-dispersion优化问题.提出了求解该问题的多项式时间2-近似算法.鉴于不同节点对的距离度量计算是相互独立的,进一步提出了基于MapReduce编程模型的并行化多样性图排序算法.最后,在真实图数据集上验证了所提出算法的高效性和有效性.
英文摘要:
      Expansion relevance which combines both relevance and diversity into a single function is resorted to a submodular optimization objective that can be solved by applying the classic cardinality constrained monotone submodular maximization. However, expansion relevance do not directly capture the dis-similarity over a pair of nodes. Existing submodular algorithms are sequential and not easy to take full advantage of the power of distributed cluster computing platform, such as Spark, to significantly improve the efficiency of algorithm. To tackle this issue, in this paper, a distance metric, which is defined by a sum function of personalized PageRank scores over the symmetry difference of neighbors of a pair of nodes, is first introduced to capture the pairwise dis-similarity over pairs of nodes. Then, the problem of diversified ranking on graphs is formulated as a max-sum k-dispersion problem with metrical edge weight. A polynomial time 2-approximate algorithm is proposed to solve the problem. Considering the computational independence of different pairs of nodes, a MapReduce algorithm is further developed to boost the efficiency of the process. Finally, extensive experiments are conducted on real network datasets to verify the effectiveness and efficiency of the proposed algorithm.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利