基于节点向量表达的复杂网络社团划分算法
作者:
作者单位:

作者简介:

韩忠明(1972-),男,山西吕梁人,博士,教授,CCF专业会员,主要研究领域为社会网络,数据挖掘,大数据处理;郑晨烨(1994-),女,学士,主要研究领域为社交网络挖掘;刘雯(1992-),男,学士,主要研究领域为社交网络挖掘;谭旭升(1990-),男,学士,主要研究领域为社交网络挖掘;李梦琪(1993-),女,学士,主要研究领域为深度学习,自然语言处理;段大高(1976-),男,博士,副教授,CCF专业会员,主要研究领域为异构数据挖掘,大数据处理,社会网络.

通讯作者:

韩忠明,E-mail:hanzm@th.btbu.edu.cn

中图分类号:

基金项目:

国家自然科学基金(61170112,61532006);北京市自然科学基金(4172016,KZ201410011014)


Community Detection Algorithm Based on Node Embedding Vector Representation
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61170112, 61532006); Natural Science Foundation of Beijing, China (4172016, KZ201410011014)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    社团结构划分对复杂网络研究在理论和实践上都非常重要.借鉴分布式词向量理论,提出一种基于节点向量表达的复杂网络社团划分方法(CDNEV).为了构建网络节点的分布式向量,提出启发式随机游走模型.利用节点启发式随机游走得到的节点序列作为上下文,采用SkipGram模型学习节点的分布式向量.选择局部度中心节点作为K-Means算法的聚类中心点,然后用K-Means算法进行聚类,最终得到社团结构.在真实和模拟两种网络上做了丰富的实验,与主流的全局社团划分算法和局部社团划分算法作了比较.在真实网络上CDNEV算法的F1指标比其他算法平均提高19%;在模拟网络上,F1指标则可以提高15%.实验结果表明,相对其他算法,CDNEV算法的精度和效率都较高.

    Abstract:

    Community detection is very important in theoretical and practical for complex research. According to the principle of distributed word vector, a community detection algorithm based on node embedding vector (CDNEV) is proposed in this study. In order to construct the distributed vector of network nodes, a heuristic random walk model is put forward. The node sequence obtained by the heuristic random walk model is used as the context for nodes, and the distributed vector of nodes is learned by SkipGram model. Based on the distributed vector of nodes that are selected from the local node as the center of the K-Means clustering algorithm center, all nodes in a network are clustered with K-Means algorithm, and the community structure are conclude by clustering result. Based on real complex networks and artificial networks used in other state-of-the-art algorithms, comprehensive experiments are conducted. For comparison purpose, typical community detection algorithms are selected to be evaluated. On real networks, the F1 value of CDNEV algorithm is increased 19% on average. The F1 value can be increased by 15% on artificial networks. Experimental results demonstrate that both accuracy and efficiency of CDNEV algorithm outperform other state-of-the-art algorithms.

    参考文献
    相似文献
    引证文献
引用本文

韩忠明,刘雯,李梦琪,郑晨烨,谭旭升,段大高.基于节点向量表达的复杂网络社团划分算法.软件学报,2019,30(4):1045-1061

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2016-10-09
  • 最后修改日期:2017-06-09
  • 录用日期:
  • 在线发布日期: 2019-04-01
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号