基于包含度的子图匹配方法
作者:
作者单位:

作者简介:

李瑞远(1990-),男,湖南郴州人,博士生,主要研究领域为时空数据管理,城市计算,云计算;洪亮(1982-),男,博士,副教授,主要研究领域为图数据库,社会网络,时空数据管理.

通讯作者:

洪亮,E-mail:hong@whu.edu.cn

中图分类号:

基金项目:

国家重点研发计划(2016YFB1000603);国家自然科学基金(61303025);深圳市基础研究项目(JCYJ20160523160953223);NSFC-广东联合基金;国家超级计算广州中心


Method for Subgraph Matching with Inclusion Degree
Author:
Affiliation:

Fund Project:

National Key Research and Development Program of China (2016YFB1000603); National Natural ScienceFoundation of China (61303025); Shenzhen Basic Research Project (JCYJ20160523160953223); NSFC-Guangdong Joint Fund; NationalSupercomputing Center in Guangzhou Project

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    子图匹配是图论中最基本的操作.研究子图匹配的一个变种,即:在一个节点拥有若干元素的大图数据库中,找到与给定查询图结构同构并且对应节点元素的加权集合包含度大于给定值的所有子图,称作基于包含度的子图匹配(subgraph matching with inclusion degree,简称SMID).该查询能够应用于多种场景,包括论文检索、社区发现、企业招聘等.为高效实现SMID,设计了同时包含节点元素和图结构信息的数据签名与查询签名,在离线处理阶段,利用数据签名为数据图建立动态签名树(DS-Tree),以加快在线处理时图节点的匹配过程.为解决DS-Tree占用空间大的问题,设计了一种DS-Tree压缩方法,在对查询效率影响不大的情况下减小了索引空间.为进一步加快查询效率,还提出了支配子图查询算法.在真实数据和人工数据上的实验结果表明,所提出的方法在效率和扩展性方面优于现有其他方法.

    Abstract:

    Subgrpah matching is a basic operation in graph theory. This paper focuses on a variant, namely subgraph matching with inclusion degree (SMID), which retrieves subgraphs that are structurally isomorphic to the query graph while satisfying the condition that the inclusion degree between matched vertexes is greater than a given value. SMID can be applied to many applications, including paper search, crowdsourcing, and recruitment. To efficiently process SMID, this paper designs a novel signature mechanism for data graph and query graph respectively by holding the information of both vertex elements and graph structure. Based on graph signature, a dynamic signature tree (DS-Tree) is built to speed up the SMID processing. A compression method is proposed to reduce the memory usage of DS-Tree. To achieve a better performance, an efficient dominating-set-based subgraph matching algorithm is also developed. Extensive experiments on both real and synthetic datasets demonstrate that the method introduced in this paper outperforms state-of-the-art methods by an order of magnitude in terms of efficiency and scalability.

    参考文献
    相似文献
    引证文献
引用本文

李瑞远,洪亮.基于包含度的子图匹配方法.软件学报,2018,29(6):1792-1812

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2016-10-26
  • 最后修改日期:2017-01-19
  • 录用日期:
  • 在线发布日期: 2017-04-11
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号