基于关联规则和拓扑序列的分类器链方法
作者:
作者单位:

作者简介:

丁家满(1974-),男,教授,CCF专业会员,主要研究领域为数据挖掘,大数据与云计算,软件工程.;周蜀杰(1996-),男,硕士生,主要研究领域为机器学习,数据挖掘.;李润鑫(1983-),男,博士,CCF专业会员,主要研究领域为机器学习,数据挖掘,最优化算法.;付晓东(1975-),男,博士,博士生导师,CCF高级会员,主要研究领域为服务计算,智能决策,大数据,软件工程.;贾连印(1978-),男,博士,副教授,CCF专业会员,主要研究领域为数据库,数据挖掘,信息检索,并行计算.

通讯作者:

贾连印,E-mail:JLianyin@163.com

中图分类号:

基金项目:

国家自然科学基金(61562054)


Classifier Chains Method Based on Association Rules and Topological Sequences
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    在分类器链方法中, 如何确定标签学习次序至关重要, 为此, 提出一种基于关联规则和拓扑序列的分类器链方法(TSECC). 首先结合频繁模式设计了一种基于强关联规则的标签依赖度量策略; 接下来通过标签间依赖关系构建有向无环图, 对图中所有顶点进行拓扑排序; 最后将得到的拓扑序列作为分类器链方法中标签的学习次序, 对每个标签的分类器依次迭代更新. 特别地, 为减少无标签依赖或标签依赖度较低的“孤独”标签对其余标签预测性能的影响, 将“孤独”标签排在拓扑序列之外, 利用二元关联模型训练. 在多种公共多标签数据集上的实验结果表明, TSECC能够有效提升分类性能.

    Abstract:

    The order of label learning is crucial to a classifier chains method. Therefore, this study proposes a classifier chains method based on the association rules and topological sequence (TSECC). Specifically, a measurement strategy for label dependencies based on strong association rules is designed by leveraging frequent patterns. Then, a directed acyclic graph is constructed according to the dependency relationships among the labels to topologically sort all the vertices in the graph. Finally, the topological sequence obtained is used as the order of label learning to iteratively update each label’s classifier successively. In particular, to reduce the impact of “lonely” labels with no or low label dependencies on the prediction performance on the other labels, TSECC excludes “lonely” labels out of the topological sequence and uses a binary relevance model to train them separately. Experimental results on a variety of public multi-label datasets show that TSECC can effectively improve classification performance.

    参考文献
    相似文献
    引证文献
引用本文

丁家满,周蜀杰,李润鑫,付晓东,贾连印.基于关联规则和拓扑序列的分类器链方法.软件学报,2023,34(9):4210-4224

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2021-09-23
  • 最后修改日期:2021-11-29
  • 录用日期:
  • 在线发布日期: 2022-12-22
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号