融合选择提取与子类聚类的快速Shapelet发现算法
作者:
作者单位:

作者简介:

赵超(1995-),男,陕西兴平人,硕士,主要研究领域为时间序列数据分析,云计算;潘丽(1982-),女,博士,副教授,博士生导师,CCF专业会员,主要研究领域为云计算,云制造,市场导向资源分配;王腾江(1977-),男,硕士,主要研究领域为企业管理软件,企业大数据,移动互联网;嵇存(1989-),男,博士,讲师,CCF专业会员,主要研究领域为时间序列数据分析,企业服务计算,制造服务系统配;刘士军(1972-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为服务计算,企业服务计算和制造数据分析.

通讯作者:

刘士军,E-mail:lsj@sdu.edu.cn;潘丽,E-mail:panli@sdu.edu.cn

中图分类号:

基金项目:

国家自然科学基金(61872222);山东省重点研发计划(2018GGX101019);山东大学未来学者计划


Fast Shapelet Discovery Algorithm Combining Selective Extraction and Subclass Clustering
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61872222); Key Research and Development Program of Shandong Province (2018GGX101019); Young Scholars Program of Shandong University

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    基于Shapelet的时间序列分类算法具有可解释性,且分类准确率高、分类速度快.在这些算法中,Shapelet学习算法不依赖于单一分类器,能够学习出不在原始时间序列中的Shapelet,可以取得较高的分类准确率,同时还可以保证Shapelet发现和分类器构建同时完成;但如果产生的Shapelet过多,会增加依赖参数,导致训练时间太长,分类速度低,动态更新困难,且相似重复的Shapelet会降低分类的可解释性.提出一种选择性提取方法,用于更精准地选择Shapelet候选集,并改变学习方法以加速Shapelet学习过程;方法中提出了两个优化策略,通过对原始训练集采用时间序列聚类,可以得到原始时间序列中没有的Shapelet,同时在选择性提取算法中加入投票机制,以解决产生Shapelet过多的问题.实验表明,该算法在保持较高准确率的同时,可以显著地提高训练速度.

    Abstract:

    The time series classification algorithm based on Shapelet has the characteristics of interpretability, high classifica-tion accuracy and fast classification speed. Among these Shapelet-based algorithms, learning Shapelet algorithm does not rely on a single classifier, and Shapelet that is not in the original time series can be learned, which can achieve a high classification accuracy and ensure that Shapelet discovery and classifier construction are completed at the same time. However, if too many Shapelets are generated, it will increase the dependent parameters, resulting in too long training time, low classification speed, and difficult dynamic updates. And similar redundancy Shapelets will reduce the interpretability of the classification. This study proposes a new selective extraction algorithm to select Shapelet candidate set and change the learning method to accelerate the learning process of Shapelet and puts forward two optimization strategies. By using time series clustering for the original training set, Shapelets not in the original time series can be obtained. Meanwhile, a voting mechanism is added into the selective extraction algorithm to solve the problem of excessive Shapelet generation. Experiments show that the proposed algorithm can improve the training speed while maintaining high accuracy.

    参考文献
    相似文献
    引证文献
引用本文

赵超,王腾江,刘士军,潘丽,嵇存.融合选择提取与子类聚类的快速Shapelet发现算法.软件学报,2020,31(3):763-777

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2019-08-12
  • 最后修改日期:2019-11-25
  • 录用日期:
  • 在线发布日期: 2020-01-10
  • 出版日期: 2020-03-06
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号