面向流数据分类的在线学习综述
作者:
作者单位:

作者简介:

翟婷婷(1988-),女,河南济源人,博士,讲师,主要研究领域为机器学习,模式识别;朱俊武(1972-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为知识工程,本体论,机制设计,云计算;高阳(1972-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为大数据分析,机器学习,多智能体系统,视频/图像处理.

通讯作者:

zhtt.go@gmail.com

基金项目:

国家重点研发计划(2017YFB0702600,2017YFB0702601);国家自然科学基金(61906165,61432008,61872313);江苏省高等学校自然科学研究项目(19KJB520064)


Survey of Online Learning Algorithms for Streaming Data Classification
Author:
Affiliation:

Fund Project:

National Key Research and Development Program of China (2017YFB0702600, 2017YFB0702601); National Natural Science Foundation of China (61906165, 61432008, 61872313); Natural Science Foundation of the Jiangsu Higher Education Institutions of China (19KJB520064)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
    摘要:

    流数据分类旨在从连续不断到达的流式数据中增量学习一个从输入变量到类标变量的映射函数,以便对随时到达的测试数据进行准确分类.在线学习范式作为一种增量式的机器学习技术,是流数据分类的有效工具.主要从在线学习的角度对流数据分类算法的研究现状进行综述.具体地,首先介绍在线学习的基本框架和性能评估方法,然后着重介绍在线学习算法在一般流数据上的工作现状,在高维流数据上解决"维度诅咒"问题的工作现状,以及在演化流数据上处理"概念漂移"问题的工作现状,最后讨论高维和演化流数据分类未来仍然存在的挑战和亟待研究的方向.

    Abstract:

    The objective of streaming data classification is to learn incrementally a decision function that maps input variables to a label variable, from continuously arriving streaming data, so as to accurately classify the test data that may arrive anytime. The online learning paradigm, as an incremental machine learning technology, is an effective tool for classification of streaming data. This paper mainly summarizes, from the perspective of online learning, the recent development of algorithms for streaming data classification. Specifically, the basic framework and the performance evaluation methodology of online learning are first introduced. Then, the latest development of online learning algorithms for general streaming data, for alleviating the "curse of dimensionality" problem in high-dimensional streaming data, and for resolving the "concept drifting" problem in evolving streaming data are reviewed respectively. Finally, future challenges and promising research directions for classification of high-dimensional and evolving streaming data are also discussed.

    参考文献
    相似文献
    引证文献
引用本文

翟婷婷,高阳,朱俊武.面向流数据分类的在线学习综述.软件学报,2020,31(4):912-931

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
历史
  • 收稿日期:2019-02-22
  • 最后修改日期:2019-07-11
  • 录用日期:
  • 在线发布日期: 2020-01-14
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号