基于k个标记样本的弱监督学习框架
作者:
作者单位:

作者简介:

付治(1994-),男,湖北大悟人,学士,主要研究领域为机器学习,区块链;滕飞(1984-),女,博士,副教授,CCF专业会员,主要研究领域为云计算;王红军(1977-),男,博士,副研究员,CCF高级会员,主要研究领域为机器学习;张继(1993-),男,学士,主要研究领域为深度学习,机器学习;李天瑞(1969-),男,博士后,教授,博士生导师,CCF杰出会员,主要研究领域为智能信息处理,数据挖掘,云计算,大数据,粗糙集,粒计算.

通讯作者:

王红军,E-mail:wanghongjun@swjtu.edu.cn

中图分类号:

TP181

基金项目:

四川省国际科技创新合作重点项目(2019YFH0097)


Weakly Supervised Learning Framework Based on k Labeled Samples
Author:
Affiliation:

Fund Project:

Key Program for Int'l S&T Cooperation of Sichuan Province of China (2019YFH0097)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    聚类是机器学习领域中的一个研究热点,弱监督学习是半监督学习中一个重要的研究方向,有广泛的应用场景.在对聚类与弱监督学习的研究中,提出了一种基于k个标记样本的弱监督学习框架.该框架首先用聚类及聚类置信度实现了标记样本的扩展.其次,对受限玻尔兹曼机的能量函数进行改进,提出了基于k个标记样本的受限玻尔兹曼机学习模型.最后,完成了对该模型的推理并设计相关算法.为了完成对该框架和模型的检验,选择公开的数据集进行对比实验,实验结果表明,基于k个标记样本的弱监督学习框架实验效果较好.

    Abstract:

    Clustering is an active research topic in the field of machine learning. Weakly supervised learning is an important research direction in semi-supervised learning, which has wide range of application scenarios. In the research of clustering and weakly supervised learning, it is proposed that a framework of weakly supervised learning is based on k labeled samples. Firstly, the framework expands labeled samples by clustering and clustering confidence level. Secondly, the energy function of the restricted Boltzmann machine is improved, and a learning model of the restricted Boltzmann machine based on k labeled samples is proposed. Finally, the model of ratiocination and algorithm are proposed. In order to test the framework and the model, a series of public data sets are chosen for comparative experiments. The experimental results show that the proposed weakly supervised learning framework based on k labeled samples is more effective.

    参考文献
    相似文献
    引证文献
引用本文

付治,王红军,李天瑞,滕飞,张继.基于k个标记样本的弱监督学习框架.软件学报,2020,31(4):981-990

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2019-03-10
  • 最后修改日期:2019-07-11
  • 录用日期:
  • 在线发布日期: 2020-01-14
  • 出版日期: 2020-04-06
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号