基于强化学习的温度感知多核任务调度
作者:
作者单位:

作者简介:

杨世贵(1995-),男,硕士生,CCF学生会员,主要研究领域为基于强化学习的多核任务调度.
赵明雄(1988-),男,博士,副教授,CCF专业会员,主要研究领域为移动边缘计算,协作通信.
王媛媛(1998-),女,硕士生,主要研究领域为网络空间安全恶意文档检测.
方卉(1998-),女,硕士生,主要研究领域为神经架构搜索.
刘韦辰(1982-),男,博士,助理教授,博士生导师,CCF 专业会员,主要研究领域为Network-on-chip, Hardware-software codesign.
杨宇(1997-),男,硕士生,主要研究领域为基于强化学习的可调节网络.
姜徐(1987-),男,博士,副教授,博士生导师,CCF专业会员,主要研究领域为嵌入式实时系统.
刘迪(1984-),男,博士,讲师,CCF专业会员,主要研究领域为智能边缘系统.

通讯作者:

刘迪,E-mail:dliu@ynu.edu.cn

中图分类号:

TP316

基金项目:

国家自然科学基金(61902341)


Temperature-aware Task Scheduling on Multicores Based on Reinforcement Learning
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61902341)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    随着计算机中内核数量的增多,温度感知的多核任务调度算法成为计算机系统中的一个研究热点.近年来,机器学习在各个领域展现出巨大的潜力,很多基于机器学习的系统温度管理研究工作应运而生.其中,强化学习因其较强的自适应性,被广泛地运用于温度感知的任务调度算法中.然而,目前基于强化学习的温度感知任务调度算法系统建模不够准确,很难做到温度、性能和复杂度的较好权衡.因此,提出一种基于强化学习的多核温度感知调度算法——ReLeTA.在该算法中提出了更全面的状态建模方式和更加有效的奖励函数,从而帮助系统进一步降低温度.实验部分通过3个不同的真实计算机平台验证该方法,实验结果表明了该方法的有效性以及可扩展性,与现有方法相比,ReLeTA可以更好地控制系统温度.

    Abstract:

    With the increase of the number of cores in computers, temperature-aware multi-core task scheduling algorithms have become a research hotspot in computer systems. In recent years, machine learning has shown great potential in various fields, and thus many work using machine learning techniques to manage system temperature have emerged. Among them, reinforcement learning is widely used for temperature-aware task scheduling algorithms due to its strong adaptability. However, the state-of-the-art temperature-aware task scheduling algorithms based on reinforcement learning do not effectively model the system, and it is difficult to achieve a better trade-off among temperature, performance, and complexity. Therefore, this study proposes a new multi-core temperature-aware scheduling algorithm based on reinforcement learning-ReLeTA. In the new algorithm, a more comprehensive state modeling method and a more effective reward function are proposed to help the system further reduce the temperature. Experiments are conducted on three different real computer platforms. The experimental results show the effectiveness and scalability of the proposed method. Compared with existing methods, ReLeTA can control the system temperature better.

    参考文献
    相似文献
    引证文献
引用本文

杨世贵,王媛媛,刘韦辰,姜徐,赵明雄,方卉,杨宇,刘迪.基于强化学习的温度感知多核任务调度.软件学报,2021,32(8):2408-2424

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2020-07-24
  • 最后修改日期:2020-09-07
  • 录用日期:
  • 在线发布日期: 2021-02-07
  • 出版日期: 2021-08-06
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号