主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2022年专刊出版计划 微信服务介绍 最新一期:2021年第2期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
杨世贵,王媛媛,刘韦辰,姜徐,赵明雄,方卉,杨宇,刘迪.基于强化学习的温度感知多处理器任务调度算法.软件学报,2021,32(8):3-0
基于强化学习的温度感知多处理器任务调度算法
Temperature-Aware Task Allocation on Multicore Based on Reinforcement Learning
投稿时间:2020-07-24  修订日期:2020-09-07
DOI:10.13328/j.cnki.jos.006190
中文关键词:  温度感知  多核系统  强化学习  Q-Learning
英文关键词:temperature-aware  multi-core system  reinforcement learning  Q-Learning
基金项目:国家自然科学基金(61902341)
作者单位E-mail
杨世贵 云南大学 软件学院, 云南 昆明  
王媛媛 中国科学院 信息工程研究所, 北京
中国科学院技术大学 网络空间安全学院
北京云南大学 软件学院, 云南 昆明 
 
刘韦辰 新加坡南洋理工大学 计算机科学与工程学院, 新加坡  
姜徐 东北大学 计算机科学与工程学院, 辽宁 沈阳  
赵明雄 云南大学 软件学院, 云南 昆明  
方卉 云南大学 软件学院, 云南 昆明  
杨宇 云南大学 软件学院, 云南 昆明  
刘迪 云南大学 软件学院, 云南 昆明
新加坡南洋理工大学 计算机科学与工程学院, 新加坡 
dliu@ynu.edu.cn 
摘要点击次数: 243
全文下载次数: 51
中文摘要:
      随着计算机中内核数量的增多,温度感知的多核任务调度算法成为计算机系统中的一个研究热点.近几年机器学习在各个领域展现出巨大的潜力,很多基于机器学习的系统温度管理研究工作应运而生.其中强化学习因其较强的自适应性,被广泛的运用于温度感知的任务调度算法中.然而目前基于强化学习的温度感知任务调度算法系统建模不够准确,很难做到温度、性能和复杂度的较好权衡.因此,本文提出一种新的基于强化学习的多核温度感知调度算法-ReLeTA,在新的算法中提出了更全面的状态建模方式和更加有效的奖励函数,从而帮助系统进一步降低温度.实验部分通过三个不同的真实计算机平台验证所提方法,实验结果表明了本文所提出方法的有效性以及可扩展性,相比现有方法ReLeTA可以更好的控制系统温度.
英文摘要:
      With the increase of the number of cores in computers, temperature-aware multi-core task scheduling algorithms have become a research hotspot in computer systems. In recent years, machine learning has shown great potential in various fields, and thus many work using machine learning techniques to manage system temperature have emerged. Among them, reinforcement learning is widely used for temperature-aware task scheduling algorithms due to its strong adaptability. However, the state-of-the-art temperature-aware task scheduling algorithms based on reinforcement learning do not effectively model the system, and it is difficult to achieve a good trade-off between temperature, performance and complexity. Therefore, this paper proposes a new multi-core temperature-aware scheduling algorithm based on reinforcement learning-ReLeTA. In the new algorithm, a more comprehensive state modeling method and a more effective reward function are proposed to help the system further reduce the temperature. We conduct experiments on three different real computer platforms. The experimental results show the effectiveness and scalability of the proposed method. Compared with existing methods, ReLeTA can control the system temperature better.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利