主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2020年第10期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
李雁冰,赵荣彩,韩林,赵捷,徐金龙,李颖颖.一种面向异构众核处理器的并行编译框架.软件学报,2019,30(4):981-1001
一种面向异构众核处理器的并行编译框架
Parallelizing Compilation Framework for Heterogeneous Many-core Processors
投稿时间:2016-12-13  修订日期:2017-01-23
DOI:10.13328/j.cnki.jos.005370
中文关键词:  异构众核处理器  SW26010  并行编译  数据传输优化  OpenACC
英文关键词:heterogeneous many-core processor  SW26010  parallelizing compilation  data transmission optimizing  OpenACC
基金项目:国家自然科学基金(61702546);国家高技术研究发展计划(863)(2014AA01A300)
作者单位E-mail
李雁冰 数学工程与先进计算国家重点实验室, 河南 郑州 450001 li.yanbing@outlook.com 
赵荣彩 数学工程与先进计算国家重点实验室, 河南 郑州 450001  
韩林 数学工程与先进计算国家重点实验室, 河南 郑州 450001  
赵捷 数学工程与先进计算国家重点实验室, 河南 郑州 450001  
徐金龙 数学工程与先进计算国家重点实验室, 河南 郑州 450001  
李颖颖 数学工程与先进计算国家重点实验室, 河南 郑州 450001  
摘要点击次数: 1192
全文下载次数: 1238
中文摘要:
      异构众核处理器是面向高性能计算领域处理器发展的重要趋势,但其更为复杂的体系结构使得编程难的问题更加突出.针对这一问题,基于开源编译器Open64,提出了一种面向异构众核处理器的并行编译框架,将程序自动转换为异构并行程序.该框架主要包括4个模块:任务划分模块用来识别适合进行加速计算的程序段,实现了嵌套循环的多维并行识别方法;数据布局模块完成数据在主存和SPM之间的布局,实现了数组边界分析和指针范围分析;传输优化模块实现了数据传输合并、传输外提、打包传输、数组转置等多种数据传输优化方法;收益评估模块在构建代价模型的基础上实现了一种动静结合的收益评估方法.并且,基于SW26010处理器,对该编译框架进行了实现,测试结果表明,该编译框架能够实现一些程序以面向异构众核结构的并行变换,且获得较好的加速效果.
英文摘要:
      Heterogeneous many-core processors become an important trend in high-performance computing area, but the issue that the sophisticated architecture complicates the programming is more significantly. To solve this problem, this study proposes a parallelizing compilation framework for heterogeneous many-core processors based on the open source Open64 compiler, automating the transformation from a sequential program to heterogeneous parallel code. The framework mainly comprises a work scheduling module that identifies the parallelizable regions and achieves a multi-dimensional parallelization recognition for nested loops; a data mapping module that maps data between the main memory and SPM and realizes array boundary analysis and pointer range analysis; a transmission optimizing module that implements optimizations by merging, hoisting and packaging data transmission, and transposing array; and a performance estimation module that proposes a dynamic-static hybrid method to analyze benefit based on the cost model for SW26010. The compilation framework is implemented on top of Sunway SW26010 processors, and experimental evaluations are conducted on numerous benchmarks. The experimental results show that the proposed framework can parallelize these applications and obtain a promising performance improvement on heterogeneous many-core platforms.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利