一种面向异构众核处理器的并行编译框架
作者:
作者单位:

作者简介:

李雁冰(1989-),男,甘肃陇西人,博士生,主要研究领域为高性能计算,并行编译优化;赵捷(1987-),男,博士,讲师,CCF专业会员,主要研究领域为高性能计算,并行编译优化;赵荣彩(1957-),男,博士,教授,博士生导师,CCF杰出会员,主要研究领域为高性能计算,并行编译,反编译;徐金龙(1985-),男,博士,讲师,主要研究领域为高性能计算,并行编译优化;韩林(1978-),男,博士,副教授,CCF专业会员,主要研究领域为高性能计算,并行编译优化;李颖颖(1984-),女,讲师,CCF专业会员,主要研究领域为高性能计算,并行编译优化.

通讯作者:

李雁冰,E-mail:li.yanbing@outlook.com

中图分类号:

基金项目:

国家自然科学基金(61702546);国家高技术研究发展计划(863)(2014AA01A300)


Parallelizing Compilation Framework for Heterogeneous Many-core Processors
Author:
Affiliation:

Fund Project:

National Natural Science Foundation of China (61702546); National High Technology Research and Development Program of China (863)(2014AA01A300)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    异构众核处理器是面向高性能计算领域处理器发展的重要趋势,但其更为复杂的体系结构使得编程难的问题更加突出.针对这一问题,基于开源编译器Open64,提出了一种面向异构众核处理器的并行编译框架,将程序自动转换为异构并行程序.该框架主要包括4个模块:任务划分模块用来识别适合进行加速计算的程序段,实现了嵌套循环的多维并行识别方法;数据布局模块完成数据在主存和SPM之间的布局,实现了数组边界分析和指针范围分析;传输优化模块实现了数据传输合并、传输外提、打包传输、数组转置等多种数据传输优化方法;收益评估模块在构建代价模型的基础上实现了一种动静结合的收益评估方法.并且,基于SW26010处理器,对该编译框架进行了实现,测试结果表明,该编译框架能够实现一些程序以面向异构众核结构的并行变换,且获得较好的加速效果.

    Abstract:

    Heterogeneous many-core processors become an important trend in high-performance computing area, but the issue that the sophisticated architecture complicates the programming is more significantly. To solve this problem, this study proposes a parallelizing compilation framework for heterogeneous many-core processors based on the open source Open64 compiler, automating the transformation from a sequential program to heterogeneous parallel code. The framework mainly comprises a work scheduling module that identifies the parallelizable regions and achieves a multi-dimensional parallelization recognition for nested loops; a data mapping module that maps data between the main memory and SPM and realizes array boundary analysis and pointer range analysis; a transmission optimizing module that implements optimizations by merging, hoisting and packaging data transmission, and transposing array; and a performance estimation module that proposes a dynamic-static hybrid method to analyze benefit based on the cost model for SW26010. The compilation framework is implemented on top of Sunway SW26010 processors, and experimental evaluations are conducted on numerous benchmarks. The experimental results show that the proposed framework can parallelize these applications and obtain a promising performance improvement on heterogeneous many-core platforms.

    参考文献
    相似文献
    引证文献
引用本文

李雁冰,赵荣彩,韩林,赵捷,徐金龙,李颖颖.一种面向异构众核处理器的并行编译框架.软件学报,2019,30(4):981-1001

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2016-12-13
  • 最后修改日期:2017-01-23
  • 录用日期:
  • 在线发布日期: 2019-04-01
  • 出版日期:
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号