申威26010众核处理器上一维FFT实现与优化
CSTR:
作者:
作者单位:

作者简介:

赵玉文(1987-),女,助理研究员,CCF专业会员,主要研究领域为高性能扩展数学库,并行计算.
敖玉龙(1990-),男,博士,CCF专业会员,主要研究领域为高性能计算,大规模并行.
杨超(1979-),男,博士,教授,博士生导师,CCF高级会员,主要研究领域为高性能计算,科学与工程计算.
刘芳芳(1982-),女,高级工程师,CCF专业会员,主要研究领域为高性能扩展数学库,稀疏迭代解法器,异构众核并行.
尹万旺(1980-),男,助理研究员,主要研究领域为高性能计算及其应用.
林蓉芬(1984-),女,工程师,主要研究领域为高性能计算及其应用.

通讯作者:

杨超,E-mail:chao_yang@pku.edu.cn

中图分类号:

基金项目:

国家重点研发计划(2016YFB0200603);北京市自然科学基金(JQ18001)


General Implementation of 1-D FFT on the Sunway 26010 Processor
Author:
Affiliation:

Fund Project:

National Key Research and Development Program of China (2016YFB0200603); Beijing Natural Science Foundation, China (JQ18001)

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    根据申威26010众核处理器的特点提出了基于两层分解的一维FFT众核并行算法.该算法基于迭代的Stockham FFT计算框架和Cooley-Tukey FFT算法,将大规模FFT分解成一系列的小规模FFT来计算,并通过设计合理的任务划分方式、寄存器通信、双缓冲以及SIMD向量化等与计算平台相关的优化方法来提高FFT的计算性能.最后对所提出算法的性能进行了测试,相比于单主核上运行的FFTW3.3.4库,获得了平均44.53x的加速比,最高加速比可达56.33x,且其带宽利用率最高可达83.45%.

    Abstract:

    A two-layer decomposition 1-D FFT multi-core parallel algorithm is proposed according to the characteristics of Sunway 26010 processor. It is based on the iterative Stockholm FFT framework and the Cooley-Tukey FFT algorithm. It decomposes large scale FFT into a series of small scale FFTs. It improves the performance of the algorithm by means of designing reasonable task partitioning, register communication, double-buffering, and SIMD vectorization. Finally, the performance of the two-layer decomposition 1-D FFT multi-core parallel algorithm is tested. It achieves an average speedup of 44.53x, with a maximum speedup of up to 56.33x, and a maximum bandwidth utilization of 83.45%, compared to FFTW3.3.4 library running on the single MPE.

    参考文献
    相似文献
    引证文献
引用本文

赵玉文,敖玉龙,杨超,刘芳芳,尹万旺,林蓉芬.申威26010众核处理器上一维FFT实现与优化.软件学报,2020,31(10):3184-3196

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2018-01-22
  • 最后修改日期:2018-09-20
  • 录用日期:
  • 在线发布日期: 2020-10-12
  • 出版日期: 2020-10-06
文章二维码
您是第位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京市海淀区中关村南四街4号,邮政编码:100190
电话:010-62562563 传真:010-62562533 Email:jos@iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号