主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2021年第1期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
贾佳,杨学军,马亚青.静态分析面向异构系统的应用级Checkpoint 设置问题.软件学报,2013,24(6):1361-1375
静态分析面向异构系统的应用级Checkpoint 设置问题
Static Analysis for the Placement of Application-Level Checkpoints on Heterogeneous System
投稿时间:2011-08-19  修订日期:2012-01-15
DOI:10.3724/SP.J.1001.2013.04325
中文关键词:  应用级checkpointing  异构系统  通用GPU  同步检查点设置  异步检查点设置
英文关键词:application-level checkpointing  heterogeneous system  general purpose computation on GPU  synchronous checkpoint placement  asynchronous checkpoint placement
基金项目:国家自然科学基金(60921062, 61003087)
作者单位E-mail
贾佳 国防科学技术大学 计算机学院 并行与分布处理国家重点实验室, 湖南 长沙 410073
北京系统工程研究所, 北京 100101 
morpheux@163.com 
杨学军 国防科学技术大学 计算机学院 并行与分布处理国家重点实验室, 湖南 长沙 410073  
马亚青 中国北方车辆研究所, 北京 100072  
摘要点击次数: 2249
全文下载次数: 2834
中文摘要:
      应用级checkpointing 是一种在大规模科学计算领域中备受关注的容错技术,该技术由用户程序员选择在适当的地方保存关键数据,从而降低了容错开销.选择合适的checkpointing 位置、减小全局checkpoint 保存数据量是优化应用级checkpointing 技术的关键问题.对于近年来推出的带有通用GPU 的异构系统上的应用级checkpointing 技术,也同样面临上述问题.针对异构系统体系结构和程序特征,对面向异构系统的应用级checkpointing 技术的检查点设置进行了静态分析,提出两套不同机制的检查点设置方法:同步及异步检查点设置方法,并分别就checkpointing 优化设置问题对其进行数学建模和求解.最后,通过实验验证并评估了所提出的两种方法的性能.
英文摘要:
      Application-Level checkpointing is a widely concerned technique used in large-scale scientific computing fields, and programmers to choose the appropriate place to save crucial data: henceforth, the fault-tolerant overhead can be reduced. There are two key issues in adopting this technique: find the proper place and reduce the scale of global checkpoints saving datum. The same problem is encountered when emerging heterogeneous systems with general purpose computation on GPUs. Towards architecture of heterogeneous system and characterization of application, this paper performs static analysis for the checkpointing configurations and placements, and two novelty approaches are proposed: ‘synchronous checkpoint placement’ and the ‘asynchronous checkpoint placement’. The placement problem of checkpoints can be mathematically modeled and solved. Finally, their performances are evaluated via conducting experiments.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利