主页期刊介绍编委会编辑部服务介绍道德声明在线审稿编委办公编辑办公English
2020-2021年专刊出版计划 微信服务介绍 最新一期:2020年第5期
     
在线出版
各期目录
纸质出版
分辑系列
论文检索
论文排行
综述文章
专刊文章
美文分享
各期封面
E-mail Alerts
RSS
旧版入口
中国科学院软件研究所
  
投稿指南 问题解答 下载区 收费标准 在线投稿
赵毅,曹宗雁,朱鹏,迟学斌.超级计算环境容错机制.软件学报,2013,24(S2):89-98
超级计算环境容错机制
Fault-Tolerant Mechanism in Supercomputing Environment
投稿时间:2012-08-05  修订日期:2013-07-22
DOI:
中文关键词:  超级计算  容错框架  检查点设置/回卷恢复  容错开销
英文关键词:supercomputing  fault-tolerant framework  checkpoint/rollback recovery  fault-tolerant overheads
基金项目:国家高技术研究发展计划(863)(2011AA01A205);中国科学院知识创新工程青年人才领域项目(CNIC_QN_10004);中国科学院青年创新促进会基金
作者单位E-mail
赵毅 中国科学院 计算机网络信息中心 超级计算中心, 北京 100190 zhaoyi@sccas.cn 
曹宗雁 中国科学院 计算机网络信息中心 超级计算中心, 北京 100190  
朱鹏 中国科学院 计算机网络信息中心 超级计算中心, 北京 100190  
迟学斌 中国科学院 计算机网络信息中心 超级计算中心, 北京 100190  
摘要点击次数: 1605
全文下载次数: 2162
中文摘要:
      中国科学院超级计算环境是整合了包括总中心、分中心和所级中心计算资源的3层架构超级计算环境.为提升超级计算环境的可靠性,提供稳定、可靠的计算服务,其容错机制的研究成为超级计算环境的一个研究重点.在对容错基本思想及各类计算机容错技术进行充分调研的基础上,提出一种适用于超级计算环境的容错框架,依据该框架给出了不同层次的容错方案,并对不同层次的容错开销进行了分析和比较,验证了不同层次容错方案对应用程序所带来的影响.
英文摘要:
      The three layers supercomputing environment of Chinese Academy of Sciences is built to integrate the computing resources of the head center in Beijing, eight regional centers and several campus-level centers. To enhance the reliability of the supercomputing environment and provide stable and reliable computing services, the fault-tolerant mechanism research has become a research priority of the supercomputing environment. In this paper, the fault-tolerant basic concepts and computer fault-tolerant technologies are introduced at first. Next, a fault-tolerant framework of the supercomputing environment is proposed. Then the fault-tolerant solutions of different levels based on the framework and the performance test results in Deepcomp 7000 are presented. Finally, the fault-tolerant overheads of different levels are compared and analyzed to verify the impact on the application.
HTML  下载PDF全文  查看/发表评论  下载PDF阅读器
 

京公网安备 11040202500064号

主办单位:中国科学院软件研究所 中国计算机学会 京ICP备05046678号-4
编辑部电话:+86-10-62562563 E-mail: jos@iscas.ac.cn
Copyright 中国科学院软件研究所《软件学报》版权所有 All Rights Reserved
本刊全文数据库版权所有,未经许可,不得转载,本刊保留追究法律责任的权利