首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种高可靠、高可用集群计算平台的设计与实现
引用本文:刘天田,龚念,杨升春.一种高可靠、高可用集群计算平台的设计与实现[J].舰船电子工程,2008,28(5):143-146.
作者姓名:刘天田  龚念  杨升春
作者单位:武汉数字工程研究所,武汉,430074
基金项目:"十一五"国防预研项目(编号:513160201)资助.
摘    要:高可靠与高可用已经成为高性能计算中不可或缺的要素.文章设计并实现的H3C集群系统应用对称式热备份(Symmetry Active/Active Replication)机制提高了集群关键服务的可靠性和可用性,使集群头节点(Head Node)在失效时仍能够提供不间断的服务.在结合LAM/MPI和BLCR检查点机制的基础上开发出高可用MPI运行环境HA/MPI,有效解决了并行计算过程中计算节点(Computing Node)失效的容错难题.

关 键 词:高可靠  高可用  对称式热备份  虚拟同步  LAM  检查点/恢复  进程迁移
修稿时间:2007年9月27日

Research and Implementation about a High Reliability and High AvailabilityCluster Computing Platform
Liu Tiantian,Gong Nian,Yang Shengchun.Research and Implementation about a High Reliability and High AvailabilityCluster Computing Platform[J].Ship Electronic Engineering,2008,28(5):143-146.
Authors:Liu Tiantian  Gong Nian  Yang Shengchun
Abstract:
Keywords:LAM
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号