大庆高性能计算解决方案_第1页
大庆高性能计算解决方案_第2页
大庆高性能计算解决方案_第3页
大庆高性能计算解决方案_第4页
大庆高性能计算解决方案_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录...................................................................

1蜩..................................................................................4

1.1建设背景...........................................................................................................................4

1.2设计范围...........................................................................................................................4

L3总体设计原则......................................................................................................................4

2系统平台削.........................................................................6

2.1项目需求............................................................................................................................6

2.2设计思想...........................................................................................................................8

2.3云存储系统方案..................................................................................................................8

2.4系统优势和特点.................................................................................................................9

2.5作业调度系统方案...........................................................................................................11

3系统期............................................................................13

3.1cStor系统基本组成.........................................................................................................13

3.2cStor系统功能描述.........................................................................................................15

3.3Jobkeeper系统基................................................................................................23

4系统安全性i妣......................................................................27

4.1安全保障体系框架.........................................................................................................27

4.2云计算平台的多级信任保护........................................................29

4.3基于多级信任保护的访问控制......................................................36

4.4云平台安全审计..................................................................39

5工作机制............................................................................44

5.1数据写入机制....................................................................44

5.2数据读出机制....................................................................45

6关键技术............................................................................47

6.1负载自动均衡技术...............................................................47

6.2高速并发访问技术...............................................................47

6.3高可靠性保证技术...............................................................48

6.4高可用技术.....................................................................48

6.5故障恢复技术....................................................................49

7接口描述............................................................................50

7.1POS1X通用文件系统接口访问......................................................50

7.2应用程序API接口调用............................................................50

8本地容错与诊断技术..................................................................51

8.1cStor高可靠性....................................................................51

8.2cStor数据完整性..................................................................52

83cStor快照技术....................................................................52

8.4Jopkeeper故障处理技术..........................................................52

9魏容灾与恢复技术..................................................................54

9.1cStor数据备份与恢复系统功能.....................................................54

9.2cStor异地文件恢复..............................................................55

1概述

1.1建设背景

云存储平台与作业调度为本次高性能计算总体解决方案的一部分。主要针对海量的

数据的集中存储、共享、计算与挖掘,建立一套具有高可靠、可在线弹性伸缩,满足高

吞吐量并发访问需求的云存储与计算平台。为数据存储?口高效计算提供便捷、统一管理

和高效应用的基础平台支撑。

1.2设计范围

本技术解决方案针对海量数据集中存储、共享与计算,提供从系统软硬件技术架构、

原理、硬件选型、网络接入以及软件与应用之间的接口等方面的全面设计阐述。

1.3总体设计原则

针对本次工程的实际情况,充分考虑系统建设的建设发展需求,以实现系统统一管

理、高效应用、平滑扩展为目标,以"先进、安全、成熟、开放、经济"为总体设计原

则。

1.3.1先进性原则

在系统总体方案设计时采用业界先进的方案和技术,以确保一定时间内不落后。选

择实用性强产品,模块化结构设计,既可满足当前的需要又可实现今后系统发展平滑扩

展。

1.3.2安全性原则

数据是业务系统核心应用的最终保障,不但要保证整套系统能够7X24运行,而且

存储系统必须有高可用性,以保证应用系统对数据的随时存取。同时配置安全的备份系

统,对应用数据进行更加安全的数据保护,降低人为操作失误或病毒袭击给系统造成的

数据丢失。

在进行系统设计时,充分考虑数据高可靠存储,采用高度可靠的软硬件容错设计,

进行有效的安全访问控制,实现故障屏蔽、自动冗余重建等智能化安全可靠措施,提供

统一的系统管理和监控平台,进行有效的故障定位、预警。

1.3.3成熟性原则

为确保整个系统能够稳定工作,软件平台将使用先进、完善、易于管理和稳定可靠

的云存储资源管理系统,对于与应用的集成接口,提供统一的通用稳定访问接口。

1.3.4开放性原则

系统建设具有开放性的标准体系,提供符合POSIX标准的通用文件系统访问接口,

开放的应用API编程接口,提供人性化的应用和管理界面,以满足用户需求。遵循规

范的通用接口标准,使全系统中的硬件、通信、软件、操作平台之间的互联共享。充分

考虑系统的升级和维护问题,维护采用在线式的,即在系统不停止工作的情况下,可以

更换单元备件。系统的维护和升级操作由系统管理员即可完成。

1.3.5经济性原则

现有业务系统存储数据量较大,且数据的增长速度较快。因此在建设系统存储架构

时,应从长远的角度考虑,建设一个长期的存储架构,除了可以应对存储硬件设备的升

级速度外,还必须考虑到对前期存储设备的投资保护,在保证不断提供功能和性能提高

的同时,存储架构在较长的时间内能够保持相对稳定。结合先进的云平台技术架构优势,

根据本次项目建设的实际容量需求设计,同时充分考虑应用发展需求,实现系统可弹性

在线平滑升级。通过软件实现在较廉价普通服务器上实现高度容错,同时能够在较低冗

余度的情况下实现高度可靠容错,大大节约和降低系统建设的硬件成本。

2系统平台设计

2.1项目需求

2.1.1容量需求

针对本次建设实际数据容量,一期拟建设48TB裸容量数据存储平台,主要存储数

据。

2.1.2吞吐量需求

为满足多用户或应用整体吞吐带宽需要,确保数据访问流畅,系统需提供多用户或

应用并发访问高吞吐带宽设计,系统能够有效利用网络带宽,性能可通过规模增加实现

平滑增长。

2.1.3扩展性需求

未来根据业务应用的变化和发展,需要快速实施系统资源的升级,可以在业务服务

不间断的状态下平滑扩展,不会导致架构发生根本性变化,为不断产生和变化的业务需

求提供持续的支持,支持业务系统的快速整合和部署对核心系统基础架构的特别要求。

2.1.4低成本需求

要求系统能够以低硬件成本、低维护成本实现高可靠高性能应用要求,充分提高资

源利用率,简化管理,并能灵活、可持续扩展。

2.1.5可维护性需求

要求系统具有自适应管理能力,安装、维护、升级简易方便,提供统一易用的WEB

配置管理监控平台,实现智能化管理。

2.1.6接口需求

要求能够提供通用的文件系统接口,方便用户及应用系统访问,减少与应用集成或

开发工作量,实现系统快速部署与集成。

2.2设计思想

采用业界成熟先进的云平台架构思想,采用软件实现对大量普通商用服务器存储空

间资源进行虚拟化整合,实现软硬件故障高度容错,将系统控制流与数据流分离,同时

使得数据在逻辑上集中、物理上分散,每台服务器同时对外提供服务,以达到多并发高

吞吐量的性能要求,采用自注册机制、故障自动屏蔽、自动冗余重建技术实现系统自我

维护和平滑扩展,系统服务7x24小时不间断。系统采用先进的编解码容错技术,可根

据数据可靠性要求设置适当的冗余编解码策略进行系统部署,可以以极小的磁盘和硬件

冗余度,实现高度的可靠性数据容错。

2.3云存储系统方案

采用业界已经成熟的cStor云存储资源管理系统,在多台普通商用服务器上构建高

性能高可靠云存储系统,作为本次云媒资系统云数据中心'存储平台,其应用部署示意图

如下图所示。

3

节点

/服务

节点

存偌

点2

务节

点/朦

储节

1存

节点

/■务

节点

存储

n

节点

/服务

节点

存储

示意图

统部署

管理系

储资源

r云存

cSto

势和特

系统优

2.4

附加

是高

软件

术和

有技

中专

统,其

的系

结合

件相

与硬

软件

一套

统是

储系

r云存

cSto

联网

、互

电信

电、

、广

安防

合(如

用场

的应

数据

大量

存储

需要

用于

泛应

以广

分,可

值部

优势

技术

如下

统有

储系

统存

比传

统相

该系

域X

等领

银行

可靠

1高度

2.4.

的1:1

先进

采用

,数据

点上

储节

的存

不同

储在

块存

被分

数据

构,

云架

采用

系统

存储

容错机制进行容错,可在任靛坏一个存储服务器节点的情况下实现数据完整可靠,系

统对外存储访问服务不间断。

云存储的管理节点采用了主备双机镜像热备的高可用机制,在主管理节点出现故障

时,备管理节点自动接替主管理节点的工作,成为新的主管理节点,待故障节点修复并

重启服务后,它则成为新的售管理节点,保障系统的7x24小时不间断服务。

2.4.2优异性能

cStor采用控制流与数据流分离的技术,数据的存储或读取实际上是与各个存储节

点上并行读写,这样随着存储节点数目的增多,整个系统的吞吐量和10性能将呈线性

增长。

同时,cStor采用负载均衡技术,自动均衡各服务器负载,使得各存储节点的性能

调节到最高,实现资源优化配置。

2.4.3无限容量

系统容量仅受限于卷管理服务器内存,可支撑的容量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论