FusionSphere虚拟化数据中心方案建议书_第1页
FusionSphere虚拟化数据中心方案建议书_第2页
FusionSphere虚拟化数据中心方案建议书_第3页
FusionSphere虚拟化数据中心方案建议书_第4页
FusionSphere虚拟化数据中心方案建议书_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 DOCPROPERTY DocumentName 虚拟数据中心技术白皮书华为专有和保密信息 版权所有 华为技术有限公司文档版本 DOCPROPERTY DocumentVersion V1.0 ( DOCPROPERTY ReleaseDate 2014-09-05)华为FusionSphere虚拟化数据中心方案建议书Page 前 言概述本文档介绍数据中心虚拟化解决方案技术建议。读者对象本文档主要适用于以下工程师:数据中心虚拟化解决方案工程师中使用符号约定在本文中可能出现下列标志,它们所代表的含义如下。符号说明用于警示紧急的危险情形,若不避免,将会导致人员死亡或严重的人身伤害。用于警示潜在的

2、危险情形,若不避免,可能会导致人员死亡或严重的人身伤害。用于警示潜在的危险情形,若不避免,可能会导致中度或轻微的人身伤害。用于传递设备或环境安全警示信息,若不避免,可能会导致设备损坏、数据丢失、设备性能降低或其它不可预知的结果。“注意”不涉及人身伤害。用于突出重要/关键信息、最佳实践和小窍门等。“说明”不是安全警示信息,不涉及人身、设备及环境伤害信息。 STYLEREF Contents 目 录 DOCPROPERTY DocumentName 虚拟数据中心技术白皮书目 录 TOC o 1-1 h z t 标题 2,2,标题 3,3,Appendix heading 2,2,Appendix

3、heading 3,3 HYPERLINK l _Toc491980614 1.前 言 错误!文档中没有指定样式的文字。 STYLEREF 7 错误!文档中没有指定样式的文字。 DOCPROPERTY Product&Project Name DOCPROPERTY DocumentName 虚拟数据中心技术白皮书项目概述项目背景提示介绍虚拟化数据中心项目背景样例过去几十年,信息化经历了大型机时代的终端-主机模式(T-S模式),个人PC时代的客户机-服务器模式(C-S模式),发展到互联网时代的浏览器-服务器模式(B-S模式)。在过去的二十年里,互联网将全世界的单位与个人连接了起来,实现了资源共

4、享,这也深刻地影响着各种业务形态及每个人的日常生活。新时代里,用户对互联网内容的贡献和互动空前增加,软件和资源更多地以服务的形式通过互联网被发布和访问, “像用水用电一样使用IT资源”这种新时代的服务模式对数据中心的建设有了更高的要求,决定了传统的数据中心建设模式和方案不再能满足新时代创新应用的需求,导致了新老技术的整合、成熟和创新,这就是“云计算”技术。云计算并不是突兀出现的,云计算是在现有IT技术和业务应用基础上的升华,也是社会分工的必然。尤其是进入20世纪90年代以来,随着信息技术特别是互联网技术的飞速发展,信息化成为了促进社会发展的重要因素之一,一些新技术的应用和新学科的产生,使得应用

5、领域更加广泛和深入,XXX信息化建设有新的发展机遇。时至今日,XXX领域云计算技术已在世界范围内广泛应用,并且发挥着越来越重要的作用。XXX领域云计算的发展已经成为当代信息化的最重要的领域之一。根据联合国教科文组织在2000年对62个国家(39个发展中国家,23个发达国家)所进行的调查,89%的国家都在不同程度上着手推动电子政务的发展,并将其列为国家计划(以电子政务为例)。我国电子政务的发展是以我国政府信息化的进程为背景的,2000年至今,电子政务发展是从政府上网走向电子政务全面建设。在电子政务的推进过程中,各种问题也渐渐暴露出来,困扰着电子政务的管理部门,主要表现为:由于缺乏统一规划,各部门

6、电子政务建设自成一体,因此,不管实际业务需求的多少,业务量的大小,功能的强弱,都必须进行机房和配套机房环境的建设,购置网络设备、服务器、数据库等一整套的软硬件,各部门需要自行管理和维护这些基础设施,这种小而全分散建设导致资金投入大,资源利用效率低,管理成本高,不利于信息资源开发利用,制约了电子政务的发展。基于XXXX的现状和存在的问题,华为提出了基于SOA和云计算理念和技术的数据中心解决方案,引入到XXXX数据中心的规划和建设中,解决传统XXXX数据中心运维管理成本高、资源利用率低、业务部署上线周期长等难点。面临的风险和挑战提示介绍当前数据中心风险和挑战样例XXX现有数据中心机房,管理着XX、

7、XX、XX等各种全局性应用。由于近几年信息化要求不断提高以及信息化建设投入不断增加,XXX对各种信息化系统的依赖不断加强,各项工作的紧迫性和连续性较高,因此任何情况下,XXX数据中心的运行都必须保持畅通、不间断。但目前XXX数据中心的状态离畅通和不间断运行还有一定差距。基于原有的数据中心架构和运维模式,XXX IT基础系统的发展面临着如下问题:(1)系统建设周期长、IT投资成本高随着业务的不断发展,业务系统建设需求增多,但是基于原有的建设和运维模式,各单位为了满足自身的信息化建设需求,各自采购服务器、存储、安全等硬件设备,导致烟囱式建设现状,重复投资造成了极大的资源浪费。同时,各应用系统的服务

8、器工作负载不一,服务器资源不能被合理、有效利用。根据对行业IT系统情况的调研发现,传统的应用系统大多数采用每一个应用系统配备专属服务器,大部分服务器资源利用率在5-25%左右,大量的IT资源利用率低下,但总拥有成本却在不断上升。由于基于原有的硬件部署方式无法对资源进行共享和调配,做到资源合理有效利用,造成了的设备资源浪费,能耗高,占用机房面积大,管理繁杂并且故障率极高,同时由此带来硬件投资成本、部署成本都在不断上升。(2)空间环境受到挑战、运维管理成本高由于业务系统的不断发展,逐渐无法满足业务系统的空间需求、功耗需求、散热需求;空间投资和管理维护成本迅速膨胀:服务器、配件、软件的不断购买,机房

9、扩建,制冷系统改造,电费持续升高,IT固定资产日益庞大、硬件种类繁多,IT运维管理成本不断增长,对提倡绿色环保、低碳经济、运维管理成本控制是一个巨大的挑战。(3)业务连续性保障差、数据安全性弱XXXX系统的应用多是XXXX的基础信息化工具,经过常年的建设和使用,积累了基于实战应用的规范化工作流程和大量丰富完整的数据,XXXX工作逐渐形成依托信息化的模式,因此对应用系统稳定不间断运行和数据安全保护有着极高的需求。但是随着工作中越来越多的依赖IT系统的协助,应用系统的不间断持续运转的需求就越来越强烈。硬件和软件故障、系统单点故障、自然灾害,甚至计划维护所导致的停机时间,都有可能影响到业务运行和数据

10、安全,如何保证业务连续性和数据安全性,是当前IT系统的一个巨大的挑战。(4)业务部署流程环节多、上线周期长随着XXXX企业的发展,不断需要上线新的业务,就需要购置新的服务器;购置服务器和部署业务系统需要计划部门和采购部门、维护部门等相关部门的参与,各个部门的进度和流程不一致,经常导致业务部署流程环节多、上线周期长。通过IT系统基础设施逐步云化部署,基于云平台虚拟化技术,实现计算存储网络的虚拟化、资源共享、灵活分配,实现业务服务器的整合和调配,集中化以及基于策略的管理,以适应快速发展的业务需求,降低IT总持有成本,聚焦核心业务发展。因此,云平台建设势在必行。项目方案设计原则提示介绍该方案的设计原

11、则样例可靠性及可用性系统的可靠性包括整体可靠性、数据可靠性和单一设备可靠性三个方面。云平台的分布式架构,从整体系统上提高可靠性,降低系统对单设备可靠性的要求。系统的可用性是通过冗余、高可用集群、应用与底层设备松耦合等特性来体现,从硬件设备冗余、链路冗余、应用容错等方面充分保证整体系统的可用性。安全性遵循国家电子政务安全等保标准,设计安全防护体系保证电子政务数据中心安全。保障网络安全、主机安全、应用安全、数据保安全、安全管理。成熟性从架构设计、软硬件选型和IT管理三个方面设计电子政务数据中心解决方案,采用经过大规模商用实践检验的架构方案和软硬件产品选型,采用符合ITIL规范的IT管理方案,保障方

12、案的成熟性。先进性合理利用云计算的技术先进性和理念先进性,突出云计算给客户带来的价值。采用虚拟化、资源动态部署等先进技术与模式,并与电子政务业务相结合,确保先进技术与模式应用的有效与适用。可扩展性支撑数据中心的资源需要根据业务应用工作负荷需求进行弹性伸缩,IT基础架构应与业务系统松耦合,这样,在业务系统进行容量扩展时,只需增加相应数量的IT硬件设备,即可实现系统的灵活扩展。给客户带来的价值提示介绍该方案的设计原则样例突破传统,战略转型,聚焦公司核心业务发展传统系统建设周期长、IT投资成本高,运维成本高,通过云平台建设,利用云平台统一设备管理,低维护成本,易扩展性,资源部署周期短等优势,面向全业

13、务竞争,把公司投入到传统IT建设与维护的核心资源释放出来,聚焦公司主流业务。响应国家节能减排,优化资源利用,建设绿色IT云平台易扩展、设备易替换,提高资源复用率,避免传统IT烟囱式发展,资源利用率低的现状,能够有效地实现节能减排。精简IT资源,降低运维成本利用云平台统一资源管理,统一的运维管理平台,降低维护维护成本,从降成本中贡献净利润。灵活应对业务和IT的需要,缩短部署周期云平台一次规划,多次(按需)部署,降低规划难度,规避投资风险,柔性十足,便利的扩减容机制,可随时调整以匹配业务或IT的变化等。利用云平台的高可靠性,确保核心业务的连续性通过云平台HA、热迁移功能,能够有效减少设备故障时间,

14、确保核心业务的连续性,避免传统IT,单点故障导致的业务不可用。项目需求分析项目现状分析目前,XXXX的业务规模已经发展得非常庞大,信息化平台已日益变成业务运营与管理的重要支撑平台。在信息化平台建设的过程中,各个应用系统的业务之间的联系非常紧密,流程自动化程度非常高。因此在信息化高速发展的形势下,急需形成统一完备的综合技术集成体系,能提供一体化的数据存储共享,应用集成和统一展现能力。随着信息化建设和应用工作的进一步深入,对信息网络传输能力,数据中心存储能力和处理能力提出了更高要求,为支撑流程集成和业务应用的深入融合,需要提供统一高效的流程处理能力,消息转换能力以及数据交换能力;需要建立和完善我局

15、统一的综合技术平台体系,涵盖数据采集,存储,共享,交互和展现能力。各大应用系统也都存在不同的技术标准,没有建立标准的统一编程模型,系统尚存在功能单一,开放性与扩展性较弱的特点。通过对服务器硬件的现状了解,目前应用系统服务器表现为品牌及型号繁多,且购置年代和配置都存在一定的差异。随着业务规模的发展,应用系统的数量不断增加,硬件设备也在不断增加,机房建设、相应配套设施成本在不断增加,系统升级、硬件维护等运维管理的工作量和难度逐步加大。而且,应用系统与底层硬件之间形成了“烟囱”结构,软硬件之间的紧耦合关系导致资源利用率和效率降低,无法满足业务快速增长所需的高可靠性。通过对应用情况调研结果的分析,发现

16、现有PC服务器CPU和内存的使用率不高,空余的资源得不到释放,并且故障率高,系统得不到有力的保障。存在的主要问题可以归纳为:服务器的物理分布不集中,各个部门都有自己独立运行的服务器。服务器系统的环境比较复杂,表现为设备数量多,故障点多,产品不统一,缺乏规范性,运维管理的工作量和难度大。各个系统重复投资和建设,建设成本高,技术上没有统一规范和标准。没有实现资源共享,服务器资源使用率低,难以集中管理和使用。不能根据实际需要和业务变化动态调整资源和快速扩展,系统的灵活性和扩展性差。部分服务器存在单点故障隐患。有些服务器的高可用性配置不合理,造成资源闲置状态和成本过高。高性能服务器占大部分,有极小部分

17、服务器处于淘汰的边缘。机房建设,UPS等相应配套设施,服务器耗电,机房制冷等费用不断增加。通过调研发现现阶段的设备采购通常是由业务系统提出相应的需求,以业务系统为核心进行项目建设过程中完成硬件设备采购,此类采购方式存在以下缺陷:1.业务开发人员通常难以准确预估实际的负载增长率及突发情况,为保守起见通常都会在硬件资源申报的过程中留有较高的裕量势必会造成资源浪费。2.硬件采购跟随各业务系统的上线或变更,呈离散状态递增,难以实现统一规划与管理。总体需求分析虚拟化数据中心计算需求XXXX数据中心需要支持异构的计算和存储环境,以及虚拟化平台,包括华为和业界主流厂商的服务器和存储设备、华为云操作系统Fus

18、ionSphere和其它虚拟化平台(VMware)。XXXX数据中心需要支持根据业务应用的不同特点(大计算量应用系统、高I/O访问应用系统、高并发访问应用系统以及对资源要求一般的应用系统)采用合理的物理服务器(2路、4路X86服务器或UNIX服务器)、虚拟机、SAN/NAS存储,能根据业务应用的特点对服务器或存储进行配置满足应用对计算和存储的需要(CPU、内存、网络I/O、存储I/O);计算平台需要和IT管理平台联动实现对虚拟计算资源的自动部署和分配。虚拟化数据中心网络需求在构建XXXX企业虚拟化数据中心时需要搭建三张物理隔离的网络,分别是管理平面网络、存储平面网络和业务平面网络。这三张网络平

19、面可以承载在相同或者不同的网卡之上,三张网之间的数据交互必须通过VLAN或其它数据交换硬件设备(网卡)来保证内网的安全性及数据交换的管理和控制。XXXX企业内、外网需根据国家信息安全等级保护管理办法、涉及国家秘密的计算机信息系统分级保护技术要求、电子政务信息安全等级保护实施指南(试行)的要求进行安全域的划分,XXXX企业内外网需划分二级、三级安全域,各安全域能根据业务需求灵活划分业务功能域。不同级别安全域之间需根据安全等级保护要求进行逻辑隔离或物理隔离,不能互访。由于数据中心需要支持IT服务、企业服务和公共服务,因此数据中心网络需要支持如下多种类型的接入用户:互联网用户:主要是个人用户和企业人

20、员通过互联网访问数据中心来获取公共服务;XXXX企业用户(包括办公网用户、远程办公用户、移动用户):通过访问数据中心内网核心区业务的终端用户数据中心运维管理人员:主要负责数据中心运行维护管理的人员,如系统管理员、数据库管理员、网络管理员、存储管理员、业务应用管理员等。由于数据中心需要支持各种用户的各种方式的接入,因而需要数据中心网络需要支持IPsec VPN、SSL VPN、MPLS VPN等多种安全访问方式,从而保证数据中心的高安全性。数据中心网络需要具备快速收敛、高转发性能、易维护、易管理和节能环保等特性,这就需要简化网络架构,降低网络复杂度。数据中心网络需要具备高可靠性、高可用性。网络设

21、计能有效的避免单点故障,在设备的选择和关键设备的互联时,应提供充分的关键设备冗余、重要业务模块冗余和链路冗余,骨干网络应当达到电信级可靠性。数据中心网络架构和设备选型方面需要具备高扩展性,不仅满足当前需要,也能满足未来业务扩展需求。 网络虚拟化:减少设备节点,简化配置。网络服务虚拟化:需要实现独立的安全管理界限划分和故障隔离域。流出流量负载均衡:办公人员访问互联网的流量到达链路负载均衡器时,通过链路负载均衡器多种链路状态检测结果选择最佳出口链路,提升用户体验。流入流量负载均衡:链路负载均衡器的智能DNS解析功能将不同用户访问的域名解析成不同的公网IP地址,加速应用访问,提升用户体验。本地负载均

22、衡:本地负载均衡器可以保障内部资源的容错性,内部任何一个应用节点出现问题都不会对用户造成任何的影响,本地负载均衡器能够自动的屏蔽有问题的应用节点,让其停止对外服务,同时把该故障节点上的用户迁移到其他正常的节点上去。本地负载均衡器可以虚拟成为多个设备,满足政务外网不同分区的安全隔离要求。通过HTTP压缩的方式来节省带宽以及提高访问速度。本地负载均衡器开放的API接口可以实现和云计算管理平台的集成。虚拟化数据中心存储需求在XXX企业数据中心目前存储环境中,存储品牌、型号繁多,各应用系统对存储空间占用量较大,缺少一种有效的手段对存储内的资源进行监控、回收及优化。从部署存储部署架构看来,虽然在链路上可

23、以提供冗余保障,但是就存储本身而言,仍然存在单点故障问题,所以虚拟化数据中心存储管理需要满足以下需求:融合统一存储架构,提升存储中心的灵活性和可靠性,并且提升对存储资源用量的监控和生命周期管理。将原有的孤立的存储设备纳入统一的存储网络环境中,使网络内所有服务器都能平等的共享存储资源,实现存储系统的最大化利用率。采用分布式共享存储体系(FusionStorage),所有网络存储资源均可以被网络内的计算结点共享,当存储资源不足时,仅需要添加存储节点到存储网络中,所有的计算结点就能够快速的识别并使用新添加的存储空间,满足业务扩展需求。现有业务迁移需求提示现有业务迁移需求,如果是新建,可删除样例根据前

24、期调研,XXXX如下业务需要迁移到新建云平台上,在业务迁移到云平台上时,需要确保业务的连续性。现网目前的应用服务器清单见下表。公司目前的应用服务器清单列表序号系统名称服务器名称服务器类型服务器型号服务器厂商操作系统应用类型应用软件版本特殊硬件数量(台)虚拟化数据中心新业务需求提示新业务需求,一般都需要。这个是按照虚拟机承载的业务来统计。样例对新业务系统计划直接部署到云平台上,具体的业务系统如下:新业务系统需求清单序号系统名称服务器名称CPU内存(G)磁盘(G)操作系统应用类型应用软件版本特殊硬件数量(台)业务数据备份需求提示介绍该方案的设计原则样例XXX备份目的存储类型请按实际要求更改,本地或

25、异地备份请按实际要求修改。是否需要备份虚机的系统卷。为减小备份存储容量,建议只备数据卷。为了保证数据的安全性,对于重要的业务系统数据进行备份,具体备份需求如下。备份目的存储类型采用SAN或者NAS,备份到本地。业务系统数据备份需求清单序号系统名称服务器名称系统类型需要备份目录目前数据量大小(G)全备周期增备周期备份时间窗口备份数据保留周期备注业务数据容灾需求提示介绍该方案的设计原则样例虚拟化数据中心安全需求XXXX数据中心由于自身对安全的高要求,因此数据中心需进行内外网隔离、安全域划分,需对不同安全域按安全等级要求进行安全管理、用户与身份、数据安全、应用安全、IT基础设施安全(包括网络安全与主

26、机安全)、物理安全等安全防护。1.安全管理需建立起包含安全治理、风险管理和合规性管理的数据中心安全管理体系,制订安全策略、安全计划和流程,支撑数据中心安全运维的执行和检查,满足安全合规性要求。2.用户与身份需确保合法用户在恰当的时间能够访问到正确的资产,包括基础设施、数据、信息和服务。建立集中的用户库,记录用户的身份信息,并生成用户标识;提供口令和其它强认证信任凭证,提供信任凭证从生成、分发、保存、使用到删除全生命周期内的安全保护;建立与用户管理相结合的访问控制系统,在用户访问资源时进行认证与鉴权,防范非法用户或合法用户的非法访问;对数据中心各类系统运维使用的管理员特权帐号进行管理,监控和记录

27、特权帐号的各项操作。3.数据安全需保护政府所定义敏感数据在其生命周期中的机密性、完整性和可用性。识别所涉及的敏感数据,并建立和维护敏感数据的目录,明确对应的保护策略和机制;提供安全通信机制,保障通过互联网所传递敏感数据的机密性和完整性;提供安全机制,对保存有敏感数据的数据库、文件、存储依照策略应用加密、访问控制、监控与审计等保护措施。5.IT基础设施安全需保护构建IT系统的各个基础设施组件的安全,防范所面临威胁。需具备数据中心外部网络边界的综合安全防护能力,防范来自Internet的各类安全威胁;需针对数据中心内部网络进行安全域划分,对于安全域边界进行网络隔离,定义网络访问控制策略;需提供内服

28、务器系统、终端的安全防护能力,及时发现所存在的安全弱点并进行纠正;需提供云计算平台内虚拟化基础设施的安全保护能力,确保VM的隔离,特定VM间通讯的监控以及VM自身系统的安全性。抵御病毒、恶意代码等对信息系统发起的恶意破坏和攻击,保障网络系统硬件、软件稳定运行。虚拟化数据中心管理需求为了维护数据中心各种系统和应用的平稳、高效运行,数据中心管理平台应当满足如下需求:实现对虚拟化环境和物理环境的集中管理;实现对操作系统、中间件、数据库、计算、存储及网络设备的综合监控管理;实现对虚拟化环境的资源部署管理;建立IT服务管理流程体系,需要实现如下流程和功能:服务台、事件管理(服务请求管理)、问题管理、配置

29、管理、变更管理(发布管理)、服务级别管理;需要建立报表系统,实现对服务管理平台中各种信息的分析和呈现。项目建设规模提示介绍该方案的设计原则样例本期项目中新建虚拟化数据中心所需资源规模如下:/(删除此内容)XXX建设规模分为2个维度,一个是基于业务维度,一个是基于云平台维度的,基于业务维度是指基于客户的业务系统进行预估的建设规模,适合用户给出具体需要迁移的服务器数量和新建业务系统数量确定建设规模。基于云平台维度是指客户不基于业务维度,适合直接指定云平台的建设规模,请根据实际项目情况从用户角度进行描述,选择其中一个。本项目建设规模序号项目需求描述备注1云平台设备资源规模/基于业务维度(可选)现有物

30、理服务器XXX台,约XXX个核CPU(每核CPU相当于2.4Ghz的物理核) XXX T内存,XXX T存储。计划新上线的业务服务器XXX台等。性能说明:服务器最高IOPS为XXXX。CPU平均利用率低于xxx % 。满足公司现有业务部署到云数据中心,根据公司业务发展规划,设备资源要满足后期5%的增长需求/基于云平台维度(可选)需要XXX台虚拟机,约XXX个虚拟CPU, XXXT内存,XXXT存储容量。2网络设备规模数据中心网络新建,需要设计为三层网络结构,外部连接通过已有路由设备。安全需要考虑配置防火墙、负载均衡,VPN专有设备等。3容灾规模对XXX台业务系统进行业务容灾。4备份规模对XXX

31、台业务系统的数据进行备份,备份策略为1周全备,保留一月份全备数据,7天增量备份。5业务迁移规模XXX台业务系统服务器采用业务迁移工具进行迁移部署,其中采用P2V 方式XXX台,V2V方式XXX台。XXX台业务服务器采用重新安装方式进行部署。总体技术方案单数据中心方案(可选)单数据中心包含云管理、计算资源池、存储资源池,备份系统为可选。单数据中心方案拓扑单个数据中心架构分为:接入控制:用于对终端的接入访问进行有效控制,包括接入网关,防火墙等设备。接入控制设备不是解决方案所必须的组成部分,可以根据客户的实际需求进行裁减。虚拟化资源池:通过在计算服务器上安装虚拟化平台软件,然后在其上创建虚拟机。存储

32、用于向虚拟机提供系统盘、数据盘等存储资源。资源管理:云资源管理及调度,主要是对各种云物理资源和虚拟资源进行管理。创建虚拟机时,为虚拟机分配相应的虚拟资源。包括云管理服务器、集群管理服务器、安装服务器等。硬件资源:服务器、存储、交换机。双数据中心方案(可选)双数据中心方案拓扑(下图根据XXX客户实际要求修改,补充为双数据中心)随着云计算的蓬勃发展,越来越多重要的计算机信息系统出现在云计算中。由于各行业的用户和企业对网络应用和数据信息的依赖日益强烈。每年成百上千的全球数据中心遭遇突发性灾难,比如火灾、洪水、地震、区域电力中断或者人为破坏,这对整个企业的数据和业务生产会造成重大影响,如重要信息丢失、

33、服务中断、经济损失、客户流失等。因此,为了保证云计算中计算机信息系统的业务连续性和数据可靠性,华为提供了针对云计算的容灾解决方案,保证灾难发生时关键数据不丢失,系统服务尽快恢复运行。成功的业务连续性策略元素包含:包含监控和平台冗余的预防措施数据保护灾难恢复策略有效的人员计划使用华为的FusionSphere虚拟构架,IT管理员能改进业务连续性的所有方面,例如:由于主备服务器之间的硬件独立性,使得灾难恢复更快而花费不多排除计划内的硬件当机,并明显的减少计划内的软件当机管理所有虚拟机和监控宿主机的控制技术灾难的自动恢复,或快速手动恢复根据XXX数据中心现状和业务的发展趋势,以及对容灾系统的建设需求

34、和目标,华为提供了基于存储镜像技术的FusionCloud云平台容灾方案(根据实际项目选择)。双数据中心架构分为:接入控制:用于对终端的接入访问进行有效控制,包括接入网关,防火墙等设备。接入控制设备不是解决方案所必须的组成部分,可以根据客户的实际需求进行裁减。虚拟化资源池:通过在计算服务器上安装虚拟化平台软件,然后在其上创建虚拟机。存储用于向虚拟机提供系统盘、数据盘等存储资源。资源管理:云资源管理及调度,主要是对各种云物理资源和虚拟资源进行管理。创建虚拟机时,为虚拟机分配相应的虚拟资源。包括云管理服务器、集群管理服务器、安装服务器等。硬件资源:服务器、存储、交换机。双数据中心之间通过数据专网连

35、接,进行存储镜像数据,管理数据的同步。两地三中心方案(可选)两地三中心方案拓扑(下图根据XXX客户实际要求修改,补充为两地三中心数据中心)根据项目需求,在XXX城市建立两个数据中心,互为容灾,本地进行备份;在XXX地建立异地备份中心,保留客户关键业务数据,做历史数据备份。采用 “同城灾备异地灾备”的两地三中心整体灾难恢复解决方案,可以满足不同灾难场景下的业务连续性要求。同城灾备中心主要是用于防范生产中心机房或楼宇发生的灾难,异地灾备中心用于防范大规模区域性灾难。同城灾备中心由于其与生产中心处于同一个城市,可采用较好的网络线路如光纤与生产中心进行连接,因此数据复制和应用切换比较容易实现,可实现生

36、产与灾备中心之间数据的实时复制和应用的快速切换。异地灾备中心由于其与生产中心不在同一城市,灾备端与生产端连接的网络线路带宽和质量存在一定的限制,一般适合于数据的异步复制,应用系统的切换也需要一定的时间,因此异地灾备中心可以实现在业务限定的时间内进行恢复和可容忍丢失范围内的数据恢复。“同城灾备异地灾备”的两地三中心解决方案包含了灾备咨询、实施建设、演练、运营的服务内容。云平台设计方案本项目通过华为云平台FusionSphere提供服务器整合资源,对计算、存储、网络进行虚拟化管理,形成统一的云计算信息系统平台。计算虚拟化方案设计在虚拟化数据中心,所有资源整合后在逻辑上以单一整体的形式呈现,这些资源

37、根据需要进行动态扩展和配置,XXXX企业信息系统业务按需使用资源。通过虚拟化技术,增强数据中心的可管理性,提高应用的兼容性和可用性,加速应用的部署,提升硬件资源的利用率,降低能源消耗。虚拟化是云计算的基础,在虚拟化数据中心,通过虚拟化技术将物理服务器进行虚拟化,具体为CPU虚拟化、内存虚拟化、设备I/O虚拟化等,实现在单一物理服务器上运行多个虚拟服务器(虚拟机),把应用程序对底层的系统和硬件的依赖抽象出来,从而解除应用与操作系统和硬件的耦合关系,使得物理设备的差异性与兼容性与上层应用透明,不同的虚拟机之间相互隔离、互不影响,可以运行不同的操作系统,并提供不同的应用服务。华为云平台FusionS

38、phere由虚拟基础设施套件和云基础服务套件组成。系统逻辑架构图如下:华为云平台FusionSphere逻辑架构华为云平台管理节点主要由:虚拟化基础引擎FusionCompute和云管理FusionManager。一套云平台部署一对FusionManager主备节点,FusionManager通过自动发现功能发现其管辖下的物理设备资源(包括机框、服务器、刀片、存储设备、交互机)以及他们的组网关系;提供虚拟资源与物理资源管理功能(统一拓扑、统一告警、统一监控、容量管理、用量计费、性能报表、关联分析,生命周期),并且对外提供统一的管理Portal。FusionCompute提供基础的虚拟化功能,提

39、供服务器、存储、网络的虚拟化功能,并向上对FusionManager提供接口。每套FusionCompute主要由一对主备管理节点VRM组成。一对VRM对应一个物理集群(或者叫站点)。一个物理集群中可以把多台服务器划分成一个资源集群(又叫HA资源池),一个计算资源池有相同的调度策略,为了使用热迁移相关的调度策略要求资源池主机CPU同制。计算资源池不包括网络资源与存储资源。一个物理集群中可以包含多个资源集群。业务虚拟化评估XXXX企业业务系统中,可以按照如下原则进行业务虚拟化改造,如果某些应用不能进行虚拟化,可以把能虚拟化的业务进行虚拟化改造,不能进行虚拟化的业务,保持不变或采用物理机部署,由F

40、usionSphere统一管理。适合虚拟化平台的业务:业务对资源有快速部署、标准化(X86架构)的需求;系统和应用不依赖于特殊的、无法虚拟化的硬件;系统资源平均利用率较低;业务增长快,导致平台频繁扩容;需要用较低成本来提高系统可用性和可靠性。不适合虚拟化业务:应用厂商明确表示不支持虚拟化,不建议虚拟化;应用软件厂商表示不提供在虚拟化平台上运行的技术支撑,请慎重考虑,建议请华为评估;业务对实时性要求非常高的系统,如要求毫秒级响应,建议暂缓或请华为评估;数据库双机或数据库集群,如Oracle RAC等,暂缓虚拟化,采用物理机部署;非X86平台系统,如小型机,暂缓虚拟化,如果可迁移到X86系统,则评

41、估是否可采用高端X86服务器物理部署;依赖特殊的外设(EVDO卡,特殊的语音板卡、加密卡等PCI卡)或专用设备(排队机、LNS设备、工控机)的系统,暂缓虚拟化;系统本地I/O或网络吞吐非常繁忙,如大型数据库IO要求非常高,会导致整个集群资源产生瓶颈,影响整个集群性能,建议不要进行平台化部署。如数据库IOPS平均值大于1500时 ,会占用过多共享存储资源,可能会导致其他虚拟机变慢,不建议采用虚拟化部署,采用物理机部署;Hadoop等分布式存储方面的应用,对一份数据会进行3份以上的备份,如果评估对存储压力较大,建议不进行虚拟化部署。如果无法评估,建议联系华为工程师评估;虚拟化资源池设计服务器是虚拟

42、化数据中心的核心,其承担着数据中心“计算”功能。对于虚拟化数据中心中的服务器,通常都是将相同或者相似类型的服务器组合在一起,安装云操作系统(FusionSphere),使其计算资源能以一种虚拟服务器的方式被不同的应用使用,即所谓的虚拟化资源池。这里所提到的虚拟服务器,是一种逻辑概念。对不同处理器架构的服务器以及不同的虚拟化平台软件,其实现的具体方式不同。在搭建虚拟化资源池之前,首先应该确定资源池的数量和种类,并对服务器进行归类。归类的标准通常是根据服务器的CPU类型、型号、配置、物理位置来决定。对虚拟化数据中心而言,属于同一个资源池的服务器,通常就会将其视为一组可互相替代的资源。所以,一般都是

43、将相同处理器、相近型号系列并且配置与物理位置接近的服务器比如相近型号、物理距离不远的机架式服务器或者刀片服务器。在做资源池规划的时候,也需要考虑其规模和功用。如果单个资源池的规模越大,可以给虚拟化平台提供更大的灵活性和容错性:更多的应用可以部署在上面,并且单个物理服务器的宕机对整个资源池的影响会更小些。如果有条件的话,通常推荐先审视一下企业自身的业务应用。可以考虑将应用分级,将某些级别高的应用尽可能地放在某些独立而规模较小的资源池内,辅以较高级别的存储设备,并配备高级别的运维值守。而那些级别比较低的应用,则可以被放在那些规模较大的公用资源池(群)中。对于x86系列的服务器,除了用于生产系统的资

44、源池以外,还需要专门搭建一个测试用资源池,以便云计算平台项目实施过程以及平台上线以后运维过程中使用。在云计算平台上线以后,原有非云计算平台上的应用会逐步向云计算平台迁移,空出的服务器资源池也会逐渐并入云计算平台的资源池中。虚拟化资源池服务器利旧根据计划利旧服务器的配置进行了评估和分析,其分析结论和规划如下:计划利旧服务器清单序号服务器型号厂商类型(X86/小型机)CPU型号CPU个数及核数内存网口数量级速率硬盘容量数量是否可利旧用途规划虚拟化资源池服务器规划/使用SPECint2006 Rate进行折算,SPEC值可在/cgi-bin/osgresults?conf=rint2006查到。对于

45、应用系统迁移,按SPEC值估算迁移到过来;对于新业务系统,需要估算,详细参见Server Consolidation解决方案性能配置计算指导书v1.0.docx,见链接 http:/3/hi/group/8395/wiki_2558457.html。下面给出两种折算方法,以SPEC总需求进行折算,这个方法比较粗放。以SPEC值折算成vCPU个数,再以vCPU个数的总数得到服务器总数据,这种方法比较精细。方法一:SPEC总需求进行折算本计算方法的原理是将原有应用系统的消耗的SPEC值都加起来,得到需要计算能力总需求。再查询新服务器的SPEC值,相除即可得到服务器的总数量。举例:107台Dell

46、PowerEdge 2950 CPU 2*E5420 2.50GHz, 4 Core(s), 8.00GB的服务器的实际平均CPU使用率为20%。查表 HYPERLINK /cgi-bin/osgresults,获取其SPEC值为118 /cgi-bin/osgresults?conf=rint2006,获取其SPEC值为118。迁移到RH5885(4颗8核CPU, E7-4820,2GHz),查询得其SPEC值为775。计算能力需求=(原服务器的SPEC*CPU利用率)*(1+冗余因子) =107*118*20%*(1+20%) =3283 注明:冗余因子一般取10%-20%,建议20%。服

47、务器可分配计算能力=服务器SPEC*CPU占有率*(1-UVP超线程数/总超线程数)=775*70%*(1-2/(4*8*2)=525注明:底层虚拟化消耗的超线程数在R3版本值为2;CPU占有率按实际取50%70%,建议不要超过70%。服务器总数量=Roundup(计算能力需求/服务器可分配计算能力)= Roundup (3283/525)=7台服务器。注明:实际配置服务器数量时,需要考虑冗余资源,对于每个集群中至少要配置一台冗余服务器,做虚拟机HA使用。采用8G内存条,每服务器的内存条数=(内存总数/服务器数量+8G)/8G=(987GB /7个服务器+8G(虚拟化消耗) )/8= 19根。

48、注明:实际配置时,对于内存每台服务器建议配置偶数根内存条,同时内存使用率不要超过80%方法二:SPEC值折算成vCPU个数理论上影响服务器数量的主要是虚拟机的vCPU与内存,将上面业务应用虚拟机的vCPU、内存总数来计算需要服务器总数,所以需要从这两个维度计算服务器的数量。现在服务器的内存可以使用户16G、32G内存条,内存一般就不是瓶颈了。举例:Dell PowerEdge 2950 CPU 2*E5420 2.50GHz, 4 Core(s), 8.00GB的服务器的实际平均CPU使用率为20%。查表 HYPERLINK /cgi-bin/osgresults,获取其SPEC值为118 /

49、cgi-bin/osgresults?conf=rint2006,获取其SPEC值为118。 迁移到RH5885(4颗8核CPU, E7-4820,2GHz),查询得其SPEC值为775,以SPEC值来推算,服务器单个vCPU计算能力 = 服务器spec cint2006 rates值*CPU使用率/(cpu个数*核数*2-虚拟化消耗的逻辑核)=775*70%/(4*8*2-2)=8.7。那么需要的vCPU个数=Roundup(118*20%/8.7)=3, 内存需求为8G。虚拟机资源汇总虚拟机总数:107个虚拟机vCPU总数:322个虚拟机内存总数:856 GB云平台服务器配置计算方法: 为

50、了保证云平台上虚拟机的可靠性,在发生服务器异常故障时,使得故障服务器上的虚拟机能在其它服务器通过云平台HA功能运行起来,尽量减少业务的中断时间,所以在系统部署时,代表系统计算资源的服务器CPU和内存资源要保留20%(按实际要求更改)的冗余。虚拟机的网卡是共享服务器上的物理网卡的带宽的,而且可以虚拟机创建好后继续添加虚拟网卡,所以虚拟网卡的数量不构成计算资源的约束。基于以上原则,系统实际需要承载的计算资源数量为:系统实际承载的vCPU总数:322 * 120% = 387 个。系统实际承载的虚拟机内存总数:856 GB * 120% = 1028GB。根据30%的配置冗余原则以及服务器选型(4颗

51、8核),服务器数量及配置计算方法如下:从vCPU角度计算服务器数量=vCPU总数/(CPU个数*CPU核数*2-2)=取整(387个VCPU /(4*8*2-2)= 7 台服务器采用8G内存条,每服务器的内存条数=(内存总数/服务器数量+8G)/8G=(1028GB /7个服务器+8G(虚拟化消耗) )/8= 20根虚拟化资源池部署规划/(删除此行)本章主要介绍管理节点,业务迁移过来的虚拟机,新业务虚拟机的部署规格。请根据具体产品版本进行适当的修改。请按照项目规模选择管理节点虚机规格。在一些可靠性要求不高的场景,管理节点可以单主部署。一对VRM支持VM个数最大为5000个。/对于常用的系统。如

52、WEB系统Sharepoint,Mail系统Exchange,数据库系统Microsoft SQL Server,Oracle 11g。性能部已经有规划文档,可参见相应的文档。/集群的划分一般根据部门(如生产、测试、研发、行政)、网络隔离要求(如外部网络、DMZ区、内部网络),应用分布等要求来划分,请与客户了解后再做规划。/请根据实际项目中服务器、存储选择相应的部署形态。本项目根据客户的实际需求,预计发放XXX台虚拟机。云平台在XXX个数据中心进行部署,数据中心1部署XXX个物理集群,XXX个逻辑集群。数据中心2部署XXX个逻辑集群。管理节点部署规划管理节点部署图管理节点FusionManag

53、er(FM)、VRM(FusionCompute)部署在虚拟机上,需要占用2台物理服务器做主备。其中FusionManager、UHM合部在同一台虚机中,VRM部署一台虚机中,都是主备部署。管理服务器命名为MCNA节点,其余为提供计算资源的服务器命名为CNA。管理节点使用两块本地硬盘做RAID1做管理节点虚机的存储。管理节点主备占用两台服务器,管理服务器剩下的计算资源可以给业务虚机使用。根据业务规模,管理节点服务器虚拟机的规格不同。管理节点服务器虚拟机配置如下表所示:云平台部署的管理节点规格节点类型虚拟机规格虚拟机数量(台)说明CPU 核(预留)内存(GB)磁盘空间FusionManager4

54、8802台(主备)300个虚拟机412802台(主备)1000个虚拟机616802台(主备)3000个虚拟机816802台(主备)5000个虚拟机VRM24802台(主备)200个虚拟机,20台物理主机48802台(主备)1000个虚拟机,50台物理主机88802台(主备)3000个虚拟机,100台物理主机1216802台(主备)5000个虚拟机,200台物理主机注:可根据业务虚拟机数量调节管理虚机规格大小,提高管理节点性能。管理节点部署规划( (E9000+FusionStorage) 一体机形态)E9000+FusionStorage软硬件部署图FusionCube虚拟化一体机采用E900

55、0+FusionStorage,管理节点部署如下。FusionManager:负责云平台资源管理、弹性调度以及操作维护等综合管理功能,是云平台管理的核心,提供基于web的统一维护界面;整个系统的业务通过云管理FusionManager呈现,诸如用户管理、集群管理、业务模板管理、虚拟机管理、统一硬件管理、告警、监控等功能均由FusionManager对外提供。FusionCompute:负责云平台计算资源虚拟化和资源分配,包括VRM和CNA两部分。VRM: Virtual Resource Management虚拟资源管理软件,负责虚拟资源的管理,可管理多个逻辑集群;将物理资源(计算、存储、内存

56、等)转换成可动态调整的虚拟资源,供虚拟机使用;CNA:计算节点代理,在每个需要虚拟化的刀片上物理部署,提供虚拟化功能;FusionStorage:分布式云存储,包括FusionStorage Manager和FusionStorage Agent两部分。FusionStorage Manager:存储管理软件,FusionCube使用分布式云存储技术,通过合理有序组织刀片服务器的本地硬盘,提供高性能高可靠的块存储业务。FusionStorage Agent:存储节点代理,在每个需要虚拟化的刀片上物理部署,用于访问FusionStorage分布式存储池资源的代理;管理节点FusionManage

57、r、VRM、FusionStorage Manager部署在不同虚拟机上,需要占用2个E9000全宽刀片做主备部署,管理节点使用两块本地硬盘做RAID1做管理节点虚拟机的存储。其他本地硬盘在FusionStorage软件组织下,提供分布式存储池,用于业务虚拟机。一套FusionCube系统中至少需部署3块全宽刀片,所有全宽刀片的本地硬盘都可组成分布式存储池,非管理节点刀片可用于部署应用虚拟机,应用虚拟机使用FusionStorage分布式存储池资源。另外,FusionCube支持虚拟化的软件CNA部署在物理机上,E9000+FusionStorage场景下,每个刀片上需要额外占用2个CPU物理

58、核,28G内存。云平台部署的管理节点规格节点类型虚拟机规格虚拟机数量(台)说明VM数量vCPU 核内存(GB)磁盘空间(GB)FusionManager2002162802主备虚拟机200VM10004162802主备虚拟机1000VM30006162802主备虚拟机VRM20048502主备虚拟机200VM100048502主备虚拟机1000VM300068502主备虚拟机FusionStorage Manager无18502主备虚拟机注:一体机FusionCube预安装时,对管理节点的资源规格是按最大支持3000VM的规格来进行设置的,客户可灵活根据局点的虚拟机规模大小将管理刀片上剩下的资

59、源用于部署客户虚拟机,建议不要在管理刀片上部署重要客户虚拟机。网络方案设计网络总体方案网络总体方案示意图(单数据中心)整体网络划分为三层,分别为:接入层服务器和存储设备上行接入到接入层交换机。服务器侧建议采用4网卡(业务管理两网卡、存储两网卡)方式进行组网,业务、管理平面分别通过两网卡聚合确保链路冗余,存储平面通过多路径确保链路冗余。在接入交换机划分VLAN,将管理、业务、存储三个平面逻辑隔离。为简化组网提高组网可靠性,建议接入交换机采用堆叠方式:存储网络:用于承载服务器和磁盘阵列之间的专用数据访问。存储网络通过多路径确保链路冗余,服务器与存储设备通过存储网络二层直接互通。存储设备为虚拟机提供

60、存储资源,但不直接与虚拟机通信,而通过虚拟化平台转化。业务网络:为用户提供业务通道,为虚拟机虚拟网卡的通信平面,对外提供业务应用。各业务部门可以细分VLAN进行访问隔离。管理网络:负责整个云计算系统的管理、业务部署、系统加载等流量的通信。BMC平面主要负责服务器的管理,BMC平面可以和管理平面隔离,也可以不进行隔离。服务器采用户GE组网,每刀片采用2个业务与管理网口+2个存储网口方式进行组网,业务、管理平面通过两网口绑定确保链路冗余可靠性。服务器采用户10GE组网,每刀片出一个2个10GE网口,两网口绑定负载分担确保链路冗余可靠性。汇聚层接入交换机上行到汇聚层交换机。汇聚交换机建议采用交换机集

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论