3天acloud最佳实践_高可用性_第1页
3天acloud最佳实践_高可用性_第2页
3天acloud最佳实践_高可用性_第3页
3天acloud最佳实践_高可用性_第4页
3天acloud最佳实践_高可用性_第5页
已阅读5页,还剩44页未读 继续免费阅读

付费下载

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 深信服企业级云高可用性最佳实践 适用版本 aCloud 5.3文档版本 v1.0发布日期 2017-08-15 深信服科技 文档密级:外部HA_Best_Practices_aCloud 5.3 版权声明本文中出现的任何文字叙述、文档格式、插图、照片、方法、过程等内容,除另有特别注明,版权均属 深信服所有,受到有关产权及版权法保护。任何个人、机构未经深信服的书面授权许可,不得以任何方式复制或引用本文的任何片断。 i深信服科技版权所有修订历史 编号 修订内容简述 修订日期 修订前版本号 修订后版本号 修订人 批准人 1V1.0 定稿 2017/8/15邓俊峰

2、 注:修订历史记录本文档提交时的当前有效的基本控制信息,当前版本文档有效期将在新版本文档生效时自动结束。文档版本号小于 1.0 时,表示该版本文档为草案,仅供参考。 文档密级:外部HA_Best_Practices_aCloud 5.3目录第 1 章高可用基础概念第 2 章部署架构高可用网络架构2.1服务器配置2.2存储多路径2.3第 3 章云平台高可用云平台管理高可用3.1分布式虚拟交换机3.2虚拟路由器高可用3.3虚拟安全设备高可用3.4动态资源调度 DRS3.5分布式存储多副本3.6分布式存储热备盘3.7云平台在线扩容主机3.8云平台在线扩容磁盘3.9第 4 章虚拟机高可用虚拟机高可用

3、HA主机故障HA4.1.2虚拟机故障 HA虚拟机主机在线迁移4.2ii深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3虚拟机存储在线迁移4.3虚拟机跨集群迁移4.4虚拟机资源热添加4.5动态资源扩容 DRX4.6第 5 章数据高可用虚拟机备份虚拟机备份池创建5.1.2虚拟机手动备份5.1.3虚拟机自动备份策略配置5.1.4虚拟机备份恢复虚拟机快照5.2云平台配置备份恢复5.3云平台回收站恢复5.4第 6 章业务高可用Oracle RAC 集群6.1SQL Server AlwaysOn

4、集群6.2AD 服务器负载均衡6.3第 7 章容灾高可用火星舱7.1美创7.2企业级云高可用总结第 8 章 iii深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3第1章 高可用基础概念高可用通常指的是通过技术手段,尽量缩短因日常维护操作(计划)和突发的系统(非计划)所导致的停机时间,以提高系统和应用的可用性。 计划性停机的原因包含:升级、打补丁、硬件维修、灾备演练等; 非计划性停机的原因包含:人为误操作、硬件故障、网络故障、自然灾害、软件故障、病毒等; 深信服科技版权所有风险类别内容

5、自然灾害 自然灾害、地质灾害 机房环境风险 火灾、机房结构性损坏、供电系统瘫痪、空调系统故障 社会 传染性疾病、污染、恐怖、 硬件多点故障 多台服务器、网络多点故障、存储多点故障 硬件单点故障 单台服务器故障、网络单点故障、存储单点故障 软件故障 应用软件故障、数据库软件故障、操作系统故障 数据库逻辑故障 数据库损坏、数据表误删除或修改 风险类别内容系统日常维护/ 升级计划停电/检修/操作系统升级/数据库版本升级/应用升级/数据库维护/硬件微码升级系统迁移机房搬迁、系统迁移、整合容灾演习定期的系统切换或回切文档密级:外部HA_Best_Practices_aCloud 5.3 深信服企业级云通

6、过持续创新,从物理层、虚拟化层、数据层、业务层、数据中心容灾等方面为用户提供了全方位的高可用性保护,保证了用户服务持续性和业务连续性。 深信服科技版权所有人为故障 人为失误或故意破坏 系统性能问题 主机、存储、网络、数据库、应用程序等 文档密级:外部HA_Best_Practices_aCloud 5.3第2章 部署架构高可用网络架构2.1 名词解释: 存储单交换机链路 用户组建分布式存储 aSAN 时使用一台交换机或者堆叠的两台交换机作为存储交换机,同一台服务器的两个存储网口均接入该交换机,两条链路间实现链路负载均衡。 存储双交换机链路 用户组建分布式存储

7、 aSAN 时使用独立的两台交换机作为存储交换机,同一台服务器的两个存储网口分别接入不同的交换机,两条链路间实现链路负载均衡。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3组网说明: 核心层 建议采用具备大容量网络报文转发能力的数据中心核心交换机,要求交换机型号支持堆叠或者集群技术,下行端口速率 10GE。 接入层 大规模部署场景下,建议管理、业务、vxlan 网络平面分别采用支持堆叠技术的两台数据中心千兆接入交换机,下行端口速率 GE 接入服务器,上行端口速率 10GE,多条 10GE 链路使用链路聚合方式接入核

8、心交换机,构建冗余、低收敛比、无阻塞业务交换网络。存储网络则采用两立的万兆交换机,做双交换机链路聚保证 aSAN 性能,同时提高整个网络架构的健壮性。 小规模部署场景下,建议管理、业务、vxlan 网络平面采用两台堆叠的数据中心千兆接入交换机,各个网络平面划分不同vlan 做逻辑隔离。存储网络同样采用两立的万兆交换机,采用双交换机链路,保障 aSAN 性能,同时提高整个网络架构的健壮性。 服务器接入 服务器 6*GE/2*10GE 场景(高性能场景,推荐配置) 服务器配置 6*GE、2*10GE 网口时,管理、业务、vxlan 网络各采用 2*GE 网口,并做网口聚合绑定; 存储网络采用 2*

9、10GE 网口,采用双交换机链路,增加网络冗余性和传输带宽。对于管理、业务、vxlan 网络平面,服务器网卡聚合支持根据 IP、mac 地址、轮询三种方式负载均衡模式,建议采用按照 IP 方式进行负载均衡,接入层交换机端口需要配置相应的端口聚合模式,如果接入交换机是思科交换机则配置 mode on 与底层聚合网卡进行对接。对于存储独立双交换机,保持存储连接的交换机端口配置 access vlan 1 即可。深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 服务器 6*GE 场景(小规模低成本场景,推荐配置) 服务器配置

10、 6*GE 网口时,可以采用“接入层”章节描述的大小规模部署方式(存储改为千兆交换机),也可以仅使用一套堆叠的千兆交换机,管理、业务、vxlan、存储网络均复用该交换机。推荐管理、存储网络各采用 2*GE 网口,vxlan、业务网络双网口复用,采用 2*GE网口, vxlan、业务两个网口做 IP 方式负载均衡聚合绑定,存储网络采用双交换机链路(仅有一套堆叠交换机则使用单交换机链路),该方式使用户业务无单点故障,提升业务的可靠性。另外,由于企业级云平台无法感知机柜,建议企业级云部署时尽量使用双机双柜的部署方式,即堆叠的双交换机放置于两个机柜中,单一集群中内服务器建议放置于两个以上机柜中。服务器

11、配置2.2企业级云平台分布式存储模块 aSAN 具备防脑裂仲裁机制,为了保证平台稳定性,建议集群内服务器至少 3 台起步,每台服务器采用相同的硬件配置,参考配置如下:表格 1深信服科技版权所有硬件 推荐配置 备注 网卡支持巨帧,推荐配置 6*GE,2*10GERAID 卡支持 non-raid、jbod 模式,使用 aSAN,缓存盘和数据盘必须配置成 non-raid 或者 jbod 模式。磁盘深信服一体机系统盘默认最低使用 128G SSD 盘;如果系统盘是 SAS/SATA 盘,使用两块盘做 RAID1分布式存储使用 SSD 作为缓存盘,SATA(也可以

12、是 SAS) 作为数据盘,SSD 和 SATA 的个数比推荐值为 1:3,一般 8 盘位服务器使用 2 块 SSD 和 6 块HDD。容量比推荐值为 1:10,文档密级:外部HA_Best_Practices_aCloud 5.3存储多路径2.3企业级云支持 FC 存储阵列多路径使用。存储多路径提供链路冗余,提升存储的可靠性;实现链路的负载均衡,增加存储链路带宽,提升整个云平台的性能。n 企业级云推荐配置:每台云服务器配置两个 HBA 卡,每个 HBA 卡配置一个存储光模块,提供 1*8GE 链路;接受 HBA 卡存在单点故障风险前提下时可以考虑使用一个 HBA 卡,每个 HBA 卡配置两个存

13、储光模块,提供 2*8G 链路;FC 存储阵列配置 AB 控,每个控制器提供 2*8GE 链路;两台存储 FC 交换机;接受 FC 交换机存在单点故障风险前提下时可以使用 1 台存储 FC交换机n 企业推荐存储组网如下:深信服科技版权所有一般不要低于 1:20,SSD 容量比越高,整体性能越好。文档密级:外部HA_Best_Practices_aCloud 5.3n 组网配置说明 两个 fc 交换机设置不同的 domain id FC 存储交换机独立部署,服务器的 hba0 和hba1 分别接入两台 FC 交换机 按照最小 zone 配置原则进行 zone

14、划分,即一个服务hba 卡与一个控制器 hba 卡划分到同一个 zone 内。zone 划分可按照 wwpn 划分,也可以按照端口进行划分,推荐使用 wwpn 配置。n 配置示例 以domain1 交换机进行端 wwpn zone 划分示例定义别名alias s1_hba0 wwpn_s1s2_hba0 wwpn_s2;zone1(s1_hba0,wwpn_B0),zone2(s1_hba0,wwpn_A0),深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3zone3(s2_hba0,wwpn_B0),zone4(s2

15、_hba0,wwpn_A0), 以 domain1 交换机进行端口 zone 划分示例zone1(s1_hba0,(1,3),zone2(s1_hba0,(1,4),zone3(s2_hba0,(1,3),zone4(s2_hba0,(1,4),深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3第3章 云平台高可用云平台管理高可用3.1企业级云从集群主机中自动选择一台主机成为“主控”,作为平台管理主机并配置集群 IP,用户使用集群 IP 管理集群。当该主机故障时,主控可以切换到其他主机上运行。 在主控所在主机出现故障时,

16、系统会提示主控离线,用户在确认主控所在主机无法恢复的前提下,可以在管理平台“实体机”中选择一台正常运行的物理主机,在“更多”中设置当前物理主机为主控。 分布式虚拟交换机3.2分布式虚拟交换机实现了虚拟交换机跨主机分布部署,用于不同主机间东西向流量通信。不同主机上运行同一分布式虚拟机交换机不同实例,交换机不同示例网络配置相同,从而实现虚拟机跨主机迁移时网络保持一致。在集群中分布在多台主机的单一交换机逻辑上组成一个大的集中式交换机,使虚拟环境中的网络配置不再以主机为单位,简化虚拟机网络连接的部署、管理和监控,适合于大规模的网络部署。 分布式虚拟交换机对外提供“广播风暴抑制”的高级配置功能,可以限制

17、广播报文转发数深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3量,超过报文转发限制数量后系统断开网口以阻断风暴,但是广播抑制在正常情况下开启容易导致正常报文被丢弃,建议正常使用时不开启该功能“”,该选项系统默认不开启,日常使用无须关注;当云平台内部出现广播风暴时,通过观察各交换机链路流量,开启流量过大的交换机广播抑制功能,限制报文转发数量。 虚拟路由器高可用3.3虚拟路由器创建完成后默认不启用 HA,当虚拟路由器运行的主机故障时也会在其他主机重新创建一个新的路由器,这种方式故障恢复时间较长。 建议在虚拟路由器高级配置中

18、启用“高可用 HA”。启用高可用特性后,系统会在两个主机上创建路由器,并实时同步会话信息,运行于主备模式。当路由器运行的主机出现故障时,可以实现秒级故障切换,但启用高可用特性后由于同步会话信息会占用少量带宽。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 虚拟安全设备高可用3.4虚拟机安全设备如 vAC、vAD、vAF、vSSL VPN 等创建完成后系统默认勾选“运行异常时重启” ,当设备出现无响应、卡死时自动重启设备;同时开启“高可用HA” ,当设备所在主机出现故障时,自动切换到其它物理主机上运行。 建议不要停用

19、虚拟网络设备“运行异常时重启”和“故障迁移 HA”选项。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3动态资源调度 DRS3.5集群内发生用户通过自选主机创建虚拟资源、在线迁移、故障 HA 等情况时可能造成集群内各主机 CPU、内存资源利用率不平衡。负载过轻的主机资源利用率低,造成浪费;负载过重的主机容易出现资源超配,会降低虚拟机的性能和稳定性,从而影响业务的正常运行 DRS(Dynamic Resource Scheduler,动态资源调度)能够持续监控当前集群中各主机节点的 CPU、内存的使用情况和虚拟机的主机

20、分布情况,并自动生成虚拟机在线主机迁移调整计划,动态调整虚拟机的运行位置,使集群的计算资源达到均衡使用的效果。 DRS 技术采用的是“虚拟机主机在线迁移”的方式,只调整虚拟机的主机运行位置,不会改变存储运行位置,迁移过程不会对虚拟机上的业务造成影响。 DRS 只对同时满足以下条件的虚拟机有效: 创建虚拟机主机运行位置配置为“自动选择” 虚拟机已安装性能优化工具; 虚拟机运行存储位置在共享存储或者分布式存储 aSAN 上。 DRS 支持手动和自动两种调度方式: 手动。系统根据资源负载的规则,给出调度建议,管理员可以手动执行调度建议。用户可以在业务空闲时间手动 DRS,减少对运行业务的影响,因此手

21、动调度为目前云平台 DRS 推荐方式。 自动。系统根据资源负载的规则,自动进行调度,节省管理员运维工作量。 DRS 策略使用最佳实践 DRS 全局调度策略配置 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 DRS 特定虚拟机额外调度策略配置 通过“新增”添加虚拟机,自定义特定虚拟机调度方式为“自动”或者“禁用”。数据库等集群方式部署的业务虚拟机建议禁用 DRS。 手动执行 DRS 调度计划 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3当

22、首页出现集群负载失衡图标“”时,点击该图标进入集群调度页面,根据生成调度建议,按照同时在线迁移单个虚拟机的方式调度虚拟机。调度完成后首页显示为集群负载恢复平衡状态图标“”。 分布式存储多副本3.6存储副本,是将数据保存多份的一种冗余技术,对用户呈现一个访问入口,用户不需要关心副本间数据同步的问题,由副本复制模块来负责副本的同步。 配置副本是可以有效降低磁盘故障而导致数据丢失的风险,冗余副本数越多,当磁盘故障后越容易从其他磁盘中的副本中快速恢复数据,但副本数越多,磁盘空间利用率越低。 当前深信服分布式存储 aSAN 支持双副本和三副本技术,基于容量、成本考虑,推荐创建分布式存储 aSAN 时采用

23、存储双副本,实际存储可用容量为所有服务器数据盘可用存储容量的一半,在损坏一台主机情况下不影响用户业务。 分布式存储热备盘3.7热备盘是被指定用于替代分布式存储 aSAN 中损坏数据盘的硬盘,用于承载损坏硬盘中的数据,当硬盘损坏时,热备盘会自动替换原有的损坏的硬盘。在分布式存储 aSAN 自动使用热备盘替换故障磁盘后,页面上依然会提示原来的故障磁盘损坏,此时用户可以通过更换磁盘,将新替换的硬盘会作为热备盘使用。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3为保证存储系统的可靠性,建议在创建分布式存储时创建热备盘。热备

24、盘的类型、容量建议与分布式存储数据盘的类型、容量保持一致。 推荐 aSAN 在初始化阶段配置不小于集群副本数个磁盘作为集群全局热备盘。例如客户采用三台主机组成企业级云集群,分布式存储 aSAN 采用双副本技术,则平台至少需要配置两块热备盘,并分布在不同的主机上。 云平台在线扩容主机3.8企业级云平台支持在线扩容集群主机,有效解决用户集群资源使用量激增而导致集群总体资源不足的问题。扩容后的主机不仅可以增加整个集群的计算资源,分担其它主机上的业务负载,同时主机上的磁盘也可以在线扩容到 aSAN 分布式存储中,扩展存储资源池的容量,同时不影响客户业务虚拟机运行,解决用户资源需求的同时保证了客户业务的

25、连续性。 云平台在线扩容注意事项: 待扩容主机需加入集群物理网络中 推荐在线扩容的主机与集群内其他主机的硬件配置保持一致; 推荐一次性扩容不小于副本数的主机。 主机扩容后建议参考动态资源调度 DRS 章节对集群进行负载平衡 在线扩容主机 在实体机页面,选择“添加主机”,进入“添加物理主机”向导。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 云平台在线扩容磁盘3.9企业级云平台支持以主机添加磁盘的方式,纵向地扩展分布式存储容量,解决用户集群存储容量不足的问题。深信服分布式存储 aSAN 支持磁盘热插拔,可以在线状态

26、增加磁盘资源而不影响用户业务虚拟机运行,保证了用户业务连续性。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3在线扩容磁盘前提条件: 集群服务器需有额外的磁盘槽位 集群服务器 Raid 卡支持并预先配置成 jbod 或者 non-raid 模式 推荐用户在aSAN 增加磁盘扩容时,扩容磁盘数整数倍副本数并均匀分布在不同的主机上。 在线扩容磁盘 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 深信服科技版权所有.

27、cn文档密级:外部HA_Best_Practices_aCloud 5.3第4章 虚拟机高可用虚拟机高可用 HA 主机故障 HAHA(High Available,高可用性集群)通常需要两个或者两个以上的主机组成集群,当虚拟机所在主机发生意外(主机故障、网口掉线等)时,将选择集群中另外正常运行的主机重启该虚拟机,极大的降低了业务中断时间。 主机故障 HA 目标主机选择规则: 1、 首先选择集群内有相同的网络的其他正常主机 2、 如果有分布式存储,优先选择有副本的正常运行的主机 3、 主机计算资源 主机故障 HA 生效前提条件: 创建虚拟机时启用“主机故障 HA” 深信服科技版权

28、所有文档密级:外部HA_Best_Practices_aCloud 5.3 为了最大限度保障用户业务连续性,在云平台管理中建议勾选“虚拟机直连的物理出口”对应的 HA(对应到截图 5 和 6 场景),启用业务口断链 HA 机制;敏感度支持“高”、“中高”、“中”“中低”、“低”,分别对应故障持续时间 30 秒、1 分钟、2 分钟、5 分钟、10 分钟,用户可以根据业务时间需求选择,需注意此选项是集群全局设置,无法针对特定主机或虚拟机进行设置。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud

29、 5.3 对应的 HA 关系如下: 深信服科技版权所有类别对应上图HA场景编号虚拟机 HA 具体情况描述虚拟机运行在共享存储上1、2、3、4 某台主机存储网络中断运行在该主机上的虚拟机触发故障 HA,在另外一台正常主机上重启5 某台主机仅业务出口网络中断运行在该主机上、连接到该业务出口的虚拟机触发故障 HA,在另外一台正常主机上重启。6 某台主机管理网络和业务出口同时中断运行在该主机上的虚拟机触发故障 HA,在另外一台正常主机上重启7 仅管理网络中断平台不处理虚拟机运行在aSAN 上1、2 某台主机aSAN 存储私网中断、管理网络不中断运行在该主机上的虚拟机

30、在本地有副本,虚拟机仍可正常访问aSAN 存储,不触发故障 HA。运行在该主机上的虚拟机在本地无副本,虚拟机无法访问aSAN 存储,该虚拟机触发故障 HA,在另外一台正常主机上重启。(优先选择有该虚拟机副本的主机)3、4 管理网络、aSAN 存储私网同时中断运行在该主机上的虚拟机在本地有副本,虚拟机仍可正常访问aSAN 存储,但该主机管理网离线,集群其他主机仍可通过HA 机制拉起虚拟机,此时该虚拟机有两个实例存在,由于仲裁机制保证数据一致性,存储私网恢复后aSAN 会杀掉旧的虚拟机,并修复合法虚拟机副本。运行在该主机上的虚拟机在本地无副本,无法正常访问aSAN 存储,该虚拟机触发故障 HA,在

31、集群其他正常主机上重启。5、6、7与虚拟机运行在共享存储上处理方式相同文档密级:外部HA_Best_Practices_aCloud 5.3 4.1.2 虚拟机故障 HA虚拟机操作系统出现蓝屏、黑屏、卡死是常见的业务中断问题,若是集群没有侦测应用层心跳并实现主动 HA 的机制,则需要管理员主动重启业务虚拟机,不仅业务中断的时间不可控,还增加了管理员的运维工作量。 通过在虚拟机中安装深信服的性能优化工具,该工具持续向虚拟机运行所在主机发送心跳,主机根据虚拟机反馈的心跳、磁盘 IO、网络流量状态,判断虚拟机的 Guest 操作系统是否蓝屏、黑屏、卡死等。如果虚拟机操作系统持续 90 秒不反馈心跳,

32、磁盘 IO 为 0,网络流量为 0,系统判断该虚拟机发生了蓝屏、黑屏等故障,将虚拟机关机并在原物理主机重启。 虚拟机故障 HA 生效前提条件: 虚拟机已安装性能优化工具 创建虚拟机时启用“虚拟机异常重启” 推荐在创建虚拟机时启用“虚拟机异常重启” ,保证系统运行稳定性。另外需要说明的是,虚拟机故障 HA 仅会重启操作系统,并不会开机启动应用,用户需要手动将应用系统加入到 Linux、Windows 的自启动服务中达到无需人工干预,应用自动故障恢复的目的。此功能只能判断操作系统级别故障,无法侦测到应用级别故障。应用级别故障 HA 需要使用应用监控或应用集群或使用深信服应用交付 AD 来解决应用高

33、可用。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 虚拟机主机在线迁移4.2虚拟机主机在线迁移使用户业务无感知情况下,达到虚拟机开机更换主机运行位置的目的。该技术适用于主机硬件维护、更换主机、平衡主机负载等运维场景,用户可以提前进行虚拟机主机在线迁移,虚拟机无须关机,增强了用户业务连续性。建议在业务非高峰期间进行虚拟机主机在线迁移操作。 虚拟机主机在线迁移注意事项: 虚拟机待迁移目标主机需配置相同的网络; 业务物理出口连接所有的主机。 深信服科技版权所有文档密级:外部HA_Be

34、st_Practices_aCloud 5.3 虚拟机存储在线迁移4.3虚拟机存储在线迁移技术使用户业务无感知情况下,达到虚拟机开机更换主机存储运行位置的目的。该技术适用于当前存储池资源不足并增加新的存储池进行存储容量扩容的场景,用户可以使用该技术将虚拟机从高负载的存储池迁移到低负载的存储池,虚拟机无须关机,增强了用户业务连续性。由于存储在线迁移会产生大量的 IO 操作,为了避免影响业务,建议在业务非高峰期间进行虚拟机存储在线迁移操作,存储在线迁移操作的时间取决于网络环境和虚拟机配置存储空间的大小。 虚拟机存储在线迁移前提条件: 虚拟机运行在共享存储或者分布式存储上。 深信服科技版权所有www

35、.文档密级:外部HA_Best_Practices_aCloud 5.3 虚拟机跨集群迁移4.4虚拟机跨集群迁移技术可以支持用户将虚拟机在线迁移至另外一个企业级云集群。该技术适用于客户由单一集群扩展到多个集群、业务由单一安全分区扩展多个安全分区的场景,迁移过程务不中断,最大限度保证了客户的业务连续性。跨集群迁移会迁移虚拟机运行位置和虚拟机存储文件,由于存储在线迁移会产生大量的 IO 操作,为了避免影响业务,建议在业务非高峰期间进行虚拟机存储在线迁移操作,存储在线迁移操作的时间取决于网络环境和虚拟机配置存储空间的大小。 虚拟机跨集群迁移注意事项: 当前企业级云版本仅支

36、持同版本集群之间的虚拟机迁移; 迁移时目的集群需要配置相同网络,保证迁移后虚拟机业务网络可用性。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 虚拟机资源热添加4.5用户在业务虚拟机的负载爆发增长而超出现有配置时,企业级云平台支持虚拟机在线添加CPU、内存、磁盘、网卡资源,快速提升虚拟机计算、IO 性能,相比需要关机修改虚拟机配置的传统方案更加灵活,保证用户业务可用性和业务连续性。 磁盘、网卡热添加支持所有的操作系统;CPU、内存热添加只支持特定操作系统的资源热添加,该限制是由于部分操作系统运行时不能识别在线添加的

37、 CPU、内存资源所致。 磁盘、网卡热添加特性在虚拟机安装性能优化工具后即可生效;CPU、内存热添加除了安装性能优化工具,还需要在虚拟机高级配置中勾选“启用 CPU 热添加”、“启用内存热添加”之后才能生效,如果操作系统在兼容性列表内,并且预计虚拟机在不久会有计算资源扩容的需求,建议虚拟机安装操作系统后关机勾选 CPU/内存热添加选项。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 动态资源扩容 DRX4.6DRX(Dynamic Resource eXtension,动态资源扩展)是在虚拟机 CPU、内存热添加技

38、术的基础上,增加了自动化策略,适用于业务虚拟机资源使用可能出现无法提前预测的爆炸性增长而用户又无法及时监控虚拟机资源使用率,无法快速调整虚拟机资源的场景。DRX 功能提供的自动化策略,大幅度减少了用户运维的工作量,快速响应业务状态增长变化对虚拟机 CPU、内存资源进行动态扩展,既保证了业务的连续性和性能,又解决用户业务增长带来的敏捷运维问题。 动态资源扩容 DRX 生效前提条件: 虚拟机已安装性能优化工具 虚拟机高级选项已配置“启用 CPU 热添加”、“启用内存热添加” 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3

39、DRX 衡量因素包括“CPU”和“内存”两种,并可以设置阈值,用户可根据实际业务需求配置阈值大小。 CPU:当虚拟机的“CPU 利用率”大于阈值时,为虚拟机添加 CPU,每次增加原配置一个插槽的核数,上限是虚拟机原配置的两倍。限制是不超过当前运行主机的 CPU 核心数。 内存:当虚拟机的“内存利用率”大于阈值时,为虚拟机添加内存,每次增加原配置大小的八分之一(自动取整),上限是虚拟机原配置的两倍。限制是不超过当前运行主机的内存。 敏感度:有“保守”、“激进”两种,动态资源添加响应分别对应 10 分钟、3 分钟,用户可根据实际需求配置两种策略。 保守:在该模式下,系统检测到衡量因素达到阈值并持续

40、 10 分钟,将对虚拟机进行动态资源添加。 激进:在该模式下,系统检测到衡量因素达到阈值并持续 3 分钟,将对虚拟机进行动态资源添加。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3第5章 数据高可用虚拟机备份5.1企业级云平台自带虚拟机备份功能,降低用户操作失误、系统故障等 IT 事故以及发生时造成的用户数据损失,提升用户数据高可用性,保证了用户业务连续性。 虚拟机备份方式支持虚拟机全量备份和增量备份(平台内部备份机制,页面不可设置),两种备份方式都仅备份虚拟机实际使用的磁盘数据量。用户首次虚拟机备份为虚拟机全量备

41、份,备份保留周期内其他备份为增量备份,保留时间超过备份保留周期(即备份保留时间)的增量备份会与虚拟机全量备份合并为新的全量备份。如果用户备份更换备份位置,系统会重新为虚拟机做一次全量备份。 虚拟机备份策略支持用户手动备份和系统自动备份。手动备份适用于重要业务虚拟机较少、业务虚拟机需要立即备份的场景,系统自动备份适用于用户规模运维的场景。 虚拟机备份支持自定义备份位置(备份池),目前企业级云平台支持的备份池包含 NAS(仅支持 NFS 协议)、共享阵列存储、分布式存储、windows 服务器共享目录,一个企业级云集群可以支持多个备份池。备份建议备份在第三方平台上,基于成本考虑 windows 服

42、务器共享目录优先,基于管理考虑NAS 存储优先;次选分布式存储作为备份池,用户需要单独划分一部分空间作为备份。 虚拟机备份池的容量建议未来计划备份的虚拟机实际使用的存储(共享存储和分布式存储)总容量的 150%。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 虚拟机备份池创建 创建 Windows 共享服务目录备份池。 创建目录并共享 创建 windows 共享目录备份池 指定备份空间大小 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud

43、 5.3 创建分布式存储备份池 创建分布式存储备份池 5.1.2 虚拟机手动备份用户手动备份可以从虚拟机列表快捷方式或者进入虚拟机详情进行备份 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 自定义备份名称和存储位置 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 5.1.3 虚拟机自动备份策略配置 默认备份策略 当用户所有业务虚拟机都需要备份的时候,建议使用默认备份策略。默认备份策略会将所有虚拟机自动备份,不需要人工干预,对用户而言,该策

44、略优点在于操作简单,维护方便。 默认策略备份位置建议选择第三方存储位置。如果只有一个备份位置,手动指定和自动指定位置无区别;如果有多个备份池,建议选择“自动指定位置”。 备份频率支持按周、按天、按小时备份,备份时间建议配置为业务空闲时间。系统默认设置为按天备份,一般业务空闲时间区间为晚上 23 点到第二天早上 8 点。备份保留时间建议 2 周以上,也可以根据用户实际要求调整,超过备份保留周期的虚拟机增量备份会与虚拟机全量备份进行合并。建议勾选“自动清理备份点,节省备份空间”,可以节省备深信服科技版权所有文档密级:外部HA_Best_Practices_aCl

45、oud 5.3份空间。 自定义备份策略 当用户仅需要针对重要虚拟机备份时,建议使用自定义备份策略,并禁用默认备份策略。自定义备份策略与默认备份策略不同的地方在于用户需要选择部分虚拟机备份,新建虚拟机不会自动加入备份,如果后期再备份其他虚拟机需要手动将其加入该策略当中。建议用户根据虚拟机 SLA 等级选择制定不同的备份策略。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 5.1.4 虚拟机备份恢复 本地集群恢复 当虚拟机需要恢复时,如果用户本地企业级云平台可用,只需要到选择相应的备份文件进行恢复即可 深信服科技版权所

46、有文档密级:外部HA_Best_Practices_aCloud 5.3 异地集群恢复 将备份 NAS 或者 windows 共享目录挂载到新的集群上,平台自动识别出共享目录内已有备份文件进行恢复。 虚拟机快照5.2虚拟机快照类似于系统还原点,一个虚拟机可以存在多个快照。虚拟机快照通常应用于系统补丁、软件更新后导致系统或者服务异常等场景,用户可以通过快照来快速恢复系统,是一种方便使用的应急和系统回退操作手段,减少由于系统错误或人为错误引起的停机时间。虚拟机快照注意事项: 虚拟机开机创建快照会导致业务中断 1s 左右 快照恢复时虚拟机需要重启;另外,系统会自动

47、创建一个当前系统点的快照,防止系统还原后无法恢复到当前状态 建议仅针对需要还原的系统做快照,勿将快照作为备份使用。 快照创建 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 快照恢复 云平台配置备份恢复5.3企业级云平台支持对系统配置包括企业级云集群配置 、虚拟机备份策略、 高可用(HA)配置、动态热添加配置 、用户体验计划 、时间同步设置 、告警条件、集群资源调度配置、恢复 NUMA 配置等进行备份恢复。该特性解决了用户配置恢复的问题,增强了云平台的数据恢复能力。 深信服科技版权所有.

48、cn文档密级:外部HA_Best_Practices_aCloud 5.3当前系统配置备份支持系统自动备份、用户手动备份至本地两种备份方式,恢复则支持从系统自动备份以及本地备份两种方式恢复。 系统每天凌晨 12 点会自动备份,系统默认会保留一个月的配置备份。建议用户每个月进行手动备份一次,防止无法恢复几个月前的系统配置。 云平台回收站恢复5.4企业级云平台提供了类似 Windows 回收站功能,系统会将用户删除的网络设备、虚拟机、虚拟共享盘、备份文件自动放入回收站内保存 30 天,用户可以在回收站内恢复删除的文件,也可以彻底删除释放回收站空间。该特性有效解决了用户误删除导致业务中断或者数据丢失

49、的问题,提升了用户业务可用性。 回收站恢复注意事项: 回收站恢复后的网络设备和虚拟机不会恢复网络连接关系,需要手动添加。 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3 深信服科技版权所有文档密级:外部HA_Best_Practices_aCloud 5.3第6章 业务高可用Oracle RAC 集群6.1Oracle RAC 数据库作为数据中心的核心业务系统,在企业、政府、教育、医疗等行业被广泛应用。深信服企业级云平台在 I/O、网络、共享盘等领域做出重大创新,解决了虚拟化环境中

50、运行 Oracle 数据库系统原本存在的性能问题。 企业级云平台上的 Oracle RAC 支持向导式部署,数据库除了自带的多节点负载均衡和故障容错切换的能力外,还具备 rac 节点主机互斥、节点故障 HA 等高可用特性,进一步增强了Oracle 数据库的高可用性。 SQL Server AlwaysOn 集群6.2SQL Server AlwaysOn 集群作为微软新一代数据库全面的高可用性和恢复解决方案,在商业数据库领域大量应用。深信服企业级云平台优化了 SQL Server AlwaysOn 集群部署和性能,支持向导式部署 SQL Server AlwaysOn 集群,提供集群自带数据库级和实例级高可用性,支持多节点负载均衡和故障转移特性,同时具有故障 HA 等虚拟化平台特性,提高了 SQL Server AlwaysOn 集群的高可用性。 AD 服务器负载均衡6.3企业级云平台提供深信服国内领先的虚拟应用交付组件 vAD,vAD 提供了服务器负载、链路负载等功能,支持轮询、加权等多种负载均衡模式以及基于 cookie 等会话保持技术,支持多业务节点故障容错能力,并为分布式业务系统提供流量负载均衡功能,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论