版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 构建HyperSwap双活数据中心为确保数据始终可用,为保证业务持续在线,CIO们在过去花费了大量的时间、精力和金钱,但每每到关键时刻,往往事与愿违哪怕是斥巨资建立了所谓的“双活数据中心”。CIO们一度对“双活数据中心”给予了充分的信任,他们希望,双站点数据中心的可用性和恢复能力、从存储故障中断中立即恢复的能力、服务器故障“零延迟”切换的能力可以帮助他们实现对7x24苛刻可用性、可服务性的要求,能够满足公司领导层、业务层对IT业务服务水平协议的严格要求。但正如上面所说,他们当中的大部分人都以失望告终。在建设“双活数据中心”的过程中,许多CIO随着对“双活(Active-Active)”技术的
2、深入了解,吃惊的发现自己所正在建设的“双活数据中心”其实只是一种“代名词”而已,实则难以满足其双活、即时切换的能力,CIO们面对着这样的现实:“不同厂家对双活数据中心之理解和定义并不一致。部分厂家往往只着重市场影响力,将双活数据中心需求等同于该厂家提供之产品功能,但缺乏考虑总体拥有成本、应用交易性能影响、数据中心可维护性等因素。”可建立一个高可靠性、高可用性、高可切换的“双活数据中心”的诉求却并未在CIO们的心中减退,他们清醒的知道,对于一些关键的、核心的、维系企业信誉与存储的业务来说,他们必须要寻找到可靠的双活数据中心建设解决方案,他们了解,即便是有高度可靠的硬件体系、高可用的CDP(持续数
3、据保护)技术或是某些特殊的软件方法,一个由互为镜像的、双活的硬件架构与软件平台维系的“双活数据中心”仍然是灾难或某些特殊情况下所必不可少的。“7x24小时的可用性、多重的数据保护需求、客户已经兴建的多个数据中心把业务风险分散的需求、多个数据中心的使用率、企业级数据中心整体切换的需求以及利用双活数据中心实现业务或技术创新的需求等等构成了众多CIO对双活数据中心迫切的需求。”IBM技术专家曾经在2012 IBM Unix World高峰论坛上指出:“客户的需求虽然在演变,但作为可靠的、最后一道防范业务风险、提高业务终极可用性可靠性的方法,双活数据中心是无可取代的。”而更为重要的是,随着存储系统的设
4、计越来越复杂,数据尤其是在大数据时代的重要性越来越高,很多CIO也认识到,在双活数据中心内,存储系统的“零延迟”切换,无论是在主机故障还是存储子系统故障时,能够顺利的切换存储子系统、切换存储卷、确保数据一致性,是双活数据中心中面对的又一个新的难题。CIO们不是第一次陷入左右为难的境地:一边是业界“名词化”的双活数据中心,一边是迫切的需求与最可靠的业务风险“防火墙”,到底如何建设双活数据中心?又如何鉴定双活数据中心?又有哪些特色技术与解决方案、应用实例在双活数据中心解决方案中举足轻重?CIO如何确保存储系统的切换与数据一致性?我们将在此通过IBM Power Active-Active 双活数据
5、中心解决方案中的PowerHA HyperSwap 解决方案及参考架构略窥一二。建设双活数据中心: “最后防线”需细致考虑很多CIO将双活数据中心(Active-Active)称作企业数据中心的“最后防线”,这也就意味着,双活数据中心必须要在最关键的时刻确保最重要业务的近乎100%的应用可用性和业务可靠性,而要想达到这一水平,有不少问题需要提前考虑。无论任何厂商、任何解决方案,双活数据中心都必须解决以下技术挑战:1、双活数据中心要降低延迟,由于距离和传输环境的限制,越远距离的双活数据中心存在的延迟越大,由于光速限制,每 100km 所产生的数据来回延迟约为1ms。该延迟已经跟一般硬盘读写可比。
6、因此,会对实际应用性能构成影响。2、Quorum / Tie-Breaker 之需求 : 为了避免双活数据中心产生脑裂(Split Brain)或场地分割(site isolation) 状况,解决方案需要提供有效的Quorum / Tie-Breaker方式来保证数据完整性。3、业务交易中,应用所产生之写操作 (INSERT, UPDATE, DELETE)比例越高,则约多数据需要跨数据中心传送。这类型业务交易不利于双活数据中心设计。4、双活数据中心并不紧紧意味着服务器的双活和切换,存储系统的切换往往是双活数据中心建设中容易忽略的部分,在某些切换失败的案例或特殊情况下如仅需要从主存储系统的数
7、据卷切换热备存储系统的数据卷,数据卷与存储系统的切换失败,也是导致数据中心热备失效的重要原因。5、可以进行完整过程演练与业务模拟测试的双活数据中心意味着不会出现“书到用时方恨少”的尴尬情况,不少CIO在建立了双活数据中心之后,并未着手进行长期、常态化的演练,而是将“切换键”束之高阁,这往往会导致切换时出现难以预料的问题。除此以外,双活数据中心的一个重要作用是保证计划内停机维护的可能性,如果不能够满足计划内停机维护的需求,双活数据中心在灾难发生时更是难以奏效。6、明确双活数据中心的“双活(Active-Active)”是一种对称的工作负载关系,而不是主备关系(Activ-Standby)或“生产
8、和查询关系(Active-Query)”的快速接管/数据延续、非对称工作负载的关系,也就说,要明确双活数据中心中的两个数据中心都是活跃的且功能相同,这两个数据中心互为镜像而非谁或谁的备份、谁或谁的查询,其中任意一个数据中心都能够担当起相同的功能和工作负载。在上面的六条中,最后一条尤为值得注意,事实上,这也是双活数据中心之所以区别于此前的两类“双数据中心”建设模式的核心:首先,“双活”充分利用资源,避免了一个数据中心常年处于闲置状态而造成浪费。通过资源整合,“双活”数据中心的服务能力是双倍;其次,“双活”数据中心如果断了一个数据中心,另外一个数据中心还在运行,对用户来说是不可感知的。而一个灾备中
9、心的模式,如果生产数据中心瘫痪,需要半个小时、甚至两个小时、甚至更长时间才能启动灾备中心,在启动灾备中心的时间里,用户交易会严重受损。但双活数据中心也有一点存在极大的挑战,那就是数据的同步问题:两边的数据库都在受理业务,这就涉及双向数据同步问题,数据同步有存储层面的数据同步技术,也有数据库级的同步工具,而在双活数据中心的建设中,存储系统能否实现与主机的自由切换和业务延续,是双活数据中心中目前为止最具挑战性的技术难点。数据中心和服务可用性是 IT 基础架构的最重要课题之一,并且每天都会吸引更多的关注。站点之间的数据复制是一个最大限度地减少业务中断的好办法,因为备份还原操作所用的时间太长,无法满足
10、业务需求,或者设备可能被损坏,无法用于数据恢复,这取决于灾难程度。从最便宜的(恢复需要较长的时间)恢复到最昂贵的(提供最短的恢复时间,并且最接近零数据丢失)恢复,恢复选项的成本各不相同。PowerHA SystemMirror 7.1.2 Enterprise Edition 提供一个灾难恢复和高可用性解决方案,有助于自动化节点故障和应用程序事件,并提供高可用性。它有助于为选定存储的存储故障自动化恢复操作,控制站点(单独的数据中心)之间的存储复制,并支持整个站点故障的恢复,确保副本处于一致的状态,从而实现故障转移,使您能够构建一个灾难恢复解决方案。HyperSwap 是 PowerHA Sys
11、temMirror 7.1.2 Enterprise Edition 产品组合中的一个产品。这是一个针对存储错误而提供的功能,提供它是为了获得持续可用性。它以基于存储的同步复制 Peer-to-Peer Remote Copy (PPRC) 或 Metro Mirror 为基础。在被定向(或磁盘发生故障)时,访问主磁盘子系统的 IBM AIX 主机可以透明地切换到数据的备份副本,这样磁盘(如中间件)的使用者就不会受到影响。PowerHA HyperSwap:双活数据中心的基础架构解决方案HyperSwap 是一个几年前在 GDPS 中初次引入的特性,适用于 Metro Mirror PPRC(
12、同步)环境,它有助于即时切换 PPRC 镜像的磁盘子系统,从而增强 Parallel Sysplex 的弹性。假如主机和辅助存储子系统之间存在物理连接,那么 HyperSwap 技术可以让主机能够透明地将应用程序的 I/O 操作切换到辅助 Metro Mirror 卷。这使得用户能够从单一站点或所覆盖的多个位置提供持续运营。通过实现 HyperSwap,可以执行磁盘故障和维护功能,不会发生任何应用程序服务中断。该解决方案可为客户提供了更好的灾难恢复解决方案,并能证明 PowerHA 与 IBM 存储的紧密集成。HyperSwap 技术使得 PowerHA SystemMirror 能够为客户支
13、持以下功能:让主磁盘子系统不会成为单点故障,在所覆盖范围内提供更高水平的持续运营支持。支持无任何应用程序停机的存储维护。支持从旧到新的存储迁移。所有这些用例都被划分为两种类型的 HyperSwap 活动:计划外的 HyperSwap:当主存储发生故障时,托管应用程序的操作系统将会检测事件并做出反应,执行 PPRC 故障转移,因此,应用程序的 I/O 活动被透明地重定向到二级存储子系统,以便允许应用程序没有任何中断地继续运行。请注意,在本例中,操作系统的 Small Computer System Interface (SCSI) 磁盘驱动程序检测到错误,并跨多个主机做出决定,完全切换到辅助存储
14、子系统。在 HyperSwap 交换过程中,会暂时冻结 I/O 活动的进一步处理。请注意,应用程序在此期间不会遇到故障,而是遇到非致命性的延迟。计划内的 HyperSwap:在这种情况下,管理员主动发起一个从主存储子系统到辅助存储子系统的 HyperSwap。当管理员请求执行计划内 HyperSwap 时,会在集群中的主机之间进行协调,然后冻结 I/O 活动。先执行交换,然后允许继续执行 I/O 操作。计划内的 HyperSwap 有助于在主存储上执行维护任务,还有助于将数据从旧存储迁移到新购买的存储子系统。图 1:PowerHA SystemMirror HyperSwap 配置示例 HYP
15、ERLINK /developerworks/cn/aix/library/au-aix-hyper-swap/ l ibm-pcon 回页首AIX 的 HyperSwap 支持图 2 显示了支持 HyperSwap 的组件。图 2:支持 HyperSwap 的 AIX 组件AIX 的与 HyperSwap 相关的组件包括:Cluster Aware AIX (CAA)协调集群范围内的操作PowerHA HyperSwap 内核扩展与 CAA 配合,协调与其他节点的操作分析来自 PowerHA 框架和 AIX 存储框架的消息,并采取适当的措施确定交换操作AIX 存储框架对存储使用 AIX 接口
16、与 PowerHA HyperSwap 内核扩展紧密配合管理存储的状态将有关 I/O 错误的消息告诉 PowerHA HyperSwap 内核扩展从 PowerHA HyperSwap 内核扩展获取交换决定,并发送命令到 AIX PCM (MPIO)作为IBM双活数据中心的基础架构解决方案,PowerHA HyperSwap并非是一项技术那么简单,在PowerHA HyperSwap解决方案中,实际上包括了IBM整个中、高端数据中心的建设与运维解决方案,这一解决方案也依靠着IBM在主机、高端存储、灾难备份、数据中心建设上的经验而形成。PowerHA HyperSwap基于IBM完整的数据中心基
17、础架构,其中包括两套Power 7服务器、IBM的Unix操作系统AIX的6.1版本、PowerHA Enterprise Ed.7软件、最少两套IBM DS8800高端存储系统以及站点间高速互联解决方案。在PowerHA HyperSwap的解决方案中规划了两套完整的、互为“镜像”的、基于IBM Power7服务器和DS8800高端存储系统的数据中心基础架构,提高了双站点可用性和恢复能力,并且提供从存储中断立即恢复的能力:PowerHA HyperSwap将确保数据中心在服务器失效或存储失效的情况下,业务的连续性。同时,对于计划内的停机,其支持在对业务没有影响的情况下维护存储及进行存储迁移。
18、除此以外,PowerHA HyperSwap基础架构解决方案能够实现双活数据中心中很重要的“透明切换”功能,通过与PowerHA的整个解决方案整合,基于此建设的双活数据中心能够提供更完整的自动接管能力,而不需要过多的人工干预,且对用户的应用保持透明的状态这毕竟是由经过长期验证的IBM大型主机HyperSwap方案移植而来的技术,其现在虽然存在于IBM的Power服务器Power 770、Power 780身上,但却来自于像是zEnterprise EC12这样的大型主机系统。从功能上来说,PowerHA HyperSwap基本上遵循了双活数据中心的最基本的核心功能,在三类常见的场景中都能发挥其作用:1、 存储故障:DS8800存储系统发生故障,HyperSwap快速存储切换,RTO=秒级,RPO=0,应用不中断,数据库无需Rollback。2、 服务器故障:服务器发生故障,PowerHA触发服务器切换,数据库/应用需要重启,RTO=分钟级,RPO=0,应用重新连接。3、 数据中心全面故障:服务器和存储全部故障,PowerHA触发服务器切换,数据库/应用需
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论