HA和集群的概念_第1页
HA和集群的概念_第2页
HA和集群的概念_第3页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.1 什么是集群 简单的说集群 cluster 就是一组计算机它们 作为一个整体向用户提供一组网络资源。这些单个的计算机 系统就是集群的节点 node。一个理想的集群是用户从来不会 意识到集群系统底层的节点在他 /她们看来集群是一个系统 而非多个计算机系统。并且集群系统的管理员可以随意增加 和删改集群系统的节点。 1.2 集群系统的主要优点 1 高可 扩展性 2高可用性 HA 集群中的一个节点失效它的任务可传 递给其他节点。 可以有效防止单点失效。 3 高性能负载平衡 集群允许系统同时接入更多的用户。 4 高性价比可以采用廉 价的符合工业标准的硬件构造高性能的系统。 2.1 集群系统 的分类

2、 虽然根据集群系统的不同特征可以有多种分类方法 但是一般把集群系统分为两类1、高可用 High Availability集群简称 HA 集群。 这类集群致力于提供高度可靠的服务。 就是利用集群系统的容错性对外提供724 小时不间断的服务如高可用的文件服务器、数据库服务等关键应用。负载均衡集群使任务可以在集群中尽可能平均地分摊不同的计算 机进行处理充分利用集群的处理能力提高对任务的处理效 率。 在实际应用中这几种集群类型可能会混合使用以提供 更加高效稳定的服务。如在一个使用的网络流量负载均衡集 群中就会包含高可用的网络文件系统、高可用的网络服务。 2、性能计算 High Perfermance

3、Computing 集群简称 HPC 集 群也称为科学计算集群。 在这种集群上运行的是专门开发 的并行应用程序它可以把一个问题的数据分布到多台的计 算机上利用这些计算机的共同资源来完成计算任务从而可 以解决单机不能胜任的工作如问题规模太大单机计算速度 太慢。 这类集群致力于提供单个计算机所不能提供的强大 的计算能力。 如天气预报、 石油勘探与油藏模拟、 分子模拟、 生物计算等。 3.1 什么是高可用性 HA 计算机系统的可靠 性用平均无故障时间 MTTF 来度量即计算机系统平均能够正 常运行多长时间才发生一次故障。系统的可靠性越高平均无 故障时间越长。 可维护性用平均维修时间 MTTR 来度量

4、即系 统发生故障后维修和重新恢复正常运行平均花费的时间。系 统的可维护性越好平均维修时间越短。计算机系统的可用性 定义为 MTTF/MTTFMTTR 100 。由此可见计算机系统的可用 性定义为系统保持正常运行时间的百分比。 计算机产业界 通常用如下表所示的 9 的个数来划分计算机系统可用性的类 型。 可用性分类 可用水平 每年停机时间 容错可用性 999999 1 min 极高可用性 99999 5 min 具有故障自动恢复 能力的可用性 9999 53 min 高可用性 999 8.8 h 商品可用性 99 43.8h 负载均衡服务器的高可用性 为了屏蔽负载均衡服 务器的失效需要建立一个备

5、份机。主服务器和备份机上都运 行 High Availability 监控程序通过传送诸如 “I am alive 这”样 的信息来监控对方的运行状况。当备份机不能在一定的时间 内收到这样的信息时它就接管主服务器的服务 IP 并继续提供服务当备份管理器又从主管理器收到 “I am alive 这”样的信 息是它就释放服务 IP 地址这样的主管理器就开开始再次进 行集群管理的工作了。为在主服务器失效的情况下系统能正 常工作我们在主、备份机之间实现负载集群系统配置信息的 同步与备份保持二者系统的基本一致。 HA 的容错备援运作 过程 自动侦测 Auto-Detect 阶段由主机上的软件通过冗余侦

6、测线经由复杂的监听程序。逻辑判断来相互侦测对方运行的 情况所检查的项目有主机硬件 CPU 和周边、主机网络、 主机 操作系统、数据库引擎及其它应用程序、主机与磁盘阵列连 线。为确保侦测的正确性而防止错误的判断可设定安全侦测 时间包括侦测时间间隔侦测次数以调整安全系数并且由主 机的冗余通信连线将所汇集的讯息记录下来以供维护参考。 自动切换 Auto-Switch 阶段 某一主机如果确认对方故障则正 常主机除继续进行原来的任务还将依据各种容错备援模式 接管预先设定的备援作业程序并进行后续的程序及服务。 自动恢复 Auto-Recovery 阶段在正常主机代替故障主机工作 后故障主机可离线进行修复工

7、作。在故障主机修复后透过冗 余通讯线与原正常主机连线自动切换回修复完成的主机上。 整个回复过程完成由 EDI-HA 自动完成亦可依据预先配置选 择回复动作为半自动或不回复。3.2、 HA 三种工作方式 1、主从方式 非对称方式 工作原理主机工作备机处于监控准 备状况当主机宕机时备机接管主机的一切工作待主机恢复正常后按使用者的设定以自动或手动方式将服务切换到主机上运行数据的一致性通过共享存储系统解决。2、双机双工方式互备互援 工作原理两台主机同时运行各自的服务工 作且相互监测情况当任一台主机宕机时另一台主机立即接 管它的一切工作保证工作实时应用服务系统的关键数据存 放在共享存储系统中。3、集群工

8、作方式多服务器互备方式工作原理多台主机一起工作各自运行一个或几个服务各为 服务定义一个或多个备用主机当某个主机故障时运行在其 上的服务就可以被其它主机接管。 第一章 高可用性基础概 念 第二节 集群技术 集群技术是实现系统高可用性的重要 手段本节将讨论什么是服务器集群、如何建立服务器集群及 相关问题。 什么是服务器 集群 服务器集群是作为单一系 统进行管理的一组独立的服务器用于实现更高的可用性、可 管理性和更优异的可伸缩性。 怎样建立服务器集群 服务器 集群的最低要求是 a两台服务器通过网络互连b允许每台服务器访问对方的磁盘数据 c 专用的集群软件如 Microsoft Cluster Ser

9、ver MSCS 。专用软件可以提供包括故障检测、恢 复等多种服务并允许将服务器作为一个单一系统进行管理。 服务器集群有何优势 服务器集群拥有三项主要优势更高的 可用性、更方便的可管理性以及更经济高效的可伸缩性。 可 用性 MSCS 能够自动检测应用或服务器故障并可将其在幸 存服务器上快速重新启动而用户只会体验到瞬间的服务暂 停。 可管理性 MSCS 使管理员能够快速检查所有集群资源 的状态并轻松地将工作负载分配给集群之中的不同服务器。 这对于人工负载平衡十分有用并且无需将重要数据和应用 脱机即可对服务器进行 “滚动升级 ”。 可伸缩性 支持集群 的 应用可以通过 MSCS 应用程序接口 AP

10、I 使用 MSCS 服务从 而在一个集群中的多台服务器上实现动态负载平衡和扩展。 三种集群技术 共享磁盘最早的服务器集群允许所有服务器 访问所有磁盘。最初这种方式需要部署昂贵的线缆和交换机 并要求使用专用的软件和应用协调共享磁盘访问的专用软 件通常被称为分布式锁定管理器或 DLM 。今天像 SCSI 这 样的标准已经消除了对昂贵线缆和交换机的需求。然而共享 磁盘集群仍然需要使用经过专门改造的应用。这就意味着它 不能供广泛的应用所使用然而这些应用却被部署在每年销 售量达数以百万计的服务器之上。共享磁盘集群也存在着固 有的伸缩性局限因为当您在集群中增加服务器时 DLM 争用 是呈几何倍数增长的。

11、共享磁盘解决方案的实例包括 Digital VAX 集群和 Oracle 并行服务器。 镜像磁盘一种更为灵活的 替代方案是使所有服务器均拥有自己的磁盘并且运行这样 的软件即能够将一台服务器的每一次写入操作 “镜像 ”到至少 一台其它服务器的数据拷贝中。对于需要与主服务器数据保 持同步的灾难恢复站点应用来说这是一项非常重要的技术。 现在市场上有很多磁盘镜像解决方案例如 NetworkSpecialist NSI 、 Octopus、 Veritas 和 Vinca 均可提供用于 Windows NT Server 环境的解决方案。其中许多镜像厂商还 可提供类似于集群的高可用性扩展方案它们能够使用镜像 的数据拷贝在不同的服务器之间转移工作负载。然而镜像磁 盘故障恢复解决方案并不能够提供集群的可伸缩性优势。对 于它们是否永远无法提供与共享磁盘集群相同的高可用性 和可管理性尚有争议因为在进行镜像操作时总是有一段有 限的时间内两台服务器上的数据并不是完全相同的。 非共 享为解决共享磁盘集群的局限性现代集群解决方案采用了 “非共享 ”体系结构其中每一台服务器都拥有其自己的磁盘资 源换言之它们在任何时间均保持 “非”共享。一旦服务器发生 故障非共享集群的软

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论