HA和集群的概念_第1页
HA和集群的概念_第2页
HA和集群的概念_第3页
HA和集群的概念_第4页
HA和集群的概念_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.1 什么是集群 简单的说集群cluster就是一组计算机它们作为一个整体向用户提供一组网络资源。这些单个的计算机系统就是集群的节点node。一个理想的集群是用户从来不会意识到集群系统底层的节点在他/她们看来集群是一个系统而非多个计算机系统。并且集群系统的管理员可以随意增加和删改集群系统的节点。 1.2 集群系统的主要优点 1高可扩展性 2高可用性HA集群中的一个节点失效它的任务可传递给其他节点。可以有效防止单点失效。 3高性能负载平衡集群允许系统同时接入更多的用户。 4高性价比可以采用廉价的符合工业标准的硬件构造高性能的系统。 2.1 集群系统的分类 虽然根据集群系统的不同特征可以有多种分类方法但是一般把集群系统分为两类 1、高可用High Availability集群简称HA集群。 这类集群致力于提供高度可靠的服务。就是利用集群系统的容错性对外提供724小时不间断的服务如高可用的文件服务器、数据库服务等关键应用。 负载均衡集群使任务可以在集群中尽可能平均地分摊不同的计算机进行处理充分利用集群的处理能力提高对任务的处理效率。 在实际应用中这几种集群类型可能会混合使用以提供更加高效稳定的服务。如在一个使用的网络流量负载均衡集群中就会包含高可用的网络文件系统、高可用的网络服务。 2、性能计算High Perfermance Computing集群简称HPC集群也称为科学计算集群。 在这种集群上运行的是专门开发的并行应用程序它可以把一个问题的数据分布到多台的计算机上利用这些计算机的共同资源来完成计算任务从而可以解决单机不能胜任的工作如问题规模太大单机计算速度太慢。 这类集群致力于提供单个计算机所不能提供的强大的计算能力。如天气预报、石油勘探与油藏模拟、分子模拟、生物计算等。 3.1 什么是高可用性 HA 计算机系统的可靠性用平均无故障时间MTTF来度量即计算机系统平均能够正常运行多长时间才发生一次故障。系统的可靠性越高平均无故障时间越长。可维护性用平均维修时间MTTR来度量即系统发生故障后维修和重新恢复正常运行平均花费的时间。系统的可维护性越好平均维修时间越短。计算机系统的可用性定义为MTTF/MTTFMTTR 100。由此可见计算机系统的可用性定义为系统保持正常运行时间的百分比。 计算机产业界通常用如下表所示的9的个数来划分计算机系统可用性的类型。 可用性分类 可用水平 每年停机时间 容错可用性 999999 1 min 极高可用性 99999 5 min 具有故障自动恢复能力的可用性 9999 53 min 高可用性 999 8.8 h 商品可用性 99 43.8h 负载均衡服务器的高可用性 为了屏蔽负载均衡服务器的失效需要建立一个备份机。主服务器和备份机上都运行High Availability监控程序通过传送诸如“I am alive”这样的信息来监控对方的运行状况。当备份机不能在一定的时间内收到这样的信息时它就接管主服务器的服务IP并继续提供服务当备份管理器又从主管理器收到“I am alive”这样的信息是它就释放服务IP地址这样的主管理器就开开始再次进行集群管理的工作了。为在主服务器失效的情况下系统能正常工作我们在主、备份机之间实现负载集群系统配置信息的同步与备份保持二者系统的基本一致。 HA的容错备援运作过程 自动侦测Auto-Detect阶段由主机上的软件通过冗余侦测线经由复杂的监听程序。逻辑判断来相互侦测对方运行的情况所检查的项目有主机硬件CPU和周边、主机网络、主机操作系统、数据库引擎及其它应用程序、主机与磁盘阵列连线。为确保侦测的正确性而防止错误的判断可设定安全侦测时间包括侦测时间间隔侦测次数以调整安全系数并且由主机的冗余通信连线将所汇集的讯息记录下来以供维护参考。 自动切换Auto-Switch阶段 某一主机如果确认对方故障则正常主机除继续进行原来的任务还将依据各种容错备援模式接管预先设定的备援作业程序并进行后续的程序及服务。 自动恢复Auto-Recovery阶段在正常主机代替故障主机工作后故障主机可离线进行修复工作。在故障主机修复后透过冗余通讯线与原正常主机连线自动切换回修复完成的主机上。整个回复过程完成由EDI-HA自动完成亦可依据预先配置选择回复动作为半自动或不回复。 3.2、HA三种工作方式 1、主从方式 非对称方式 工作原理主机工作备机处于监控准备状况当主机宕机时备机接管主机的一切工作待主机恢复正常后按使用者的设定以自动或手动方式将服务切换到主机上运行数据的一致性通过共享存储系统解决。 2、双机双工方式互备互援 工作原理两台主机同时运行各自的服务工作且相互监测情况当任一台主机宕机时另一台主机立即接管它的一切工作保证工作实时应用服务系统的关键数据存放在共享存储系统中。 3、集群工作方式多服务器互备方式 工作原理多台主机一起工作各自运行一个或几个服务各为服务定义一个或多个备用主机当某个主机故障时运行在其上的服务就可以被其它主机接管。 第一章 高可用性基础概念 第二节 集群技术 集群技术是实现系统高可用性的重要手段本节将讨论什么是服务器集群、如何建立服务器集群及相关问题。 什么是服务器 集群 服务器集群是作为单一系统进行管理的一组独立的服务器用于实现更高的可用性、可管理性和更优异的可伸缩性。 怎样建立服务器集群 服务器集群的最低要求是a两台服务器通过网络互连b允许每台服务器访问对方的磁盘数据c专用的集群软件如 Microsoft Cluster Server MSCS。专用软件可以提供包括故障检测、恢复等多种服务并允许将服务器作为一个单一系统进行管理。 服务器集群有何优势 服务器集群拥有三项主要优势更高的可用性、更方便的可管理性以及更经济高效的可伸缩性。 可用性 MSCS能够自动检测应用或服务器故障并可将其在幸存服务器上快速重新启动而用户只会体验到瞬间的服务暂停。 可管理性 MSCS使管理员能够快速检查所有集群资源的状态并轻松地将工作负载分配给集群之中的不同服务器。这对于人工负载平衡十分有用并且无需将重要数据和应用脱机即可对服务器进行“滚动升级”。 可伸缩性 支持集群 的应用可以通过 MSCS应用程序接口 API使用 MSCS服务从而在一个集群中的多台服务器上实现动态负载平衡和扩展。 三种集群技术 共享磁盘最早的服务器集群允许所有服务器访问所有磁盘。最初这种方式需要部署昂贵的线缆和交换机并要求使用专用的软件和应用协调共享磁盘访问的专用软件通常被称为分布式锁定管理器或 DLM。今天像 SCSI这样的标准已经消除了对昂贵线缆和交换机的需求。然而共享磁盘集群仍然需要使用经过专门改造的应用。这就意味着它不能供广泛的应用所使用然而这些应用却被部署在每年销售量达数以百万计的服务器之上。共享磁盘集群也存在着固有的伸缩性局限因为当您在集群中增加服务器时 DLM争用是呈几何倍数增长的。共享磁盘解决方案的实例包括 Digital VAX集群和 Oracle并行服务器。 镜像磁盘一种更为灵活的替代方案是使所有服务器均拥有自己的磁盘并且运行这样的软件即能够将一台服务器的每一次写入操作“镜像”到至少一台其它服务器的数据拷贝中。对于需要与主服务器数据保持同步的灾难恢复站点应用来说这是一项非常重要的技术。现在市场上有很多磁盘镜像解决方案例如 Network Specialist NSI、 Octopus、 Veritas和 Vinca均可提供用于 Windows NT Server环境的解决方案。其中许多镜像厂商还可提供类似于集群的高可用性扩展方案它们能够使用镜像的数据拷贝在不同的服务器之间转移工作负载。然而镜像磁盘故障恢复解决方案并不能够提供集群的可伸缩性优势。对于它们是否永远无法提供与共享磁盘集群相同的高可用性和可管理性尚有争议因为在进行镜像操作时总是有一段有限的时间内两台服务器上的数据并不是完全相同的。 非共享为解决共享磁盘集群的局限性现代集群解决方案采用了“非共享”体系结构其中每一台服务器都拥有其自己的磁盘资源换言之它们在任何时间均保持“非”共享。一旦服务器发生故障非共享集群的软件能够将

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论