




已阅读5页,还剩62页未读, 继续免费阅读
(计算机应用技术专业论文)web集群服务器的负载均衡和性能优化.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
北京邮电大学帧十论文 w e b 集群服务器负载均衡和件能优化 独创性( 或创新性) 声明 本人声明所早交的论文是本人在导师指导下进行的研究t 作及取得的研究成果。尽我所 知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不包含其他人已经发表或撰 写过的研究成果,也不包含为获得北京邮电火学或其他教育机构的学位或证书而使用过的材 料。与我一同t 作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢 意。 申请学位论文与资料若有不实之处, 本人签名:绸到军 本人承担一切相关责任。 日期:卫! :主:丛 关于论文使用授权的说明 学位论文作者完全了解j 匕京邮电人学有关保留和使用学位论文的规定,即:研究生在校 攻读学侮期间论文工作的知识产权单位属北京邮电人学。学校有权保留并向国家有关部门或 机构送交论文的复印件和磁盘,允许学位论文被查阅和借阅;学校可以公布学位论文的全部 或部分内容,可以允许采心影印、缩印或其它复制手段保存、 汇编学位论文。( 保密的学位 论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 1 、, 69m m l957fii0l哪y 北京邮l 乜人学顺十论文w e b 集群服务器负载均衡和性能优化的应用研究 w e b 集群服务器的负载均衡和性能优化 捅妻 近年来随着w e b 应用的不断扩展,基于w e b 所提供的服务种类也越来越多, 诸如:新闻服务、网上银行、电子商务等。互联网用户的高速增长,i n t e m e t 上 数据量爆炸式增加以及互联网用户体验要求的不断提高,都对服务器性能提出了 更高的要求。 基于单个服务器所提供的w e b 服务已经无法满足形式发展的需要。亟待解 决的问题就是通过使用一种廉价、有效的方式构建高可用、高性能的w e b 服务 器系统。 基于负载均衡的集群系统正是解决此问题的途径之一。目前,国内外各大公 司均推出了各自的集群系统,同时也存在多个基于开源的集群负载软件。但是, 这些技术均是专注于解决某一方面的问题,而未能提供一个整套的系统解决方 案。 本文有针对性地对基于负载均衡的w e b 服务器集群展开研究,不但关注解 决w e b 服务器的性能问题,还对服务器的可靠性,性能的监控和改善方面进行 了研究,提供了一整套可用且廉价的解决方案。 在本文中,首先对主流的w e b 服务器集群技术进行对比和归纳,研究常用 的负载均衡算法和l v s 系统的内部架构和特点;其次,通过在“成人教育模拟 练习考试系统 项目中的具体使用和检验,对系统性能做了实际的检验和优化。 本文所取得的突破和创新点是探索构建一整套的易用、可靠且廉价的基于负 载均衡的w r e b 服务器集群的方案。 该解决方案已经应用在北京邮电大学网络教育技术研究所的“成人教育练习 与模拟考试系统 的部署实施。在实际使用中,已经经过了上万人次的使用检验。 该系统在实际使用中,可以处理1 6 0 0 人峰值访问的性能需求。 关键字负载均衡w e b 集群l i n u x 虚拟服务器( l v s ) 调度算法 j r - 一 北京邮电大学颁十论文 w e b 集掰暇务器负载均衡和件能优化的廊用硼i 究 w e bc l u s t e rs e r v e rl o a db a l a n c i n g a n dp e r f o r m a n c ep t i m i z a t i o n a b s t r a c t i nr e c e n ty e a r s ,m o r ea n dm o r ek i n d so fw 曲a p p l i c a t i o n s , w h i c hb a s e do nw e bs e r v i c e s ,a r ep r o v i d e d ,s u c h 撼:n e w ss e r v i c e s , o n l i n eb a n k i n g , e - c o m m e r c e t h ei n t e r n e tu s e r sn u m b e rg r o w sr a p i d l y , t h ea m o u n to fd a t ao ni n t e r n e ti n c r e a s ee x p l o s i v e l ya n dt h ee x p e r i e n c e r e q u i r e m e n t so fi n t e m e tu s e rc o n t i n u et oi m p r o v e a l lo ft h e mn e e dt h e s e r v e rh a v eh i g h e rp e r f o r m a n c er e q u i r e m e n t s 腑bs e r v i c e sp r o v e db ys i n g l es e r v e rh a v eb e e nu n a b l et om e e t t h en e e d so ft h ed e v e l o p m e n t p r o b l e m st ob es o l v e da r es e a r c h in gf o ra c h e a p ,e f f e c t i v ew a y t ob u i l ds e v e r a lh i g h a v a i l a b i l i t y , h i g h - p e r f o r m a n c e w e bs e r v e rs y s t e m t h el o a db a l a n c i n gc l u s t e rs y s t e mi so n ew a yt o r e s o l v et h i si s s u e t h i sp a p e rf o c u s e so nl o a db a l a n c i n gc l u s t e rs e r v e ra n da r e m a i n l yd o n et h ef o l l o w i n ga r e a s : 1 c o m p a r e a n di n d u c ta b o u tt h ec u r r e n tm a i n s t r e a m t e c h n o l o g yf o rw e bs e r v e rc l u s t e r s ; 2 s t u d yo fc o m m o n l yu s e dl v s l o a db a l a n c i n ga l g o r i t h m sa n d t h e s y s t e m s i n t e m a ls t r u c t u r ea n dc h a r a c t e r i s t i c s ,a n ds i m u l a t i o n e x e r c i s e sa i m e da ta d u l te d u c a t i o ne x a m i n a t i o ns y s t e mc h a r a c t e r i s t i c s ,i n t h ec ! u s t e rs y s t e mu s e di nt h ew e i g h t e dl e a s tc o n n e c t i o n sa l g o r i t h ma sa l o a d b a l a n c i n gs c h e d u l i n ga l g o r i t h m , 。 3 u s eo fl i n u xv i r t u a ls e r v e r ( l v s ) a sas y s t e ms o l u t i o n , 一u s i n gd i r e c tr o u t i n g ( d r ) l o a db a l a n c i n g m o d e 4 ,t h r o u g ht h eh e a r t b e a tm e c h a n i s mt ob r i n gf r o n t e n dl o a d b a l a n c i n g d e v i c e sa n db a c k u p e q u a l i z e r m u t u a lh e a l t h m o n i t o r i n g , t h r o u g ht h er e a l i z a t i o no f t w om a c h i n e sk e e p a l i v e df a i l o v e r ( f a i l o v e r ) , 北京邮i 【l 大学硕十论文 w e b 集群眦务器负载均衡和性能优化的麻用研究 5 s t u d yt h ep e r f o r m a n c eo fw e bcl u s t e rs y s t e mm o n i t o r i n g t e c h n o l o g y , a c c o r d i n g t o t h e c h a r a c t e r i s t i c so fa d u l te d u c a t i o n e x a m i n a t i o n s y s t e mu s i n g ac o m b i n a t i o no fp h p s y s i n f oa n dc a c t i m o n i t o r i n gm o d e : k e yw o r d s :l o a db a l a n c i n gw e bc l u s t e r linux v i r t u a ls e r v e r ( l v s ) s c h e d u l i n g 1 3 本文课题米源和研究t 作- 5 - 1 4 论文结构- 6 - 第二章负载均衡集群的关键技术- 7 - 2 1 集群概述- 7 - 2 1 1 什么是集群:。- 7 2 1 2 集群的分类- 7 2 1 3 集群系统的优势- 8 2 2 负载均衡技术一8 - 2 2 1 负载均衡的概念9 2 2 2 负载均衡调度算法- 9 - 2 2 3 负载均衡技术的分类一1 7 2 3 高可用技术一2 4 2 3 1 高可用性的定义和相关标准一2 4 2 3 2 高可用性的t 作模式和- t 作原理一2 5 一 一 2 3 3 高可心集群的关键组成部分2 6 2 4 系统性能监测和分析技术- 2 6 2 4 1s n m p 协议介绍2 7 - 2 4 2l i n u x 服务器性能监测技术一2 7 - 2 4 3l i n u x 服务器流量监测技术3 l 第三章应用实例一3 3 - 3 1 成人教育练习与模拟考试系统- 3 3 一 3 1 1 系统介绍- 3 3 - 3 1 2 存在的问题- 3 3 3 2 系统的具体部署方案3 4 一 3 2 1 硬件环境。一3 4 - 3 2 3 部署方案设计j 一3 5 - 3 3 系统的部署实施过科:。j :3 5 - 3 3 1 软件配置和i p 设置。“- 3 5 - 3 3 2i p v s a d m 的安装部署:- 3 6 3 3 3k e e p a l i v e d 的安装部署。:。3 9 3 3 4 两个基于p h p 的系统监控软件o 4 3 - 第四章系统性能测试分析一4 7 4 1 系统监测方案一4 7 - 4 2 数据分析和结论一4 7 - 第五章结论- 5 1 - l v 些京坐电人学侦f :论文w e b 集群服务器负载均衡和性能优化的廊用研究 5 1 创柏i 点51 5 2 刁i 足之处5 1 参考文献5 2 致谢5 4 攻读学位期间发表的论文目录:5 5 v 行、网上购物等等。从而也导致网络上的数据量不断增长,网络带宽不断扩展。 1 1 课题提出背景 从上世纪9 0 年代开始,计算机和互联网技术得到了飞速的发展。尤其是近 十年来,更是得到了突飞猛进的发展。如今,计算机技术已经发展成为以网络为 中心的计算时代。由于客户服务器模型的简单性、易管理性和易维护性,客户 服务器计算模式在网上被大量采用。在九十年代中期,万维网( w o r l dw i d ew r e b ) 的出现以其简单操作方式将图文并茂的网上信息带给普通大众,w e b 也正在从一 种内容发送机制成为一种服务平台,大量的服务和应用( 如新闻服务、网上银行、 电子商务等) 都是在w e b 服务器上进行【l j 。这就到导致了大量的计算机接入 i n t e m e t 和i n t e m e t 用户的爆炸式增长。根据中国互联网信息网络中心( c n n i c ) 发布的最新统计报告显示,截至2 0 0 8 年底,中国网民规模达到2 9 8 亿人,较2 0 0 7 年增长4 1 9 ,互联网普及率达到2 2 6 ,略高于全球平均水平( 2 1 9 ) 。继 2 0 0 8 年6 月中国网民规模超过美国,成为全球第一之后,中国的_ 百联网普及再 次实现飞跃,赶上并超过了全球平均水平【2 】。图1 1 是历年来中国网民数量的变 化。 万人 3 卯0 0 3 0 0 0 0 2 知 2 0 0 l 弼0 0 1 0 0 0 0 加加 0 班 斟 班蚌蚌避埒 】i 卜 口_ l m n_ o口口oo口oo oooooooo “n“。n i _ 一两民规模( 万人) 一增长辈i 2 0 0 1 5 0 1 0 0 加 0 图1 - 12 0 0 0 2 0 0 8 年中国网民规模与增长率2 1 i n t e m e t 的飞速发展给网络带宽和服务器带来丫巨人的烁j j 和挑战。从网络 北京邮电大学侦十论文w e b 集群服务器负载均狮和r i :能优化的f 蒂 丰j7 i j f 究 技术发展来看,网络带宽的增长速度安远远高于处理器速度和内存访问迷度的增 长,如今如1 0 0 me t h e r n e t 、a t m 、g i g a b i te t h e m e t 等不断地涌现,10 g i g a b i t e t h e m e t 即将就绪,在年干网上密集波分复用( d w d m ) 将成为宽带i p 的书流 技术1 3 ,4 j ,l u c e n t 已经推出在一根光纤跑8 0 0 g i g a b i t 的产品【5 1 。因此,目前和未来 的一个时期内,网络瓶颈都将在| ) ( ;9 络服务器端存在。同时,多项研究结果表明: 千兆以太网( g i g a b i te t h e m e t ) 适配器在服务器上很难达到1 g b s 的吞吐量。其 主要原因是协议栈( t c p i p ) 、操作系统( o s ) 和处理器的低效。因此,在对协 议的处理方式、操作系统调度方式和i o 处理操作做优化性研究之外,打破高速 互联网上单台服务器提供网络服务的模式也成为一个重要的研究方向。 同时,由于很多网络站点的访问量爆炸式增长,导敛系统负载过重,不能提 供快捷有效的服务,从而大大降低了网络服务质量。因此,如何建立一个可伸缩、 易扩展的网络服务架构来满足不断增长的负载需求已经成为一个追在j e j 睫的问 题。 。 目前,网络节点的可靠性也成为高质量网络服务重点关注点之一。大部分的 网站都需要提供7x2 4 ( 每周7 天,每天2 4 小时) 的不间断服务,尤其是对网 上银行类和电子商务类,诸如:b 2 b 、b 2 c ,更是如此。因为,任何服务的中断 和关键性数据的丢失都会造成巨大的经济损失。 现在的w e b 服务中应用了大量的c g i 、动态页面等c p u 密集型应用。这些 应用都需要服务器具有较高的处理能力:而且未来的网络服务也必将提供更丰富 的内容、更好的交互性和更高的安全性。这就需要提供网络服务的服务器系统具 有性能更强的c p u 和i o 吞吐能力。例如,通过h t t p s l 6 l ( s e c u r eh t t p ) 取一个 静态页面需要处理的步骤裴比通过h t t p 取一个静态页面的处理步骤高出一个 数量级u j ,h t t p s 是目前电子商务类网站所广泛采用的技术。因此,网络流量并 不能说明全部问题。服务器系统的设计既要考虑到应用本身的特点和发展需求, 也要考虑满足越来越强的处理性能需求。 因此,构建一种能够不断满足硬件和软件都具有高可伸缩性和高可用性的网 络服务系统成为一个迫切的需求,研究如何实现满足上述应用需求并具有可扩展 性的应用服务器系统便成了一项紧迫的任务: 1 2 国内外技术发展现状 对于上述问题,目前最优化、性价比最高的解决方案就是采用w e b 服务器 集群系统。w e b 服务器集群是使用多台w e b 服务器同时向外部客户提供w e b 服 务器的一种计算机系统。它通常采用负载均衡1 6 1 将到达的访问请求分配到集群中 的某台处理器| 二进行处理,并上l 通过数据冗余和动态系统监测等。办武米实现系统 北京邮电大学硕十论文w e b 集群服务器负载均衡和傩能优化的f 每用珂f 究 的高可用性。在集群系统中,对于单个w e b 服务器节点的性能受求并不高,当 w e b 服务器集群尤法满足用户的访问需要时,通过在集群中增加服务器节点的方 式即可解决此问题。当集群中的某个服务器节点发牛故障时,其他服务器可以替 代其向外的服务,故集群可以提供不问断的可靠服务。 因此,采用w e b 服务器集群系统是解决上面所提到问题的最佳方案。 集群可以分为同构和异构,其具体的区别就在于组成集群系统的计算机之间 的体系结构是否相同。集群计算机按功能和结构可以分成以下几类:高可用性集 群( h i g h a v a i l a b i l i t y ( h a ) c l u s t e r s ) 、负载均衡集群( l o a db a l a n c i n gc l u s t e r s ) 、 高性能计算集群( h i g h p e r f o r m a n c e ( h p c ) c l u s t e r s ) 和网格计算( g r i dc o m p u t i n g ) p j 。但是,在使用时往往所构建的集群的功能均为多样化的,而不是某一种特定 的集群。 一一 近年来,针对w | e b 服务器集群系统的设计和实现,国内外的许多公司和学 术机构都进行了大量的研究,并取得丰硕的成果,提出了各种不同的解决方案。 同时,随着l i n u x 系统的不断发展和走向成熟,其健壮性也不断增强,并且也提 供了g u n 组件和标准化的p v m ,m p i 消息传递机制,最重要的是l i n u x 为p c 机提供了对高性能网络的支持【8 】,从而大大促进了基于l i n u x 的集群系统的发展。 目前,比较著名的w e b 服务器集群系统丰要有以下几种: d e c 的v m sc l u s t e r 系统 美国d e c 公司( d i g i t a le q u i p m e n tc o r p o r a t i o n ) 所开发的v m sc l u s t e r 系统相 对较早,技术也较成熟,应用也相当广泛,但由于v m s 操作系统只能在d e c 公司的v a x 系列和a l p h a 系列服务器上运行,v m sc l u s t e r 的应用受到很大限制 1 8 1 o m i c r o s o f t 的集群系统 m i c r o s o f t 公司也在很早之前就开始集群方面的研究。早在19 9 5 年开始, m i c r o s o f t 公司就开始了集群系统的开发工作。w i n d o w s 2 0 0 0 中首次引入了集群 功能,该高可用性集群叫做w - o l f p a c k ,通常也称为m i c r o s o f tc l u s t e rs e r v e r ( m c s ) 。该系统主要为基于w i n d o w sn t 服务器的企业级应用程序提供可用性 和可扩展性。, 一 m i c r o s o f t 提供了三种实现集群的技术:网络负载均衡( n l b ) 、组件负载均 衡( c l b ) 和m i c r o s o f t 集群服务( m s c s ) 。 网络负载均衡( n l b ) 的主要工作机制是将负载均衡的分发到同一个n l b 集群中的多个w e b 站点或应用程序上。该技术可以实现一个最多3 2 台服务器节 点的集群,所有服务器节点共享一个虚拟i p 地址。网络负载均衡( n l b ) 具有 较高的可伸缩性用i 可用性。 北京邮电大学颁十论文 w e b 集群服务器负载均衡和性能优化的廊用耐f 究 组件负载均衡( c l b ) 则是将负载均衡到多个运行站点业务逻辑的服务器上。 该技术可以在包含最多8 个等f 司,| 】 务器的服务器集群中实现c o m 组件的动态均 衡。其丰安实现机制是通过作用于多层集群网络的中间件与网络负载均衡和集群 服务配合工作。 m i c r o s o f t 的集群服务易于安装配置,且可以支持6 4 位服务,支持虚拟集群, 支持i g m p 协议。t 日确定是只能在w i n d o w s 操作系统平台下使用,且支持的节 点数量较少,因此m c b 通常应用在中小企j 的服务器集群中。 w e b s p h e r e w e b s p h e r e 是i b m 公司所推出的一套功能强大的w e b 应用服务器。 w e b s p h e r e 专注于为企业级w e b 应用程序的创建提供了一个可靠、一致的框架。 它可以支持的多种平台和标准,比如:在操作系统方面,涵盖了从p c 机到大 型机的各类操作系统;支持j 2 e e 、c o r b a 、a c t i v e x 接口;支持多种关系对 象层次数据库;w e b s p h e r e 提供了负载均衡、失效恢复和集群等功能,任何对 应用程序或其配置的修改,包括j a v a 组件的更新,将会在多个服务器上自动备 份复制。w e b s p h e r e 有多层次的可调整的缓存技术。同时,w e b s p h e r e 还提供 了功能完备的操作环境,包括了操作管理、日志分析、性能数据的测试和报告、 性能调整:】二具等一整套 :具,方便了使用者对应用服务器的配置、监控和管理等 工作。w e b s p h e r e 具有很强的集成能力,i b m 提供了其产品线上的一系列产品 来支持w e b s p h e r e 。 w e b s p h c r e 所提供的集群解决方案能够提供宽带管理、缓存、文件管理与复 制,以及卓越的负载均衡功能,从而达到使多个服务器像一个服务器一样的工作, 可大大增加访问频繁的网站的容量。该方案的安全性由i b m 电子网络防火墙提 供保证。两者之间强有力的联合可使单个或分布的网站在降低带宽资源占用与提 高安全性的同时,保证终端用户响应的质量以及站点规模的持续增长【9 】。 l i n u xv i r t u a ls e r v e r l i n u xv i r t u a ls e r v e r ( l v s ) 是章文嵩博士等人开发的l i n u x 服务器集群自 由软件项目。该项目提出了基于i p 层乖i 基于内容请求分发的负载均衡调度解决 7 j 。法,并在l i n u x 内核中实现了这些方法,将一组服务器构成一个具有可伸缩 性的、提供高可用网络服务的虚拟服务器。 l v s 集群采用了l p 负载均衡技术。l v s 巾实现负载均衡的技术有三种: 基于n a t 的负载均筏( v s n a t ) ,使用i p 隧道的负载均衡( v s t u n ) ,使用直接 路由的负载均衡( v s d r ) 。l v s 中的调度器实现了八种负载调度算法:轮转调度、 加杖轮转调度、最少链接调度、加权最少链接调度、基于局部性的最少链接调度、 带复制的基于局部性最少链接调度、f j 标地址散列调度、源地址散列渊度。l v s 北京邮电大学颁,i :论文 w e b 集群服务器负载均衡和性能优化的应用研究 中实现了基于内容请求分发的内核l a y e r - 7 交换机k i c p v s 。l v s 使用相关的 集群管理软件对资源进行监测,能及时将故障屏蔽,实现系统的高可用性。l v s 配备了丰、从调度器,当丰调度器故障时,从调度器可以接替工作,进一步地保 证了系统的高可用性。 l v s 的应用很广泛,它支持可伸缩的w e b 服务,可伸缩媒体服务,可伸缩 c a c h e 服务,可伸缩邮件服务。l v s 服务器集群系统具有良好的伸缩性,可支 持几百万个并发连接。实践证明,l v s 服务器具有优良的可靠性。 由于l v s 集群软件是可以免费得到源代码的自由软件,它得到了较大的应 用。很多重负载的站点利用l v s 组成高性能的w e b 服务集群,如r e d h a t , 红旗l i n u x ,中软等公司推出了基于l v s 的集群产品。同时,国内外的许多学 术机构也在对l v s 进行进一步的研究开发。 本文所提出的研究课题和解决方案也是基于l i n u x 系统下l v s 开源框架所 进行的。 1 3 本文课题来源和研究工作 本文是基于北京邮电大学网络教育研究所所开发的成人模拟练习考试系统 ( p r i c t i c e b u p t i c e t c o m ) 的部署运行为课题来源。 为了方便北京邮电大学网络教育学院的函授、远程学牛进行平时练习、作业 和模拟考试等学习活动,北京邮电大学网络教育技术研究所开发这套远程学习系 统。通过使用该系统,授课教师可以将练习、平时作业和模拟考试等任务发布出 去,函授、远程类学牛则可以通过远程登录此系统来完成相应的任务,从而改善 和提高了平时学习的效率,提高了授课质量。 随着使用该系统的用户人数的不断增加,原有的单个服务器节点已经无法满 足需求,因此必须通过在后台部署多个服务器节点,前台提供一个统一的访问接 口来对不断增加的访问请求进行负载均衡处理,以便于用户有更好的访问体验。 本文在如何构建负载均衡系统并对其性能进行监控和优化方面做了如下工 作: 。 。( 1 ) 对集群系统尤其是负载均衡集群做了深入细致的调研和研究,根据网 络教育技术研究所现有硬件设施并分析其应用需求及特征j 选择恰当的技术方 案。 一一 ( 2 ) 深入研究基于l v s 的负载均衡集群系统的构建方式,分析不同负载均 衡调度策略和算法的性能及优缺点,根据系统应用的实际情况选择恰当的调度策 略和算法。 ( 3 ) 根据系统应用实场i 情况的需要,构建前端分发器的备份,并设立心跳 北京邮电大学颁_ f j 论文w e b 集杵服务器负载均撕和r l :能优化的膨h j 研究 监控机制,保证系统的高可靠性;构建系统监摇! 系统,监控后台各个服务器节点 的动态负载大小情况。 1 4 论文结构 本文在深入客观分析当前负载均衡服务器集群的体系结构,请求调度方法、 算法和分发机制的基础上,提出了基于l v s 的负载均衡架构来构建负载均衡集 群的方案。通过大量的实践研究和实验,本文提出了一种廉价的、高可用性、高 扩展性的基于开源软件的构建方案,并作了比较深入的理论研究。 本文年要内容包括如下几部分: 第一章中主要对当前网络服务发展现状和存在问题做了系统分析,并介绍了 当前主流的解决方案利产品。同时,也介绍本论文的课题来源和研究基础。 第二章对本文中所涉及的丰要技术,包括集群、负载均衡、高可用性以及系 统性能监测和分析技术做了细致地介绍、研究和分析。 第三章则对该负载均衡的应用实例成人教育练习与模拟考试系统的硬 件环境、部署方案和具体的部署实施细节做了详细的介绍。 第四章则主要介绍系统监控数据的提取和分析方法,以便于对系统进行性能 分析并进行优化。 第五章则是对整个论文乃至本人在研究牛期间的研究工作的一个总结,说明 了该论文的创新点和不足之处。 集群( c l u s t e r ) 全称为计算机集群,它通过组松散集成的计算机软件和 或硬件连接起来高度紧密地协作完成计算工作。1 7 j 在某种意义上,他们可以被看作是一台计算机。集群系统中的单个计算机通 常称为节点( n o t r e ) ,通常通过局域网连接,但也有其它的可能连接方式。对于组 成集群的节点没有特殊要求,既可以是服务器、工作站,也可以是p c 机,还可 以是大型机。但是,就目前发展形势来看,多数企业级集群采用价格相对低廉的 小型服务器作为集群节点。集群中的节点在保持计算机系统完备性的情况下,还 必须保证可以和其他节点协同工作,形成一个单一、集成的系统资源,这是节点 的一个重要特征。 集群计算机通常用来改进单个计算机的计算速度和或可靠性。一般情况下 集群计算机比单个计算机,比如工作站或超级计算机性能价格比要高得多。这也 是计算机集群被越来越广泛地使用在大型w e b 服务应用环境的原因。 2 1 2 集群的分类 集群的分类的方法有多种。若按照组成集群系统的计算机节点之间的体系结 构是否相同来分,可以分为同构集群和异构集群。按照组成集群的各个节点的耦 合程度来分,则可以分成松耦合集群和紧耦合集群。通常情况下,采用的分类方 法是根据计算机集群的功能和结构将其分为: 高可用性集群h i g h a v a i l a b i l i t y ( h a ) c l u s t e r s 高可用性集群能够提供7 天* 2 4 小时的不问断服务。如果集群中的某个节点 出现故障,则必须能够通过失效备援( f a i l o v e r ) t l o l $ 1 j 将其上的服务自动迁移 到其他的备份服务节点上。同时,保证可以对故障节点进行离线维护,并再次上 线。节点的恢复过程不会影响整个集群的对外服务。 负载均衡集群l o a db a l a n c i n gc l u s t e r s 负载均衡集群在对外提供服务时,一般通过一个或多个前端负载均衡器将服 务请求动态分发到后端的一组服务器一1 了点上。此类集群的设计目标是提供快速的 北京邮电人学帧。f j 论文 w e b 袋群服务器负载均撕和性能优化的麻用研究 事务处理和相应能力,l 叫时对系统的高w j j 性捌高扩展性也有较高的要求。负载 均衡集群也被称为服务器群( s e r v e rf a r m ) 。通常情况下,这类集群兼有高可用 性和负载均衡两方面的特性。 l i n u x 虚拟服务器( l v s ) 项目在l i n u x 操作系统上提供了最常用的负载均 衡软件,是目前最具影响力和使用最广泛的负载均衡技术之一。 高性能计算集群h i g h - p e r f o r m a n c e ( h p c ) c l u s t e r s 高性能计算集群采用将大型的计算任务分解并分配到不同的计算节点上进 行处理,已达到提高整个运算的目的。该类集群丰要应用在科学计算领域。 网格计算g r i dc o m p u t i n g 网格计算或成为网格集群是通过连接一组相关并不信任的计算机,来完成某 一些计算任务,其运作过程更像是一个计算公共设施而非一个独立计算机。通常, 。 网格可以支持更多不同类型的计算机。网格主要服务于管理在独立执行工作的计 。算机问的作业分配,针对有许多独立作业的工作任务做优化,在计算过程中作业 问无需共享数据。 一 2 1 3 集群系统的优势 集群并不是一个全新的概念。早在上世纪7 0 年代,各大计算机制造厂商和 相关研究机构已经开始进行集群系统的研究和开发工作,并开始在科学工程计算 领域开始应用。但由于普通的使用者往往接触不到这些领域,因此也很少听说集 群相关的技术。直到l i n u x 集群的出现,集群的概念和相关技术才得到相对广泛 的传播。 提高c p u 丰频和总线带宽是最初提高计算机性能的牛要手段。但是,这种 方法必然受到硬件发展水平的限制,因此是有限度的。于是,人们又开始通过增 加单台计算机巾的c p u 个数和内存容量的方式来改善性能,于是出现了向量机 和对称多处理机( s m p ) 等。当c p u 个数超过某个阈值后,整个系统的扩展性 将会变得很差。原凶征于,系统前端总线( f s b ) 并不能提供满足多个c p u 访 问内存所需要的足够宽的传输通道。与s m p 不同的是,集群系统的性能会随着 c p u 的个数的增加几乎是线性变化的,参见图2 1 所示。 2 2 负载均衡技术 集群构建完成以后,为了保证集群能够更高效地工作,必须把发送到集群的 所有服务请求,甲均的分配到后端的服务节点上,使后端的各个服务节点的负载 基木上平衡。这就需要片j 到负载均衡技术。 北京邮l u 大学顾十沦文 w e b 集群服务器负载均衡和性能优化的应用硼 究 图2 - 1几种计算机系统的可扩展性【1 2 2 1 负载均衡的概念 为了改善系统的性能,通过在多台计算机之间合理地分配负载,使各台计算 机的负载基本均衡,这种计算能力共享的形式,通常被称为负载均衡或负载共享。 一般来说,”负载均衡”要达到的目标是使各台计算机之间的负载基本均衡,而” 负载共享”意味着只是简单的负载的重新分配。1 1 2 1 目前,业界对负载均衡的概念尚无一个完整和统一的说法。笔者在参阅了大 量相关文献后,总结如下:为了解决数据和业务爆炸式增长而给单一服务器带来 的巨大处理压力,并避免因此而不断更新硬件系统,所提出的通过一种廉价、有 效和透明的方法以扩展现有网络设备和服务器的带宽、增加吞吐量、加强网络数 据处理能力、提高网络的灵活性和可用性的技术就是负载均衡( l o a db a l a n c e ) 。 从本质上来讲,负载均衡是一种技术。负载均衡技术追求的目标:( 1 ) 尽可 能小的请求响应时间;( 2 ) 能够动态应对负载的变化;( 3 ) 高可靠性。 在w e b 服务集群中,决定集群的负载均衡效果的丰要有两个关键因素:负 载均衡调度算法和负载均衡技术。下面的两部分篇幅就丰要介绍这两个方面的内 容。 。 。 。 一。_ 一- 。, 2 2 2 负载均衡调度算法 一, 负载均衡调度算法的丰要用途是为负载均衡集群提供不同负载分配方式。那 么,负载均衡集群的构建者就可以根据不同的使用环境和系统设计目标选择合适 的算法。 根据章文嵩博:l - 在l v s 项日网站上的相关文章1 1 】的介绍,常用的负载均衡调 北京邮电大学顺十论文 w e b 染群h 务器负载均衡和性能优化的廊川研究 度算法t 要有以下几种: ( 1 ) 轮叫调度( r o u n d - r o b i ns c h e d u l i n g ) 轮叫调度算法的简称为r r 调度算法。r r 调度算法的基本原理是当请求发 送到前端负载均衡器时,负载均衡器将服务依次分配到后端服务节点,比如,后 端有n 各节点,则从1 到n 进行分配,然后下一轮接着从新开始分配。 r r 调度算法的流程如下: 假设有一组服务器s = s o ,s 1 ,s n 1 ) ,一个指示变量i 表示上一次选择 的服务器,w ( s i ) 表示服务器s i 的权值。变量i 被初始化为n 1 ,其中n 0 。 j = i ; d o :。j 一( ;+ 1 ) m o dn ; 一, = i f ( w ( s j ) o ) +一 ! 二 i j ; :“赡u ms i ; w h i l e ( i ! = i ) ; r e t u r nn u l l ; r r 调度算法适用于集群中所有服务节点都采用相同的软硬件配置并且服务 请求相对均衡的情况。r r 调度算法的缺点是没有考虑不同服务节点提供服务的 能力不同、服务器的负载情况等因素。因此,某些情况下,采用此种调度算法时, 负载均衡的效果不太理想。 ( 2 ) d w 权轮叫调度( w e i g h t e dr o u n d r o b i ns c h e d u l i n g ) 加权轮叫调度算法的简称为w r r 调度算法。w r r 调度算法的基本原理是 在r r 调度算法的基础上,根据服务器节点的处理能力的不同,分别赋予不| 一j 的 权值。w r r 算法按照权值的高低和轮转方式将请求分配到不同的j 】 务器节点。 w r r 调度算法的具体流程如下: 假设有一组服务器s = s o ,s i ,s n - 1 ) ,w ( s i ) 表示服务器s i 的权值,一个指示变量 i 表示上一次选择的服务器,指示变量c w 表示当前调度服务节点的权值,m a x ( s ) 表示集合s 中所有服务器的最大权值,g c d ( s ) 表示集合s 中所有服务器权值的最大公约数。变量i 初始 化为1 ,c w 初始化为零 w h i l e ( t r u e ) i 一( i + 1 j m o dn ; i f ( i = = o ) c w = c w g c d ( s ) ; 就不会被调度;当所有服务器的权值为零,即对于任意i 有w ( s i ) = o 时,则没有 任何服务节点可用,w r r 调度算法返回n u l l ,所有的连接请求都会被丢弃。 w r r 调度,因此不记录当前所有连接的状态。 该调度算法按照权值的高低和轮转方式分配到不同的服务节点。权值较高的 服务节点比权值低的服务节点处理更多的服务请求,相同权值的服务节点处理大 致相同的连接数。前端分发器可以自动询问服务节点的负载情况,并动态调整服 务节点的权值。因此,该算法的调度效果要比r r 算法好。 ( 3 ) 最小连接调度( l e a s t c o n n e c t i o ns c h e d u l i n g ) 最小连接调度算法的简称为l c 调度算法。该算法的牛要工作原理是每次有 新的服务请求到达时,前端分发器就会选择后端服务节点中负载最小的一个,并 将该服务请求分配给它。 - l c 调度算法的具体流程如下: 假设有一组服务器s = s o ,s l ,s n - 1 ) ,w ( s i ) 表示服务器s i 的权值,c ( s i ) 表示服务器 s i 的当前连接数。 f o r ( m = o ;m o ) f o r ( i m + l ;i n ;i + + ) ? i f ( w ( s i ) c ( s i ) 孛w ( s m ) 同时保证服务器的权值为零时,服务器不被调度所以,算法只要执行以下 流程。 r e t u m s m ; ) r e t u r nn u l l ; 。翟一 。 。 ( 5 ) 基于局部性的最少链接( l o c a l i t y b a s e dl e a
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 优化休闲体育资源配置与基础设施建设
- 工业污染源排污因子动态更新
- 防中毒窒息考试题及答案
- 管理层股权股权激励协议范本5篇
- 光伏玻璃砂生产项目环境影响报告书
- 12英寸射频芯片生产线项目节能评估报告
- 单证基础试题及答案
- 超星法律基础试题及答案
- 山东基础会计试题及答案
- 离婚后财产分割与婚姻关系终止补充协议
- 马克思主义发展史课件
- GB/T 5780-2016六角头螺栓C级
- GB 1903.50-2020食品安全国家标准食品营养强化剂胆钙化醇(维生素D3)
- 横河DCS-培训讲义课件
- 部编版三年级下册语文全册课件【完整版】
- 初中数学几何1000题专项训练(含详解分析)-最新
- 外滩建筑介绍
- 青少年亲社会行为量表
- 你好,无废校园主题班会
- 中药煎服方法
- 研发支出辅助账汇总表
评论
0/150
提交评论