




已阅读5页,还剩63页未读, 继续免费阅读
(计算机软件与理论专业论文)分布式计算在企业环境下的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
分布式计算在企业环境下的应用研究 浙江大学硕士学位论文 摘 面 f 3 6 8 7 0 7 暑乏 ? f 随着计算机技术的发展,网络化,分布化已经成为信息技术的主要趋势。 企业环境下的计算机应用从集中式向分布式发展,特别是地域上分布广泛的大 中型企业,通过建立内部局域网,搭建广域网,连接i n t e r n e t 等手段实现企业 管理的信息基础平台。然而企业网建设不是一蹴而就的,在建设过程中伴随着 技术的不断发展,既要保证旧系统的可用性,又要充分体现新技术的优势,整 个系统的结构变得越来越复杂,增加了系统维护工作量,限制了今后的系统扩 、厂。 展能力。j 通过分布式计算手段,建立一种适合企业环境的分布模式,对现有的 。-。,一 系统进行整合,简化系统结构,提高系统性能,是本文的主要目的。 ( 在浙江省粮食局和储备粮管理公司的全省储备粮综合管理信息系统( g m i s ) 的开发过程中,构造了一个以分布式对象技术为核心的分布式计算环境服务器 框架,在此基础上提供了一系列服务,实现了资源的透明访问,各子系统的互 操作,分布的并行计算。g m i s 的开发是本文的实践基础厂y i ,v j 分布式计算是一个广义的概念,本文锗二奄对分布式计算在企业范围内应 用涉及到的技术要点进行了介绍包要包括 资源、结构以及与常规计算的区别。 分布式计算的本质、基本功能 远程调用和分布式对象技术是实现分布式计算的核心技术。本文第 网络连接与i o 通信手段进行了分析,比较了两种网络接口的性能,对目前三 种主要的分布式对象技术:d c o m 、c o r b a 、j a v a b e a n s 的发展历史,主要功能, 优势与缺陷,实现手段进行了详细的介绍和比较,对两种远程调用规范d c er p c 、 a w d 圳i 进行了简单的介绍和比较。饼确定了本系统实现的主要技术:以 c o m d c o m 为对象实现技术,以r p c 为辅助实现技术。 设计与实现分布式计算应用服务器及其一系列服务是本系统的直接目的, , 本文第四剖对设计与实现过程进行了详细的讨论,主要包括服务器框架设计; 刚络连接的管理,采用连接池提高连接的效率;统一数据访问传输服务;系统 配置管理服务;分布计算的并行策略及实现。 、 主题词:分布式计算:企业网:广域网,网络接口j 分布式对象技术,远程 , 调用:连接管理y 结构化存储,配置管理,并行计算。 2 0 0 1 年3 月 。 瀛 望苎蔓:堂垒些! 垡! 塑窒里竺塞 塑垩盔堂婴主堂竺丝奎 a b s t r a c t w i t ht h ed e v e l o p m e n to fc o m p u t e rs c i e n c e n e t w o r k i n ga n dd i s t r i b u t i n g h a v eb e e nt h em a i nt r e n do fi - i i d u r i n gt h et r a n s f o r m a t i o no fa p p l i c a t i o nf r o m c e n t r a l i z a t i o nt o d i s t r i b u t i o n ,t h em i d l a r g es c a l ee n t e r p r i s e sc o n s t r u c tt h e i r b a s ei n f o r m a t i o n p l a t f o r m 。w i t h t h em e t h o do f b u i l d i n gl a n m n i n t e m e t c o n n e c t i o n h o w e v e r , c o n s t r u c t i o ns u c hp l a t f o r mc a nn o tf i n i s h e di ns h o r tt i m e w i t ht h eq u i c k l yd e v e l o p i n gj tt e c h n o l o g y , o nt h eo n eh a n d ,w es h o u l dk e e p t h eo l d s y s t e ma v a i l a b i l i t y ,o n t h e no t h e rh a n d ,w es h o u l dm a t e r i a l i z et h e a d v a n t a g eo fn e wt e c h n o l o g y t h ew h o l es y s t e mw 川b ef r o mc o m p l e x i t yt o c o m p l e x i t y ,w h i c h i n c r e a s e st h el a b o ro fm a i n t e n a n c e r e s t r i c t st h es y s t e m e x p a n s i b i l i t y t h em a i no b j e c to ft h i sp a p e ri s u s i n gd i s t r i b u t e dc o m p u t i n g t o b u i l dac o m p u t i n gp a t t e r nf i t sf o re n t e r p r i s ee n v i r o n m e n t i n t e g r a t ea n d s i m p l i f y t h ec u r r e n ts y s t e m s ,i m p r o v et h es y s t e mp e r f o r m a n c e d u r i n gt h ed e v e l o p m e n to fi n t e g r a t e dg r a i n r e s e r v em a n a g e rl n f o r m a t i o n s y s t e m ( g m l s ) f o rg r a i na d m i n i s t r a t i o no fz h e j i a n gp r o v i n c e ,w ec o n s t r u c ta d i s t r i b u t e dc o m p u t i n gs e r v e rf r a m e w o r kb a s eo nd i s t r i b u t e d o b j e c tt e c h n o l o g y a n d p r o v i d em a n y s e r v i c e si ni h ef r a m e w o r kt o f m p l e m e n t r e s o u r c e t r a n s p a r e n ta c c e s s ,i n l e r o p e r a b jj j t y b e t w e e nd i f f e r e n t s u b s y s t e m s a n d d i s t r i b u t e dp a r a l l e lc o m p u t i n g d i s t r i b u t e d c o m p u t i n g i sa g e n e r a l i z e dc o n c e p t t h es e c o n dc h a p t e r i n t r o d u c e st h et e c h n i c a lo u t l i n e sr e l a t e dt oe n t e r p r i s ec o m p u t i n ge n v i r o n m e n t w h i c hi n c l u d el h ee s s e n c e ,b a s i cf u n c t i o n s ,r e s o u r c e a r c h i t e c t u r ea n dt h e d i f f e r e n c ew i t hn o r m a lc o m p u t i n g r e m o t ec a l ia n d d i s t r i b u t e d o b j e c t a r ek e r n e l t e c h n o l o g y i n i m p l e m e n t a t i o n d i s t r i b u t e d c o m p u t i n g t h et h i r d c h a p t e ra n a l y z e sn e t w o r k c o n n e c t i o na n di oc o m m u n i c a t i o nm e t h o d s m a k ea c o m p a r i s o no ft w o n e t w o r ki n t e r f a c e s t h r e em a i nd i s t r i b u t e d o b j e c tt e c h n o l o g i e sa r ed i s c u s s e d i nd e t a i la b o u tt h e i rh i s t o r y , f u n c t i o n s ,a d v a n t a g e sa n d d i s a d v a n t a g e sw e a l s o m a k eac o m p a r i s o no ft h e m b yt h ew a y , 1 w or e m o t ec a l fs p e c i f i c a t i o n sd c e r p ca n dj a v ar m l a r ei n t r o d u c e da n dc o m p a r e di nb r i e f w em a k ea d e c i s i o no fu s ec o m ,d c o ma sm a i ni m p l e m e n tt e c h n o l o g ya n du s er p ca s a c c e s s o r i a io n e d e s i g na n di m p l e m e n ff h ed i s t r i b u t e dc o m p u t i n ga p p l i c a t i o ns e r v e ra n d s e r v i c e sa r ed i r e c to b j e c t s i nt h ef o r t hc h a p t e r , t h ed e s i g na n di m p l e m e n t a t i o n a r ed i s c u s s e dj nd e t a i l w h i c hj n c l u d e a p p s e r v e rf r a m e w o r k c o n n e c t i o n m a n a g e m e n t ,c o n n e c t i o np o o i 。u n i f i c a t i o nd a t aa c c e s sa n dt r a n s l a t es e r v i c e 。 s y s t e mc o n f i g u r em a n a g e m e n ts e r v i c e ,d i s t r i b u t e d c o m p u t i n gp a r a l l e ls t r a t e g y a n d i m p l e m e n t a t i o n , 2 0 0 1 年3 月 分布式计算在企业环境下的应用研究 浙江大学硕士学位论文 1 1 前言 第一章绪论 人们在计算机领域内的贯追求是“性能好、易使用、高可信、价格廉”。 计算机领域内技术发展的趋势正在遵循着这个要求。所谓“性能好”是追求能 使计算机的处理速度更快,存储容量更大,通信带宽更高,性能价格比更好; 所谓“易使用”是追求能使更多的人更方便地使用计算机,使计算机能够应用 于更多的领域;所谓“高可信”是追求能使计算机系统的正确性更有保证,计 算机系统的可靠性和容错特性更好,安全性和抵御攻击的能力更有保障:而“价 格廉”是追求计算机的应用能够更加普及。 计算机软件技术发展有个重要规律,凡有助于缩小人机隔阂,有助于建 立和谐人机环境的理论、方法、技术和产品都具有强大的生命力,例如,大规 模并行( m ) 、多媒体( m ) 、开放系统( 0 ) 、面向对象( 0 ) 和网络计算( n ) 等 技术,均因为在建立和谐人机环境方面成效显著而成为当今的主流技术( 简称 砌o o n 技术) 。 按照这样的规律,当今值得重视的软件发展趋势是“面向个人、主动服务; 面向对象、开发群体;网际协同、网内合作;多维信息、智能处理;资源共享、 安全可靠”。这些提法几乎遍及了计算机科学领域的各个方面。一个令人感兴趣 的趋势是网络的大规模普及化,如何让软件在网络上发挥更大的作用是软件理 论与工程领域追求的目标。 近2 0 年来,信息技术行业中最富于戏剧性的变化,莫过于大型机在时代舞 台上的逐渐隐去,而让各种网络工作站唱上了主角。在这个变化中,终端用户 获得了比以前更为强大的处理能力,分布于整个网络上的硬件资源也拥有了比 以前更强大的功能。数据中心和无尘微机室一去不复返了,取而代之的是桌面 计算机,工作组服务器,以及小型机。这种变化最初是从硬件上开始的,而目 前则更多地体现在软件方面,所以,我们现在的任务是,开发更适合这些分布 式硬件资源的软件应用环境。 目前,拥有分布式计算资源的计算机网络已经十分普遍,那么,在多种资 源间进行分布式相关的处理不仅具有现实意义,而且还产生了比较急迫的要求。 数年以来,针对分布式处理,人们研制出了多种处理机制并在实践上加以一定 的运用,其中包括简单的数据共享到复杂的多层次服务支持系统。这种变化是 计算机硬件与软件技术发展的体现。 1 2 计算模式的变迁 传统计算模式的特点就是计算任务的集中。在计算机应用的早期,用来进 行主要科学计算,当时计算机硬件成本占整个系统的比重相当大,计算机科学 2 0 0 1 年3 月 分布式计算在企业环境下的应用研究 浙江大学硕士学位论文 研究的任务是如何提高主机的运行速度。随着计算机应用的普及,企业成为计 算应用的主体,为了满足不断发展的计算要求,人们提出了种种方案,在硬件 方面:提高芯片的运算速度,提高存储器速度,提高i o 速度,采用流水线技 术等,在软件方面:采用多任务操作系统,引入批处理程序,进行各种方式的 优化等,其目的都在于尽量提高单个计算机的运行效率。从计算机技术在企业 范围内投入使用之后的五十余年时间内,经历了以下的计算模式。 1 2 1 主机+ 终端模式 传统计算模式在硬件上的典型结构是主机十终端。主机是一个具有很强运算 与存储能力的计算机,终端仅仅是用户操作接口,本身没有计算能力。这样的 计算环境是一个封闭的环境。在某些系统中,主机计算能力不足,无法及时完 成任务;而在有些系统中,主机计算能力过剩,造成资源浪费。 在这种结构下,程序只能运行在主机上。整个系统往往是一个单独的应用 程序,程序包含了所有的计算过程,包括数据的输入输出,数据的处理。应用 越复杂,程序就越大,系统设计开发的难度也就越大。在设计阶段要求设计人 员必须面面俱到,从复杂的逻辑结构中整理出程序设计文档;在开发阶段,软 件开发人员之间的协作比较困难:在测试和维护阶段,对软件的局部改动会影 响到整体。 主机+ 终端结构 六七十年代,随着计算机硬件成本的降低,特别是小型机和p c 机的出现, 使计算机的应用逐渐开始普及。网络的出现,使各种数据资源分布在不同的机 器上,用户对资源共享的要求目益提高。这个阶段出现了文件服务器,系统以 文件的方式提供共享资源,用户可以通过网络直接存取这些文件。这种计算模 式仅仅实现了有限的资源共享,未能在应用层上达到分布式的计算。这一方面 是软件技术仍停留在集中式计算模型上,更重要的原因是网络技术还没有成熟, 没有能够提供一种规范的访问接口,无法在其基础上开发具有通用性的应用。 1 2 2 客户服务模式 进入八十年代以后,出现了c s 结构的计算模式,这是一种简单的分布式 2 0 0 1 年3 月 +i2 “,一, 。o 潦蕊錾撼勰蕊蠢,。玉 2 坌翌型垄垒些堡堡! 塑皇里里壅 塑婆查兰堡主兰堡笙奎 计算模型。这种客户服务模式的计算大大推动了计算机应用的发展。在这个阶 段软件技术已经从集中式发展到模块化和面向对象,网络技术日趋成熟,出现 了标准的网络调用接口,使分布式计算有了坚实的基础。客户机具有计算能力, 客户机与服务器直接连接,请求特定的服务,服务器响应请求,处理后返回给 客户机。经过十几年的发展,这种c s 计算模式己经相当成熟,在实际应用中 取得了非常好的效果。但是随着计算机网络的进一步发展,计算机应用要求的 提高,c s 模式已经越来越力不从心,显示出了严重的弊端。 两层c s 结构计算模式 在这种结构下,软件模型的工作过程是这样的:客户端主动地提出请求, 通过网络传递到指定的服务器,服务端接收请求进行计算并返回计算结果。服 务端通常进行数据维护,集中存储计算,客户端进行人机交互,进行业务规则 的处理。这种模型带来的问题在于由于客户端处理业务规则,特别是在业务多 变,职责交叉的环境中,系统开发会出现互相重叠甚至矛盾冲突的情况,使得 系统难以维护管理,可扩充性不好。如果客户端任务过多,增加了系统维护与 管理的复杂度,如果过分集中在服务端,又降低了系统的灵活性,无法实现应 用通过网络分布化的要求。另外由于服务器是事先指定并且是唯一的,往往成 为系统的瓶颈,而且这种结构不支持异构数据库之间的互操作。难以支持复杂 的应用环境。 1 2 3 多层客户服务模式 多层客户机服务器( m u l t i t i e rc i l e n t s e r v e r ) 模式是简单两层c s 模 式的发展。两层结构的c s 模式下,用户界面与后台数据被明确地区分开来, 根据需要,业务处理逻辑放在客户端或者数据库服务器端。但是随着应用的发 展,业务逻辑越来越复杂,放在客户端将导致程序变得庞大难以维护,放在数 据库服务器端会导致服务器负载过重。因此提出了把业务逻辑处理层独立出来 的多层c s 模式,这种多层结构建立了一种针对分布式应用系统的软件建模模 型。当然实现多层c s 模式的应用开发仅仅依靠两层c s 结构的开发环境是不 2 1 年3 月 分布式计算在企业环境下的应用研究 浙江大学硕士学位论文 够的,必须有各种支持工具和环境才能实现。 两层c s 结构计算模式 1 2 4 分布式对象模式 随着网络结构的复杂化,分布式应用结构也相应变得越来越复杂,如果仍 采用过程化思路,系统会变得难以设计,对象技术的发展解决了这个问题。对 象具有封装性、继承性和多态性,能够支持软件重用,并易于扩充,能够较好 地适应复杂大系统不断发展和变化的要求。对象具有的这些特点使之非常适宜 在分布的网络环境中构造应用。分布式对象模式是对多层c s 模式的扩展,使 得在l a n w a n i n t e r n e t 上的应用更加便于设计和开发,为了支持分布式对象模 式,目前有多种分布式对象环境:d c o m ,c o r b a ,e j b 等。目前在分布式对象领域 的主要研究重点在于提高效率,提高可靠性。 1 3 传统计算方式在网络化时代的缺陷 进入8 0 年代以后,网络化的浪潮迅速崛起,局域网技术日趋成熟,广域网 也初现雏形,特别是9 0 年代以后i n t e r n e t 的普及,更是标志着全球网络化的 到来。与此同时,应用的复杂度越来越高,地理分布状况也越来越广泛,资源 的分布与需求的不一致要求要以一种新的观念来定义分布式计算,要用新的软 件模型来适应复杂多变的分布式应用环境。 c s 计算模型本身缺乏控制机制,由于其运行环境的网络基础是单一的局 域网,网络传播介质与协议都比较一致,网络速度与服务质量都可以很好地保 证,这些问题尚不突出。而在广域网或i n t e r n e t 上,传输介质复杂,网络协议 不一致,网络速度难以预见,服务质量得不到保证。在这种环境下,如果继续 2 1 年3 月 五- 分布式计算在企业环境下的应用研究 浙江大学硕士学位论文 不加改进地使用c s 模型构建应用系统,系统会变得非常脆弱而无法正常使用。 而且c s 计算模式采用客户端直接请求服务,当客户数量增加时,服务端为维 护每个连接的开销增加,服务端性能会急剧下降,使服务端无法完成预定的任 务。 此外,由于操作系统平台以及开发工具的多样化,使各种资源以不同的形 式存在,即使是在同一个企业中,由于技术的进步和软硬件环境的变化,各种 应用之间也存在着很大的不兼容性,如何适应技术的发展,是网络异构分布式 环境下的一个重要问题。 最后,一个分布式计算系统具有运行在一些计算机_ i z i 拘客户机进程和服务 器进程,它们用某一网络协议进行通信。在大多数分布式系统中,客户机向服 务器请求完成某一项具体功能,而服务器则完成这个功能。在这种模型中,客 户机与服务器关系十分紧密,要求双方彼此要详细地知道对方如何工作,如何 进行通信。这样做对于中小型规模的软件系统,可以比较容易地构造并迅速实 现,但如果系统进一步扩大,或者要求与其他系统兼容,则要求客户机与服务 器双方同时做出修改,是整个系统的升级与维护工作量迅速膨胀,从而大大降 低了软件使用的效率。 1 4 为适应网络化而的产生分布式计算 分布式计算引入了一个全新的设计和扩展概念,它增加了软件产品的复杂 性。某些应用本身就带有分布性,例如跨区域的企业级应用系统,远程会议系 统等等。因此,一种健壮的分布式计算框架所带来的好处是不言自明的。 很多其它的应用也是分布式的,即它至少有两个组件运行在不同的计算机 上,但是因为它不是为分布性应用而设计的,所以它们的规模和可扩展性就有 很大的局限性。任何的工作流或群件应用程序,大多数的客户机服务器应用程 序以及一些桌面办公系统本质上都控制着它们的用户的通讯和协作。将这些系 统作为分布式系统并能够在正确的地方运行正确的组件会给用户带来好处,并 且使人们对网络和计算机资源的运用更加充满信心。设计应用程序时考虑到分 布性,能通过在客户端运行组件使应用适用于具有不同性能的不同的客户。设 计应用时考虑分布性能够使系统在扩展上具有很高的灵活性。分布式应用与它 们的非分布式版本比起来具有更大的可扩展性。 如果整个复杂应用的逻辑结构可以用一个简单的模型来表示,那么仅仅只 有一种方法来增加系统的工作效率:用更快的机器,而无需对应用本身进行调 整。虽然现在的服务器和操作系统升级很快,但是买一个同样性能的机器还是 比将服务器的速度升级为原来的两倍所花的钱少。有了一个设计适当的分布式 应用系统,把整个应用的计算进行分割,允许分割后的各个部分能够各自独立 运行,通过协调合作共同完成一项计算任务。一台功能不怎么强大的服务器就 能够运行若干个计算部分,其他计算部分可以扩展到价格便宜的附加的机器上, 这样就可以完成原来一台计算机难以完成的计算任务。 由于分布式计算需要将计算分布到不同的机器上。需要网络作为传输介质。 目前各种操作系统对网络的支持已经十分完善,提供了传输层的网络接口,屏 蔽了网络传输控制的细节,简化了分布式计算的通信,分布式计算有了坚实的 基础。我们可以在一个理想的网络模型上。集中精力设计分布式计算的功能布 2 0 0 1 年3 月 一= j j = 。j ,蠡蕊:i 躺。惹蹦鑫函瓣鞠淄甾l 巍瀛蒜毯 - 5 - 式致的服务,这就需要在异质的分布的环境下通过技术手段对应用进行整合。 因此,企业级分布式计算主要关注在异质网络环境下进行业务整合与互操作。 为了实现这个目的,绝大多数的企业采用了不同的技术来实现分布式计算。就 是因为存在这种实际需求,才产生了现在各种各样的分布式应用技术。 6 本论文研究的内容与目标 在为浙江省粮食局和省储备粮管理公司建设储备粮综合信息管理系统 ( g m 【s ) 的过程中,我们逐步采用了分布式技术对整个系统的各个子系统和模 块进行设计和改进,主要关注以下几个方面: 1 更优良的广域网络连接与数据传输机制; 2 满足分布式应用的服务器框架; 3 分布式系统自动配置管理; 4 适合具体应用的数据访问技术; 5 大数据量计算的分布策略及实施方法; 分布式计算在应用领域的研究主要面向两个方向:集中计算任务的分布, 异质分布计算的整合。针对这两方面的问题,结合g m i s 系统对的具体要求,本 文详细讨论了各种分布式计算的方法与核心概念,发展历史,关键技术,支持 工具与环境,并以6 m i s 应用环境为基础提出了一个分布式计算的应用实例,应 用分布式对象技术和网络传输技术,提出了分布式计算服务器框架模型,给出 了基于这个模型的一系列服务,建立了分布式计算的异步控制机制,完成了广 域企业网范围内的应用实例。在系统投入试运行的近一年时间里。运行稳定, 各个子系统的业务功能得到了充分的整合,数据资源实现了透明的共享,促进 了粮油管理部门的业务水平和管理能力的提高。本文的最后对分布式计算的发 展前景进行了总结。 2 1 年3 月6 坌塑垫盐簦堡垒些变堡! 竺壁里堡塞 塑兰查兰堡主兰堡丝苎 第二章分布式计算理论基础 2 1 什么是分布式计算 简而言之,分布式计算是两个或多个软件之间互相共享信息。这些软件既 可以在同一台机器上运行,也可以在通过网络连起来的几台不同的机器上运行。 绝大多数的分布式计算是基于客户机服务器模型的。在客户机服务器模型内, 有两类主要的软件:客户机软件,它提出信息或服务的请求;服务器软件,则 提供这种信息或服务。 分布式计算的优点在于:可以共享某些稀有资源,例如某一台高性能打印 机;可以实现计算负载的平衡;可以根据需要把应用程序放在特定的机器上; 可以提高大计算任务的运行效率。计算机计算任务的分布可以分为两大类:上 行分布( u p s i z i n g ) 和下行分布( d o w n s i z i n g ) 。前者把业务从分布的节点转移 到网络分布式计算,后者把业务从大型机转移到分布的可计算节点上。 2 2 分布式计算包含那些内容? 分布计算系统由集中式计算系统和客户机服务器计算机系统发展演化而 来,基本上是客户机服务器计算的规模扩展。数据不是位于一台服务器,而 可能是多台服务器上,这些服务器也可能位于地理上分散的地区,通过广域网 ( w a n ) 连接起来。这样的系统通常叫做企业网( i n t r a n e t ) ,这是因为它们能 将许多原先独立的计算机系统加入到工作组、部门、分支和组织的分部中去。 那么,为什么一个组织以这种方式分散它的数据呢? 这有以下优点: 分布式计算模型基于如下假设,即一个组织有许多类型的数据,它们在 各自独立站点上收集。但许多站点用户要求访问这些数据。将数据放在 非集中站点中,本地管理者可以对熟悉的数据保持控制; 对物理网络的高度适应性。w a n 链接的花费是分散数据的另个动机。 如果一组远地用户经常访问同样的数据,那么将数据放在本地而不是通 过费时又费钱的帆n 链路提供访问是合情合理的。当然,有时w a n 链路 还是要对远程用户提供访问。因此网络链路的物理构成情况成为软件结 构设计时需要考虑的重要问题; 提高数据安全性。数据分散化提供了对数据丢失及系统崩溃时的保护。 其它地方的数据备份既易于各地用户访问又提供了冗余; 利用成熟的客户机服务器模式。分布式系统利用了支持分布式处理的 客户机服务器机制,分布式处理具有使多台不同的计算机起完成一 项处理任务的能力: 系统性能价格比的综合考虑。分布式系统有硬件优点。廉价的个人机系 2 0 0 1 年3 月 分布式计算在企业环境下的应用研究 浙江大学硕士学位论文 统具有自己的处理能力,在客户机服务器环境中,能减轻服务器的许 多负担。使用多服务器的平台提供了在大型集中式系统中几乎不可能的 升级和硬件改变的灵活性。 显而易见地,分布式计算相对于客户机i j & 务器计算模式具有一些缺点。其 中一些缺点可以通过在提高处理能力,快速广域网链接以及软件结构上的改进 加以克服,这正是我们进行研究内容与方向。 分布数据的一致性与完整性。在分布式系统上保持数据同步是一项很复 杂的任务,不同的应用业务对数据同步的及时性要求不同。 资源访问的透明性。需要用新方法在企业网上访问多机种系统和象访问 原有独立系统一样访问外来数据结构。 分布式系统需要更多的管理和监控,系统通常是通过集成现有系统来组 建,同时这也会造成混乱。所以除了原有分布独立子系统的管理外,需 要有全局的管理监控手段。 用户的易用性。使用集中式系统,管理者有一种安全和有条不紊的感觉。 而分布式系统的管理者则会在数据的定位、内容和管理上感到有点难以 控制和普遍的困惑。 对现有系统的兼容性。拥有大型计算机和保留数据的机构在转变到分布 式系统时会感到很棘手。是将现在系统变为新系统的一部分呢,还是将 信息转到新系统上更加合适呢? 将现有系统彻底转化为个分布式系统 是不合理的。但是,当局域网和广域网上的带宽增加,操作系统和应用 程序也具备了运行分布式计算环境的特点时,发展的趋势就是走向分布 式系统,问题在于使这种转变尽可能平稳。 客户机服务器模式提供了一个基本的分布式系统体系结构,大型计算机 可以拥有保留数据,或作为集中式数据库提供服务或兼而有之。这使得本地或 远程用户可以访问登录系统上指定的数据。登录系统和本地服务器减轻了由整 个企业访问的系统的工作负载。用户可以在一个地方访问另一个地方的登录系 统或数据库文件服务器上的数据。而且,用户可以交换电子邮件( e m a i l ) 来和其他用户通信,达到部分资源的共享。 分布式计算环境与客户机服务器环境很相似。它们的区别只是分布式计 算环境中有多个服务器,客户可在任何时候访问其中任何一台服务器,这种访 问通常是间接的、透明的。分布式环境需要如下几个组成部分: 支持各种多供应商产品和通信协议的网络平台; 用户向服务器进行请求的应用程序接口,可以使用实时的面向连接的方 法或以无连接的基于消息传递的方法; 跟踪信息和资源及其位置的命名服务; 用于在拥有相关信息的服务器之间保持同步: 数据库管理系统,支持诸如分区和备份等高级功能,以提供数据的分布 化并保证这些数据的可用性,可靠性及数据保护; 验证和授权等安全特性和系统间的信任关系使用户能够访问多个服务器 和数据库,系统不必对每次进行远程资源访问都进行身份鉴定; 分布式计算的一个方面是客户机系统能够自动搜索网络上可以处理全部或 2 0 0 1 年3 月 。规l 。;巍盘嘏戳涟嚣鬣。釜 8 - 分布式计算在企业环境下的应用研究 浙江大学硕士学位论文 部分任务的其他计算机系统。计算任务可以分布到当前空闲或者更适于当前任 务的计算机上执行。分布式应用程序就是在网络上不同的计算机上运行不同部 分的应用程序。从这个角度讲,分布式计算与多处理机系统相似。在多处理机 系统中,一个计算机系统,如一个服务器,可以具有几个处理器,它们可以单 独运行,并能处理任务的不同部分。分布式处理也可以这样做,但分布式处理 在开放的网络上有更多潜在的计算能力和配置灵活性。当然多处理机系统具有 极大的通信带宽来实现处理机或存储器之间实时数据交换,对于基于外部网络 的分布式计算,一方面通过改进软件结构,提高分布的合理性提高计算效率,另 一方面需要高速网络链路,e e 如使用光纤接口的高速网络实现这种可能性。 3 分布式计算有关的资源 2 3 1 分布式数据库 在分布式应用系统中,基于服务器的数据库管理系统( d b m s ) 是主要的信 息供应者。在以前的c s 应用模式中,用户只能访问本地或网络上指定的服务 器,而在分布式计算模式中,用户可以访问企业网络中的任何一台服务器,而 且这种访问并不是客户机与数据库服务器的直接对话,这样可以确保访问的透 明性。另外,分布的子系统可以获得某种程度的本地自治权,拥有可以支持本 地工作的数据资源,这样可以使本地管理者可以较好地保证资源的安全。 现有许多技术和产品提供了从各种前端应用程序到各种后台服务器的接 口,该接口对各种物理接口、语言或通信协议兼容。主要是o d b c ,、i d b c ,o l e d b a d o 等。 2 3 2 分布式文件系统 分布式文件系统以对等模式工作,使得工作在工作站上的用户可以作为客 户机和服务器工作。服务器装载或发布客户机可以访问的目录及以文件形式提 供的资源。一旦服务器被访问,这些资源就象本地驱动器一样出现在客户机上。 目前有三种主要的分布式文件访问技术。 1 网络文件系统( n f s ) :n f s 是最早由s u n 微系统公司创建的,作为t c p i p 网的一个文件共享系统。 2 a n d r e w 文件系统( a f s ) :a f s 与n f s 体系结构相似,a f s 由卡内基梅隆大 学信息技术中心( i t c ) 开发。该系统当前由t r a n s a r c 公司开发并销售, t r a n s a r c 公司由前i t c 职员组成。a f s 有一些n f s 没有的增强特征,并使 用了不同的客户机高速缓存方案。 3 分布式文件系统( d f s ) :d f s 是a f s 的一个版本。它作为开放软件基金会 ( o s f ) 中的分布式计算环境( d c e ) 的文件系统部分。 2 0 0 1 年3 月 螽瓤螂氇瓢刍j 懿鑫;盛潼鏊滋瀛蠡氯 9 浙江大学硕士学位论文 2 3 3 分布式计算环境的安全性 分布式环境中的安全性( s e c u r i t yi nd i s t r i b u t e de n v i r o n m e r i t s ) 一旦 拥有分布式数据,就必须采取充分的安全措施,如鉴别、授权和加密。这里假 定部分用户需在远地访问系统,或必须用数据库备份,且这些都在公用数据网 上进行。因此,必须考虑以下的安全措施: 鉴别( a u t h e n t i c a t i o n ) 让用户登录一次,然后就取得了对在被授权使用 的任何位置的任何系统的访问权。鉴别过程提供了一种安全方法,使一个 服务器相信另一个服务器己正确标识了个用户。 授权( a u t h o r i z a t i o n ) 提供了一种方法授权给用户,使他们根据他们的权 限级别访问远程资源。这样,管理员就不必预先知道用户可能访问的每一 个服务器。因此,就不必为每个站点定义访问权。用户仅仅属于拥有规定 访问权的组或者是可授予各种访问权的“角色”。 验证( c e r t i f i c a t i o n ) 技术提供了服务器间相互确认和对访问其资源的用 户进行确认的手段。 密码( c r y p t o c a t i o n ) 技术保护传输数据免遭窃获。 数字签名( d i g i t a ls i g n a t u r e s ) 向用户保证他们从其他用户接收的信息 是可信的。 防火墙( f i r e w a l l ) 用于过滤那些通过与广域链路连接的桥接器或路由器 发送的信息分组。 2 3 4 分布式计算应用程序( d i s t r i b u t e dc o m p u t i n g a p p l i c a t i o n s ) 有许多利用分布式计算优点的应用程序。如群件允许多个用户同时对相同 数据操作或利用网络方便地共享信息。文档处理、安排调度、电子函件和工作 流软件都是群件的例子。有些应用程序能自动从联网的系统中汇集数据。在 w i n d o w sf o rw o r k g r o u p s 和w i n d o w s n t 中的对象链接和嵌入( o l e ) 方法,允 许用户将信息放入自己的文档,而这个文档存于网上其它地方并能被其他用户 更新。当原始信息改变时,其他用户文档上使用的这些相应信息也改变了。 根据业务模型的不同,分布式计算应用程序的组织与结构也是各不相同的。 传统的客户机服务器计算应用模式也是一种简单的分布式计算,其软件结构与 业务模型的关系过于紧密。不利于软件产品的大规模发布。 2 0 0 1 年3 月 ;穗:菇i 潦4 强i 3 丞一嘏t 1 0 - 分布式计算在企业环境下的应用研究 浙江大学硕士学位论文 2 4 分布式计算环境与常规计算的区别 2 4 1 分布式计算的网络基础 所有分布式计算环境的基础是计算机或者进程之间的通信。虽然这个过程 是最基本的过程,但也是必须的,并且从概念上反映了的分布式环境和底层通 信模块的接近程度。我们知道,让计算机和其他计算机进行通信的硬件以及系 统级软件常常称作传输层。而当几个计算机使用共同的传输层相连时,他们就 可以称做计算机网络。从广义的范围来讲,进程之间的通讯也可以建立在同样 的概念上,因为在分布式计算环境中,个进程不知道它的通讯对象到底存在 于什么地方。 网络上的信息传递过程和我们平时所使用的邮政信件传送过程是十分类似 的。就象一个邮包一样,网络上的信息也被打包,包中含有收信者和发信者的 地址,以及一些真正需要传送的自带信息,比如一条短消息等等,这些信息通 过一些具有邮件发送功能的机器进行传递。另外,和邮政信件一样,收到网络 信息包的人可以选择接受信息包,也可以不接受。 不过,不管是普通信件,或者是网络信息,如果超过了一定的大小限制, 那么他们就可能会被分割成多个小部分,等到他们到达目的地的时候才再组合 起来。这些从物理上分割的信息包,其实也可以被看作是具有独立逻辑的信息 包。一般来说,只要传输层中具有一定的语义、分组顺序、数据格式化和一系 列其他预定义的组件,就可以组成某种通讯协议。只要遵循这些预定义的协议, 某一计算机系统就能够正确解释来自其他计算机系统的信息。 网络协议采用分层处理的方式来简化网络协议的设计。参照o s l 分层网络 模型,网络从物理介质层到应用层分为七层物理介质层,数据链路层,网络 层,传输层,会话层,表示层和应用层。 应用层 表示层 会话层 传输层 网络层 数据链路层 物理层 为用户提供相应的界面,以便使用提供的网络功能 完成数据的格式化 控制两个主机问的通信链路( 开放,操作和关闭) 提供数据传输服务( 可靠或不可靠) 在主机之间提供定址寻址方案以及数据包的路由 控制通信主机之间的物理通信链路 以电子信号的形式传输数据 o s i 网络模型 2 1 年3 月 t 分布式计算在企业环境下的应用研究浙江大学硕士学位论文 目前已经有多种网络协议支持计算机通信,并且形成了规范的网络编程接 口。根据连接的形式可以分为面向连接或者无连接,前者是一种稳定的连接方 式,可以确保顺序地收到的数据分组并重新组合成原始数据,但维持这种连接 的开销较大:后者是一种简单的消息机制,并不确保数据到达目的地,系统开 销小,效率高。这两种连接都是在传输层上的连接。对于面向应用的分布式计 算来说,我们主要关注传输层以上的网络连接,同时o s i 模型为整个分布式应 用系统结构设计也提供了参考依据。 联网的好处在于提供强大的通讯手段、信息以及资源共享。资源共享又分 为设备资源与计算资源,计算资源共享的基本应用如多个用户登录到一个主机 上共享c p u 资源,更高级的应用是分布式计算网络并行计算。另外的好处是提 供高可靠性高可用性。 2 4 2 同步和异步传输 和普通的邮件相同,信息发送者关注的信息接收者接受信息的情况,其侧 重点也各有不同。有时候,也许发送者根本就不需要关心信息是否到达了接收 者处;另一些时候,发送者需要确认信息已经到达了接收者处,但是不需要等 到接受者确认后才能继续下面的工作;还有的时候,发送者必须等到接收者确 认收到信息之后才能往下进行工作。 同步模式的操作就是发送者必须接收到接收者的反馈后才能继续往下工 作:而不需要接受者反馈信息的工作模式,或者至少不需要接受者立即反馈的, 就叫做异步模式。这两种模式的区别通常决定了某种协议是不是适合某一特定 任务。在实际应用中,采取何种传输方式还要考虑网络的连接速度,特别是对 低速w a n ,异步传输的效果要比同步传输好。 2 4 3 消息 对于更加复杂的网络连接,用简单的同步或者异步传输都无法满足要求。 因为不论同步或是异步传输方式,通信双方的生存周期必须有一个重叠过程, 只有在这个阶段双方才能进行通信。分布式计算的透明性要求各个分布计算单 元不必知道其他计算单元的当前状态,因此分布式计算方式逐步演化到了消息 机制阶段。消息包中包含了消息的属性标志和具体信息。这样,消息机制就要 求服务器上必须要有一个中间处理层来寄存消息,转发消息,起一个消息转发 的作用,以便让消息到达正确的接收者处。 消息机制是一种天生的异步机制,因为基于消息的通讯能够很好地和中间 层的路由配合。各个消息暂时存放在服务器或路由器上的消息队列中,在此队 列中他们等待着一个或几个逻辑上的处理程序对其进行下一步处理。有些处理 也许根本就不需要响应某些消息,当然也可以直反馈给客户端。但是,为了保 持逻辑上的抽象吻合,他们仍然需要给服务机发送一个消息。然后通过另一个 队列路由返回客户端。 基于消息的结构也可以采用同步模式。一般来讲,在这种模式中,服务器 路由器将消息直接传递给处理程序,然后由处理程序回传处理结果给服务器, 2 0 0 1 年3 月 - 1 2 分布式计算在企业环境下的应用研究 浙江大学硕士学位论文 再又服务器传给客户端。还有另外一种混合模式,在这种混合模式中,服务器 如前述异步模式进行操作,而
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 贷款房产抵押的合同2篇
- 破产重整中 附条件的合同4篇
- 抵押合同解除终止协议6篇
- 2025年高考政治总复习高中政治必考知识点一网打尽
- 防冲监察课件
- 细胞因子基因调控-洞察及研究
- 部队基层后勤保障课件
- 部队保密安全课件
- 部队人员安全培训课件
- 江苏省南京市2025-2026学年七年级语文上学期第一次月考复习试卷(含答案)
- 氧化还原反应配平专项训练
- 人教版PEP小学六年级英语上册教学计划及教学进度
- 2022年6月天津市普通高中学业水平合格性考试化学试卷(含答案解析)
- 工程款支付审批表
- 2021工程总承包项目文件收集与档案规范第4部分:水力发电工程
- 建筑边坡工程施工质量验收规范
- Unit+3+Fascinating+Parks+Reading+and+Thinking+导学案 高中英语人教版(2019)选择性必修第一册
- 2024至2030年中国银饰品市场需求分析及投资战略规划研究报告
- 学校有限空间作业安全管理制度
- FURUNO 电子海图 完整题库
- CAD经典教程电气图基本知识
评论
0/150
提交评论