




已阅读5页,还剩52页未读, 继续免费阅读
(计算机应用技术专业论文)基于p2p的协同系统数据处理的研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于p 2 p 的协同系统数据处理的研究 摘要 随着经济的发展,现代企业迫切需要将物流、资金流、知识流通 过一个纽带形成现代化管理平台,使得企业各部门、供应商、分销商、 业务伙伴及客户协同运作,但是长期以来,企业内部信息系统各自为 政,相互无法互通互联,形成信息孤岛,无法实现企业内部或者企业 与企业之间有效的互动,协同软件提供了解决该问题的最有效途径。 目前,协同软件发展迅速。同时,p 2 p 技术的发展逐渐改变以往人们 交流的方式。将p 2 p 技术带入网络世界的一个著名例子是n a p s t e r , 目前最为大家熟悉的p 2 p 软件有即时通讯软件o i c q 和m s n ,下载 软件b t 等。p 2 p 技术以其不可取代的优势迅速进入大量应用领域。 因此,基于p 2 p 模式的协同系统具有一定的研究价值。 本文以p 2 p 模式下的协同系统关于数据处理的研究为主要方向。 全文内容组织如下: 首先,论文简单介绍对等网络的基本概念,特点和应用发展等相 关知识;介绍协同应用的背景知识,以及现在具有代表性的协同软件, 重点分析了g r o o v e 架构的特点。 然后,详细分析了论文所参考的应用模型,分析了模型的技术要 点和系统目前存在的问题。根据模型存在的问题,具体对数据处理的 改进进行了研究,主要针对数据传输方式和数据存储方式的改进。通 过比较各个改进方案的优缺点,以及可实施性,对最终确定的改进方 案进行详细设计和测试。 最后作者对论文所做的工作进行了总结,提出了进一步的工作。 关键词:p 2 p ,协同,数据传输,拉数据,数据存储,数据中心 t h er e s e a r c h0 fd a r ap r o c e ss i n g 0 fc o l l a b o r a t i o ns y s t e m b a s e d0 np 2 p a bs t r a c t a l o n gw i t ht h ed e v e l o p m e n to ft h ee c o n o m y , m o d e r nc o r p o r a t i o n s n e e dam o d e r nm a n a g e m e n tp l a t f o r mw h i c hi sm a d eu po fs u b s t a n c e , f i n a n c i n g a n di n f o r m a t i o n ,s ot h a te a c h d e p a r t m e n to fc o r p o r a t i o n , p r o v i d e r , s e l l e r , p a r t n e r , a n dc u s t o m e rc o u l dw o r kt o g e t h e r b u t ,t h e i n f o r m a t i o ns y s t e m so fe n t e r p r i s ed ot h i n g si nt h e i ro w nw a y s ,t h e yc a n t c o m m u n i c a t ew i t h e a c ho t h e r , t h ei n f o r m a t i o nw a s s e p a r a t e d ,t h e c o l l a b o r a t i o ns o f t w a r ep r o v i d e st h eb e s tw a yt or e s o l v et h i sp r o b l e m a t p r e s e n t ,t h ed e v e l o p m e n to fc o l l a b o r a t i o ns o f t w a r ei sq u i c k l y m e a n w h i l e , t h ed e v e l o p m e n to fp 2 pt e c h n o l o g yg r a d u a l l y c h a n g et h ew a yo ft h e c o m m u n i c a t i o no fp e o p l e o n eo ft h ef a m o u sc a s e sw h i c hb r i n gp 2 p t e c h n o l o g yt on e t w o r ki sn a p s t e r , n o ww ea r ef a m i l i a rw i t hs o m ep 2 p s o f t w a r e ,s u c ha so i c q ,m s n ,b ta n ds oo n p 2 pt e c h n o l o g yh a ss o m a n ya d v a n t a g e s t h a ti tc a nb eu s e di n m a n ya r e a s t h e r e f o r e i t s v a l u a b l et os t u d yt h ec o l l a b o r a t i o ns y s t e mb a s e do np 2 pp a t t e m t h em a i nr e s e a r c hi sa b o u td a t ap r o c e s s i n go fc o l l a b o r a t i o ns y s t e m w h i c hb a s e do np 2 et h i sa r t i c l em a i n l yi n c l u d e s : a tf i r s t ,t h ep a p e ri n t r o d u c e st h eb a s i cc o n c e p to fp 2 pn e t w o r k ,t h e b a c k g r o u n d o fc o l l a b o r a t i o n a p p l i c a t i o n s a n ds o m e r e p r e s e n t a t i v e c o l l a b o r a t i o ns o f t w a r e a n a l y z et h es t r u c t u r eo fg r o o v e a n dt h e n ,p a p e ra n a l y z e st h eg k s t a ra p p l i c a t i o nm o d e l a c c o r d i n g t ot h ee x i s tp r o b l e m s ,r e s e a r c ht h ed a t ap r o c e s s i n g ,w h i c hi n c l u d ed a t a t r a n s f e ra n dd a t as t o r a g e c o m p a r i n gt h ea d v a n t a g ea n dd i s a d v a n t a g eo f e a c hs o l u t i o n ,c o n f i r mt h em o s ts u i t a b l eo n e ,a n dg i v et h ep a r t i c u l a r d e s i g n 2 a tl a s t ,t h es u m m a r yo ft h i sp a p e ra n ds o m ea d v i c ef o rt h et h e s i sa r e g i v e n k e yw o r d s :p 2 p , c o l l a b o r a t i o n ,d a t at r a n s f e r , p u l l ,d a t a s t o r a g e , d a t a c e n t e r 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:萎盘盘日期:迦6 肇圣91 望 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 保密论文注释:本学位论文属于保密在一年解密后适用本授权书。非保密论 文注释:本学位论文不属于保密范围,适用本授权书。 本人签名:塞盘盘 导师签名: 北京邮电大学硕士学位论文 引言 目前,区别于传统c s 结构的p 2 p 网络快速发展。p 2 p ( p e e rt op e e r ) 网络 结构区别于c s 结构或b s 结构最显著的特点是整个网络不存在中心节点( 或中 心服务器) ,其中的每一个节点( p e e r ) 大都同时具有信息消费者、信息提供者 和信息通讯等三方面的功能。随着各类数字终端、服务器资源、网络带宽等资源 持续保持类摩尔定律式的增长,p 2 p 通过更直接的共享方式来提高沟通效率、减 少资源浪费并保障信息服务安全。p 2 p 技术为服务共享、分布式计算和信息交流 提供了更灵活高效的模式。目前,p 2 p 技术发展迅速。在文件共享、分布式计算、 网络安全、在线交流以及企业计算与电子商务等应用领域p 2 p 都显露出很强的 技术优势。 如今在企业信息化和政府信息化领域中,人们接触最多的是o f f i c e 一类的个 人单机应用软件,另外一种就是诸如e r p 、c r m 等基于流程规范化的管理软件。 但是介于这两类软件放之间,有一种基于人与人之间的数据和信息沟通的应用, 而且是基于一种半规范化或者非规范化非固定流程的应用。这种应用就是协同。 近年来,协同软件的发展保持了良好的上升势头。一些国际巨头如i b m 、微软、 o r a c l e 等都在进入这一软件领域。协同软件将取代传统的工作和管理模式,如减 少了出差、普通电话交流,集中式的项目管理等等;将取代一些传统的专业设备 与服务,如专业的视频会议系统等,大大提高工作效率,节约公司成本。 p 2 p 与协同应用的结合发展,是信息管理系统发展的一个方向。 本文主要探讨的是p 2 p 模式下的协同软件关于数据处理的一些研究。各章节 的内容组织如下: 第一章介绍对等网络的基本概念,结构特点,应用发展等相关知识。 第二章介绍协同应用的背景知识。 第三章介绍本论文中所参考的应用模型g k s t a r ,技术模型,技术要点和存 在的问题。 第四章根据现在有模型存在的问题,具体从数据传输和数据存储两个方面研 究数据处理的改进。 第五章从数据传输和数据存储两个方面给出了改进的具体方案。 第六章论文的总结。 北京邮电大学硕士学位论文 1 1p 2 p 的定义 第一章p 2 p 相关理论 p 2 p 是英文p e e rt op e e r 的缩写,简单的说,p 2 p 直接将人们联系起来,让人 们可以直接连接到其他用户的计算机上交换文件,而不是像过去那样连接到服务 器去浏览与下载,从而真正地消除了中间商,使得网络上的沟通变得容易和直接。 科学的说,p 2 p 是一种分布式网络框架,在这种网络框架下计算机之间直接交互 通信,以实现硬件资源和服务共享,其中资源和服务包括c p u 处理周期,信息 的交互,缓冲存储,磁盘存储等。 i b m 为p 2 p 作了如下定义:p 2 p 系统由若干互联协作的计算机构成,且至 少具有如下特征之一:系统依存于边缘化( 非中央式服务器) 设备的主动协作, 每个成员直接从其他成员而不是从服务器的参与中受益;系统中的成员同时扮演 服务器与客户端的角色;系统中的用户能够意识到彼此的存在,构成一个虚拟或 实际的群体【lj 。 1 2p 2 p 与c s 结构的比较 目前,大多数的i n t e r n e t 服务采用的是传统的c s 分布式结构,如图1 1 所 示。客户使用一种通信协议,比如说文件传输协议( f t p ) ,与服务器相连接以 便能够访问某一种特定的资源,通常服务器段处理大多数的涉及分发服务的任 务,而客户端则相对来讲任务较轻。目前大多数的i n t e m e t 应用都采用这种结构。 但是,c s 结构有一个主要的缺点,当客户端的数目增加时,相应地就需要 服务器的带宽和负载都要增加,从而使得服务器有时不能够处理过多的客户端的 请求。而对于客户端的计算能力却要求很少。在c s 结构中,客户端处于被动的 角色,只能够向服务器发出服务请求而不能够接受来自其他客户端的服务请求。 图1 - 1c 1 i e n t s e r v e r 结构图 北京邮电大学硕二卜学位论文 不同于c s 结构,p 2 p 结构不依赖于一个中心服务器来提供服务,如图1 2 。 p 2 p 避开了c s 集中的组织结构,而采用了一个平面的,高度互联的结构。p 2 p 结构允许互联的计算机采取一定的机制来发现彼此,使得各台计算机既是客户端 有时服务器,并能够确定p 2 p 网络中的各种服务。 图1 2p 2 p 结构图 相对于c s 结构,p 2 p 结构一个主要的优点就是将服务分布到网络中的各个 对等体( 即p e e r ) 上。这样就不会因为一个点的瘫痪,而不能提供服务。另外, 不同于传统的c s 通信,到某一特定热门的服务的路线就会发生阻塞,p 2 p 通信 借助于以系列的网络路线从而消除了网络阻塞。p 2 p 以最小的代价实现了高可靠 性服务,同时最大限度地利用了连接到p 2 p 网络上的每个对等体所提供的资源。 同时也正是由于p 2 p 网络的冗余性,使得服务请求没有确定性。 1 2 1 c s 的特点 1 集中。计算能力,信息和数据都集中在服务器端。 2 服务器及网络的带宽决定了性能。每台服务器所能提供的信息数量受到 自身存储空间的限制,而任意时刻它所能支持的客户端访问数量则既受 到自身处理能力的限制,也受到服务器所在网络吞吐能力的限制。 3 被发布信息的分布与生存期十分稳定。服务器只发布其所有者想公之于 众的信息,这些信息将会在该服务器上稳定地保存一段时间,并且该服 务器通常也不间断的运行在网络上。 4 被发布信息的存储与管理比较集中、规范。互联网上所有可以公开访问 的信息基本上都保存在服务器上,服务器根据适当的算法和规则管理本 地信息,应答客户端的访问请求或进行计算。 1 2 2p 2 p 的特点 北京邮电大学硕士学位论文 1 每个对等点有相同的地位,既可以请求服务也可以提供服务,还可以具 有路由器和高速缓冲存储器的功能,弱化了甚至取消了服务器的作用。 2 每个对等点可以充分利用网络上其他对等体的信息资源、处理器周期、 高速缓存和磁盘,各种资源都得到了较充分,均衡的利用。 3 大规模。为了实现资源共享,p 2 p 系统中往往会有大量的结点。 4 动态性。在p 2 p 系统中,结点通常是自主的,因而结点可能会频繁的加 入和离开p 2 p 网络,p 2 p 网络在不停的变化中。 5 结点的异构性。加入到p 2 p 网络中的结点不仅在物理特征上( 带宽,性 能等) ,而且在行为上( 共享文件数量,生命周期等) 都具有很大的差异。 6 巨大的扩展力。通过低成本交互来聚合资源,导致整体大于部分之和。 7 匿名和隐私。允许对等端在其数据和资源上很大的自治控制。 1 2 3 p 2 p 相对于c s 结构的主要优缺点 优点【2 j : 1 资源的高度利用率。在p 2 p 网络上,闲散资源有机会得到利用,所有节 点的资源总和构成了整个网络的资源,整个网络可以被用作具有海量存 储能力和巨大计算处理能力的超级计算机。c s 模式下,纵然客户端有 大量的闲置资源,也无法被利用。 2 随着节点的增加,c s 模式下,服务器的负载就越来越重,形成了系统 的瓶颈。而在p 2 p 网络中,每个对等体都是一个活动的参与者,都向网 络贡献一些资源,如存储空间、c p u 周期等。所以,对等点越多,网络 的性能越好,网络随着规模的增大而越发稳固。 3 在p 2 p 网络中,基于内容的寻址方式处于一个更高的语义层次,因为用 户在搜索时只需指定具有实际意义的信息标识而不是物理地址,每个标 识对应包含这类信息的节点的集合。 4 在p 2 p 网络中,信息在网络设备间直接流动,高速及时,降低中转服务 成本。而c s 模式下,服务器的开销是巨大的。 5 信息数据成本资源向所有用户的p c 均匀分布,即“边缘化”趋势。c s 模 式下的互联网是完全依赖于中心点服务器的。而p 2 p 网络中,任意 两台p c 互为服务器客户机,即使只有一个对等点存在,网络也是活动 的,节点所有者可以随意地将自己的信息发布到网络上。 缺点: 1 p 2 p 不易于管理,而对c s 网络,只需在中心点进行管理。 北京邮电大学硕士学位论文 2 p 2 p 网络中数据的安全性难于保证。因此,在安全策略、备份策略等方 面,p 2 p 的实现要复杂一些。 3 由于对等点可以随意地加入或退出网络,会造成网络带宽和信息存在的 不稳定。 1 2 49 2 9 和o s 技术性能统计数据比较 表i - ip 2 p 与c s 性能比较 性能比较 p 2 pc s 数据发布 好差 数据接收中好 数据互动性好 芷 z 数据即时性好 芷 z l 数据安全性差好 数据更新好 兰 z 数据质量中好 数据覆盖率和数量 差好 数据成本控制 好 些 左 数据管理方便性左好 由上面的统计数据可以看出,p 2 p 模型在数据的互动性、即时性、数据更新 等方面表现很好,但在安全性、管理容易性、数据覆盖率和数据量等方面表现不 如c s 模型,这是由于p 2 p 模型的特征造成的,是必然的。 1 3 p 2 p 体系结构 在结构上p 2 p 网络主要分为四种类型: 1 ) 集中式p 2 p 系统: 在集中式p 2 p 模型中有一个中心服务器来负责记录共享信息以及回答对这 些信息的查询;每一个对等端对它将要共享的信息以及进行的通信负责,根据需 要下载它所需要的其它对等端上的信息。该类方法的代表是n a p s t e r 。n a p s t e r 实质上并非是纯粹的p 2 p 系统,它通过一个中央服务器保存所有n a p s t e r 用户上 传的文件索引和存放位置的信息。当某个用户需要某个文件时,首先连接到 n a p s t e r 服务器,在服务器进行检索,并由服务器返回存有该文件的用户信息; 再由请求者直接连到文件的所有者传输文件。n a p s t e r 首先实现了文件查询与文 件传输的分离,有效地节省了中央服务器的带宽消耗,减少了系统的文件传输延 北京邮电大学硕士学位论文 时。但是由于对中央“目录”服务器的依赖,使系统存在可扩展性和单点失效 问趔3 1 。 一爷请求 一应答 卜 数据交换 图1 3n a p s t e r 系统结构图 2 ) 纯p 2 p 系统: 在纯p 2 p 模型中,对等端通过与相邻对等端之间的连接遍历整个网络体系。 每个对等端在功能上都是相似的,并没有专门的服务器,而对等端必须依靠它们 所在的分布网络来查找文件和定位其它对等端。这类系统的代表是g n u t e l l a ,系 统采用广播或者受限广播来进行资源定位,具有较好的自组织性和扩展性,如图 卜4 所示【4 j 。g n u t e l l a 没有索引服务器,它采用了基于完全随机图的洪泛( f l o o d i n g ) 发现和随机转发( r a n d o mw a l k e r ) 机制。为了控制搜索消息的传输,通过t t l ( t i m et ol i v e ) 的减值来实现。但是随着联网节点的增多,网络规模扩大,通过这 种洪泛方式定位对等点的方法将造成网络流量急剧增加,从而导致网络中部分低 带宽节点因网络资源过载而失效。由于采用t t l ( t i m e t o l i v e ) 、洪泛( f l o o d i n g ) 、 随机漫步或有选择转发算法,因此路径不可控,可扩展性较差。g n u t e l l a 是性能 比较低的,占用大量带宽,但是却存在良好的稳定性。另外这类系统更容易受到 垃圾信息,甚至是病毒的恶意攻击【5 j 。 ,一、 ( p ) p e e r q 请求 r应答 d 文件传输 图1 - 46 n u t e l1 a 系统结构图 北京邮电大学硕:卜学位论文 3 ) 混合式p 2 p 系统: k a z a a 模型是p 2 p 混合模型的典型代表( 见图2 3 ) ,它在纯p 2 p 分布式模型 基础上引入了超级节点的概念,综合了集中式p 2 p 快速查找和纯p 2 p 无中心化的 优势。k a z a a 模型将节点按能力不同( 计算能力、内存大小、连接带宽、网络滞 留时间等) 区分为普通节点( n o r m a l n o d e ) 和超级节点( s u p e r n o d e ) 两类。其 中超级节点与其临近的若干普通节点之间构成一个自治的簇,簇内采用基于集中 目录式的p 2 p 模式,而整个p 2 p 网络中各个不同的簇之间再通过纯p 2 p 的模式将 超级节点相连起来,由于普通节点的文件搜索先在本地所属的簇内进行,只有查 询结果不充分的时候,再通过超级节点之间进行有限的泛洪,这样就可以有效地 消除纯p 2 p 结构中使用泛洪算法带来的网络拥塞、搜索迟缓等不利影响。同时, 由于每个簇中的超级节点监控着所有普通节点的行为,这也能确保一些恶意的攻 击行为能在网络局部得到控制,并且超级节点的存在也能在一定程度上提高整个 网络的负载平衡【6 j 。 叵互习 超级节点 阳r q 请求 r 应答 u b l i s h 信息发布 图卜5k a z a a 系统结构图 4 ) 结构化p 2 p 系统: 所谓结构化与非结构化模型的根本区别在于每个节点所维护的邻居是否能 够按照某种全局方式组织起来以利于快速查找。结构化p 2 p 模式是一种采用纯分 布式的消息传递机制和根据关键字进行查找的定位服务,目前的主流方法是采用 分布式哈希表( d h t ) 技术,这也是目前扩展性最好的p 2 p 路由方式之一。由于d h t 各节点并不需要维护整个网络的信息,只在节点中存储其临近的后继节点信息, 因此较少的路由信息就可以有效地实现到达目标节点,同时又取消了泛洪算法。 该模型有效地减少了节点信息的发送数量,从而增强了p 2 p 网络的扩展性。同时, 出于冗余度以及延时的考虑,大部分d h t 总是在节点的虚拟标识与关键字最接近 的节点上复制备份冗余信息,这样也避免了单一节点失效的问题。 北京邮电大学硕士学位论文 目前基于d h t 的代表性的研究项目主要包括加州大学伯克利分校的c a n 项目和t a p e s t r y 项目,麻省理工学院的c h o r d 项目、i r i s 项目,以及微软研究院 的p a s t r y 项目等。目前,大量实际应用还大都是基于无结构的拓扑和泛洪广播机 制,现在大多采用d h t 方式的p 2 p 系统缺乏在i n t e m e t 中大规模真实部署的实 例,成功应用还比较少见。 从集中式p 2 p 结构到结构化p 2 p 结构再到融合后的混合式结构是当前p 2 p 网络发展的趋势。 表1 - 2 四种结构的比较 集中式纯混合结构化 可扩展性差差好 由 可靠性差好好 由 可维护性好好好 由 查询算法效率 同 中 同中 复杂查询支持支持不支持支持 1 4p 2 p 应用的发展与分类 1 4 1 p 2 p 的发展历史 从网络模型来看,p 2 p 并不是新概念,它可以说是互联网整体架构的基础。 互联网最基本的协议t c p i p 并没有客户机和服务器的概念,所有的设备都是通 讯的平等的一端。在十几年前,所有的互联网上的系统都同时具有服务器和客户 机的功能。然而,由于受早期计算机性能、资源等因素的限制,随着互联网规模 的迅速扩大,大多数连接到互联网上的普通用户并没有能力提供网络服务,从而 逐步形成了以少数服务器为中心的客户机n 务器( c s ) 架构。在这种架构下,对 客户机的资源要求非常少,推动了互联网的快速普及。 但是,随着互联网对人们生活的联系日益紧密和深入,人们需要更直接、更 广泛的信息交流。普通用户希望能够更全面地参与到互联网的信息交互中,而计 算机和网络性能的提升也使其具有了现实的可能性。在此背景下,p 2 p 再一次受 到了广泛的关注。 将p 2 p 带入了网络世界的一个著名例子是n a p s t e r 。它提供服务允许音乐迷 们交流m p 3 文件,它与提供免费音乐下载m p 3 c o m 的不同就是在n a p s t e r 服务器 没有一首歌曲,n a p s t e r 提供了一个新的软件供音乐迷在自己的硬盘上共享歌曲 文件,搜索其他用户共享的歌曲文件,并到其他也使用n a p s t e r 服务的用户硬盘 上去下载歌曲。n a p s t e r 在短时间里吸引了5 0 0 0 万用户。最终,它被五大唱片商 北京邮电大学硕士学位论文 以侵犯版权推上被告席而成为世界的焦点。n a p s t e r 的成功促使人们认识到把p 2 p 拓展到整个互联网范围的可能性p j 。 另一个采用p 2 p 方式实现计算资源共享的例子是s e t i h o m e 。这是一个寻 找外星球文明的大型科研工程。为了快速处理大规模天文数据,该工程将互联网 上3 0 0 万台以上的计算机通过p 2 p 方式组织起来,充分共享这些节点的空闲计算 资源( c p u ) ,从而达到了几十t f l o p s 的计算能力 7 1 。 事实上,网络上现有的许多服务可以归入p 2 p 的行列。即时通信系统如i c q 、 y a h o om e s s e n g e r 、m s nm e s s e n g e r 以及o i c q 等是都最流行的p 2 p 应用。它们 允许用户互相沟通和交换信息、交换文件。但这些系统缺少对于大量信息共享非 常重要的一些功能,如搜索。这可能正是为什么即时通讯出现很久但是并没有能 够产生如n a p s t e r 这样的影响的原因之一。 1 4 2p 2 p 的应用分类 p 2 p 是一个相对底层的技术,一些共性的问题如节点表示、资源路由、可扩 展性、安全性等受到人们的普遍关注。但是,由于应用需求不同,相关的研究侧 重点还是有所不同的。从应用来看,目前p 2 p 技术研究主要涉及到以下几个领域: 1 文件共享 这是p 2 p 技术最初的应用之一,可以说是基于p 2 p 的文件交换的应用直接 引发了p 2 p 技术热潮。n a p s t e r 抓住人们希望通过互联网共享m p 3 音乐文件的需 求,基于p 2 p 实现了自由的文件交换软件,从而引发了p 2 p 技术应用的热潮。 这种搜索和下载方式与传统的方式最大的区别就是用户不是从服务器搜索与下 载资源,而是从任何一个在线用户的计算机直接下载。从技术上讲,目前的p 2 p 文件交换系统有以下几种不同的形式。 一种是“中心文件目录,分布式文件系统”,交换文件时通过中央服务器来 进行目录管理。n a p s t e r 就是属于此类,由于采用集中式目录管理,所以不可避 免地存在瓶颈问题。 另外一种属于完全的p 2 p ,这类系统没有中间服务器( 或者说服务器功能很 弱) ,g n u t e l l a 是这方面应用的典型。g n u t e l l a 在进行搜索地过程中采用地消息传 递算法使得消息总数量呈指数增长,存在着浪费过多网络资源的问题【5 j 。 第三种系统是上两类系统的折衷一一有中间服务器,但文件目录是分布的。 中间服务器起的作用仅仅是辅助两个p e e r 进行直接通信。 2 分布式计算 人们一直在尝试通过并行技术,分布式处理技术将多个网络节点联合起来, 利用闲散计算机资源来完成大规模的计算任务。现在,p 2 p 为这种计算技术提供 北京邮电大学硕士学位论文 了新的契机。p 2 p 用于对等计算的优势在于每个对等点不再只是单纯的接收计算 任务,它还可以根据自己的情况( 比如分到的任务太多) 再搜索其他空闲节点把 收到的任务分发下去。然后中间结果层层上传,最后到达任务分发节点。对等点 之间还可以直接交换中间结果,协作计算。按照这种方式进行,可以合理整合闲 散的计算能力和资源,使得总体计算能力得到大规模提升,获得非常可观的计算 性能和价格比。美国科学家在1 9 9 9 年4 月启动的s e t i h o m e 计划则是一个非 常著名的例子,该计划是一个利用网上成千上万台计算机的闲置能力来分析在外 星系文明研究中所获得的无线电信号,搜寻地外文明的大规模试验。通过 s e t i h o m e ,每个参加者可以下载- d , 部分由a r e c i b o 收集到的数据,并通过 运行屏幕保护程序的方式使自己的计算机对这些数据进行分析【7 1 。 3 即时通讯 所谓即时通讯,其实指的就是诸如q q ,m s n 等被称为在线聊天的软件。 从某种意义上说,由于版权的限制,即时通讯应用将超过文件共享应用,成为 p 2 p 的第一大应用。与i r c ( i n t e r n e tr e l a yc h a t t i n g 在线聊天系统) ,e - - m a i l , b b s 或w e b 聊天室比较,p 2 p 的即时通讯软件不仅可以随时知晓对方是否在线, 而且交流双方的通讯完全是点对点进行,不依赖服务器的性能和网络带宽。尽管 目前的即时通讯技术一般都是具有中, o n 务器,但中心服务器仅用来认证用户的 身份,进行相应的管理工作,并且帮助完成节点之间的初始互连工作。 4 搜索引擎 搜索引擎是目前人们在网络中搜索信息的主要工具,目前的搜索引擎如: g o o g l e ,百度等都是集中式的搜索引擎。这种搜索模式往往由一个机群在互联网 上盲目读取信息,然后按照某种算法根据关键字将信息保存在一个海量数据库 内,当用户提交搜索请求的时候,实际上是在海量数据库内部进行搜索。这种机 制虽然能尽快获得搜索结果,但不能保证搜索范围的深度和结果的时效性。基于 p 2 p 的网络中节点之间的动态而又对等的互联关系使得搜索可以在对等点中间 直接地,实时地进行,这样既可以保证搜索地实时性,又可以达到传统目录式搜 索引擎无可比拟的深度。以g n u t e l l a 所进行地搜索为例蟑j :一台p c 上地g n u t e l l a 软件可将用户地搜索请求同时发给网络上另外1 0 台p c ,这1 0 台p c 都在自己 计算机上搜索,如果搜索请求未得到满足,这1 0 台中地每一台都会把该搜索请 求转发给另外1 0 台p c ,这样,搜索范围将在很短地时间内以几何级数增加,几 分钟就可以搜遍几百万台p c 上的信息资源,这样的搜索深度和广度是传统的搜 索引擎所不能比拟的。 5 网络游戏 很多基于广域网络的游戏也是基于p 2 p 技术的。采用p 2 p 技术建立起来的 北京邮电大学硕士学位论文 分布式小组服务模型,配以动态分配的技术,每个服务器的承载人数将在数量级 上超过传统的服务器模式,这将大大提高目前多人在线交互游戏的性能;同时 每个游戏用户成为一个对等节点,各个节点可以进行大量的点对点通讯,从而减 少服务器的通信负担,提高系统的性能。 6 网络存储 存储技术一直是人们所关注的一项技术。由于网络规模的扩大,人们开始将 传统的基于局域网的文件存储系统向基于i n t e r n e t 的文件存储系统发展。i n t e r n e t 中数目庞大的个人计算机所具有的储存能力若得到利用也将是及其可观的。一些 研究项目开始使用p 2 p 技术来组织和存储文件,如o c e a n s t o r ,f a r s i t e 等。 7 数据或行动协同软件 基于p 2 p 连接的软件工具,可以建立一个安全的企业级协同工作平台( p 2 p 网) ,提供供求信息链上的互动信息沟通,如货品目录,库存及发货清单,帮组 使用者进行经销渠道维护,客户服务和支持。 上述的分类并不是绝对的。一些系统兼顾了多类功能。惠普实验室的一篇技 术报告中提到的针对p 2 p 研究体系的分类方法也有较好的参考价值【8 】。具体如下: c o m :m u n l c a t l o l la n t l c o l l a b o r a t i o n c o m p u t l n g 1 5 小结 图卜6 p 2 p 分类参考体系 田 n l e s h a r i n g 靠摊片 本章节主要介绍了p 2 p 的相关背景知识。比较了目前应用比较广泛的c s 和p 2 p 结构各自的优缺点;介绍了现在流行的4 种p 2 p 网络类型( 集中式p 2 p 系统,纯p 2 p 系统,混合式p 2 p 系统,结构化p 2 p 系统) 以及相关的典型应用 模型;另外还简单介绍了一下p 2 p 应用的发展历史和目前p 2 p 技术研究主要涉 及到的几个领域。 北京邮电大学硕士学位论文 第二章协同应用 协同,就是指协调两个或者两个以上的不同资源或者个体,协同一致地完成 某一目标的过程或能力。 计算机界有专门研究协同的方向:c s c w ( c o m p u t e r - s u p p o r t e dc o o p e r a t i v e w o r k ) 2 1 协同的定义 协同概念在辞海中的解释是各种分散的作用进行联合应用,使得总效果优于 单独的效果之和的相互作用。现在所谓协同,就是指协调两个或者两个以上的不 同资源或者个体,协同一致地完成某一目标的过程或能力。从概念上可以看出, 协同并不是新生事物,它是随人类社会的出现而出现,并随着人类社会的进步而 发展的。 现如今协同概念有着更深的含义,不仅包括人与人之间的协作,也包括不同 应用系统之间、不同数据资源之间、不同终端设备之间、不同应用情景之间、人 与机器之间、科技与传统之间等全方位的协同。 2 2 协同应用侧重的方面 1 信息收集、整理加工、共享的能力;信息对企业或政府来说是至关重要 的。但是如何收集信息和加工信息,如何将各种信息有条件的传递到相关环节, 做到有效共享等问题,都是企业或政府最为关心的事情。 2 信息交互的能力;信息交互包括信息广播途径、信息加工能力和信息路 由能力;存储于系统内的静态信息是无用信息;信息必须是要有使用价值且有人 使用时才是有效信息。i n t e m e t 是个信息海洋,想从这信息海洋中找到自己需要 的信息还是不太容易。所以,信息还必须要有交互的能力或渠道。 3 业务整合的能力;信息“来自业务,用之业务”,所有信息都是从业务过 程中来的,所有信息最终都应为业务服务。如果通过应用无法实现信息与业务之 间的结合,那么我们说该信息是游离态的。企业业务是由企业的不同部门、不同 人员共同实现的,而且每个企业都有自己个性化、特有的业务过程。所有业务信 息的收集、加工、交互必须与业务系统整合协同起来,才是对企业有价值的信息。 4 资源调配和优化的能力:协同的主要目的是要对所掌握的资源进行合理 调配,并随着发展不断地优化资源配置,这些资源包括人、财、物、信息和流程。 北京邮电大学硕士学位论文 当企业实现了信息共享和业务整合后,企业的“协同应用系统”才能够高效和通畅 的运转,并使这些资源能够突破各种壁垒和障碍,在企业统一管理和协调下为共 同的目标实现而服务【9 1 。 2 。3 协同软件 协同软件( c o l l a b o r a t i o ns o f t w a r e ) 是指那些以团队协作为目标的协作软件工 具,充分利用现代网络与通讯技术,提高企业和机构中分散、移动、跨地区的人 员沟通、协作与管理能力,提高企业和机构的跨系统、跨组织的业务管理能力, 从而全面提高其实时管理能力、动态应变能力以及开放延伸能力,实现敏捷组织 的新一代管理软件。主要包括群组协作管理,如:工作流管理、项目管理等等; 以及各种通信软件,如e m a i l 、即时通信、v o i p 等。 2 3 1 协同软件的特征 为了真正实现协同软件的目标,协同软件具有如下特征: 1 完全的移动性。各种分散的、移动的用户都可以利用各种通讯网络,包括 局域网、互联网、有线网、无线网、宽带网、窄带网等等,真正实现随时随地接 入系统,并达到在办公室内几乎一致的工作效率、安全性与管理效果。 2 动态的延伸性。不同部门、不同组织可以先行建立各自的协同应用系统, 一旦需要实现各种交叉或关联的应用,应该可以快速、无缝地建立相应的跨系统、 跨组织的应用体系,从而实现动态的延伸型组织的管理。 3 高度的柔性。以动态的团队协作的管理为基础,建立以人为中心的通用管 理平台,快速实现各种临时性的、半规范化的项目或业务的管理,实现以不变应 万变的柔性管理,并与e r p 等刚性管理系统相结合,达到刚柔结合的效果。 2 3 2 协同软件的分类 从产品功能的角度看,协同软件主要有三种类型:协同工具软件、协同平台 软件、协同应用软件。 协同工具软件是指独立的,功能相对简单,部分实现协同软件目标的软件产 品,例如企业电子邮件,企业即时通讯,网络会议系统软件等等。主要功能是协 作沟通,例如腾讯r t x 、以及众多的邮件和通讯等管理软件; 协同平台软件是指较为充分地实现了协同软件的目标,并提供完整的协同工 北京邮电大学硕士学位论文 作环境与应用开发支持的平台软件,包括“综合沟通平台”、“团队协作平台”、 “应用支持平台”三大部分。例如:协达的协同软件业务架构平台c a p 、东兰 的d l f l o 工作流平台等; 协同应用软件是指最终用户实现相互沟通和协作、提高管理效率、实现企业 协同管理的协同办公、协同商务、协同政务等软件,如:协达基于自主c a p 平 台的c t o p 协同应用软件、合强基于d o m i n o 平台的智能办公软软件、蓝凌协同 化的知识管理软件、泛微协同化的办公和c r m 、h r 软件等。通常,协同应用 软件是建立在协同平台软件之上,并利用协同平台软件所提供的协同引擎作为支 持。 2 3 3 具有代表性的协同软件 1 1 b ml o t u sn o t e s d o m i n o i b m 在2 0 0 2 年发布了一系y i j l o t u s 软件产品,以实现跨机构、跨地域和跨越 技术壁垒的协作、学习和知识共享。通过提供l o t u sn o t e s 与d o m i n o6 、s a m e t i m e 3 、q u i c k p l a c e3 以及l e a r n i n g s p a c e 的紧密结合,进一步强化了整个l o t u s 软件产 品的可靠性、可扩展性、安全性。 此外,2 0 0 3 年内,i b m 还发布了四款新的l o t u sw o r k p l a c e 软件,使客户能够 将电子邮件、即时消息和网络会议等模块化协作功能添加到业务应用和企业门户 中。新的l o t u sw b r k p l a c e 产品通过向员工提供一组为其特定工作环境而定制的 协作工具以帮助提高生产率。 2 s u no n e 在协同应用平台中,s u no n e 是能够服务于运营商级应用平台。 s u no n e m e s s a g i n gs e r v e r 具有伸缩性高、性能卓越及管理便捷的特点。它 可以协助服务提供商、门户网站及企业为全体员工、合作伙伴及客户提供一种对 运营商级消息交换服务的通用接入方式。s u no n em e s s a g i n gs e r v e r 以低成本为 基于i n t e m e t 的消息交换服务提供运营商级的平台。包括托管和虚拟域主机等 在内的核心功能令s u no n em e s s a g i n gs e r v e r 平台不仅功能强大,而且扩充自 如。 s u n f o r u m 是一套基于应用程序套件的标准,可为s u n 桌面系统提供视频会 议和合并工具。s u n f o r u m 利用业界标准协议t 1 2 0 和h 3 2 3 使s u n 工作站能够管 理跨平台音频视频会议、v o i p 通信、共享应用程序、管理白色书写板会话以及 利用s u n 、w i n d o w s 或者其他u n i x 桌面解决方案在各成员之间传送文件。 1 4 北京邮电大学硕士学位论文 3 m i c r o s o f te x c h a n g e 在微软e x c h a n g e 的发展中,形成了前后端紧密集成的平台。通过前端后端 架构,微软的后端e x c h a n g es e e r 能够提供良好的服务器平台,而前端o u t l o o k 可以对p o p 3 s m t p 提供良好的支持,这种结构非常容易部署,更是体现了微软 产品与w i n d o w s 体系结构良好结合的优势所在。 此外,e x c h a n g e2 0 0 0 可完全利用w i n d o w s2 0 0 0 的强大功能,是一个可统一 管理全部消息、协作、网络功能及网络资源的平台。e x c h a n g e2 0 0 0 以m i c r o s o f t w e b 存储系统为核心,并将之用作创建、存储、访问和共享企业全部知识的中心 点。内建的w 曲标准协议支持( 包括x m l 和h t t p 支持) 也使e x c h a n g e2 0 0 0 成为 消息与协作应用的理想平台,这些应用将
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年SAP(企业管理系列软件)行业研究报告及未来行业发展趋势预测
- 2025年补钙产品行业研究报告及未来行业发展趋势预测
- 2025年PP合成纸行业研究报告及未来行业发展趋势预测
- 企业合同评审与履行流程指导手册
- 集团公司数字化转型合同管理策略与实施路径
- 遗赠抚养协议范本与子女未来教育规划及财产传承合同
- 项目总监聘用合同范本:全面项目管控
- 龙门吊安装项目安全管理及应急预案协议
- 郝环专属离婚协议模板及子女权益保障协议
- 工程项目部与施工班组安全责任追究及赔偿协议
- 村医依法执业培训课件
- 外科面试题目及答案
- 翻越您的浪浪山新学期开学第一课+课件
- 《不懂就问》教学课件
- 重症肺炎的体位管理
- 2025年干粉砂浆添加剂市场需求分析
- 2025年国企应聘测试题及答案
- 《创新创业基础 第2版》 课件 第1章 认识创业
- 鼾症的健康讲座:认识、预防与治疗
- 学堂在线 极区航海导航保障 期末考试答案
- 音乐种类介绍
评论
0/150
提交评论