(计算机系统结构专业论文)p2p信息交换与共享技术研究.pdf_第1页
(计算机系统结构专业论文)p2p信息交换与共享技术研究.pdf_第2页
(计算机系统结构专业论文)p2p信息交换与共享技术研究.pdf_第3页
(计算机系统结构专业论文)p2p信息交换与共享技术研究.pdf_第4页
(计算机系统结构专业论文)p2p信息交换与共享技术研究.pdf_第5页
已阅读5页,还剩65页未读 继续免费阅读

(计算机系统结构专业论文)p2p信息交换与共享技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

华中科技大学硕士学位论文 摘要 fp 2 p ( p e e rt op e e r ) 技术,代表着一种新兴的网络计算模式,被称为对等 互联技术p 2 p 网络中的每一个对等节点( 对等实体) 都具有相对平等的地 位,既可以向其他对等节点请求服务也可以给其他对等节点提供服务,同 时扮演着c s ( c 1 ie l l t s e r v e t ) 计算模式中的客户机和服务器两个角色在 p 2 p 对等网络中任何两个对等节点之间都可交互通信,每个对等实体都是主 动参与者,都给网络贡献一定的资源,如存储空间、c p u 执行周期、共享 的内容等 然而正是由于普通p 2 p 对等网络中对等实体彼此之间可以频繁交互,不 易管理对等实体任意多播转发消息,共享内容,造成网络流量大幅增加 通过分析普通p 2 p 对等网络的连接机制,指出了其中存在的一些不足之处, 提出了一种改进的连接策略立足于对等实体群,仅允许挑选少数性能强 的对等实体进行多播转发,限制对等实体连接的邻居节点数目,经过随机 1 分析,网络具有较好的连通性,流量分布相对均匀,易于管理卜 ,瓠文通过扩展基于p 2 p 模式的j x t a 协议集来实现改进的连接机制并成功开 发了p 2 p 信息交换和共享系统利用成员资格服务策略限制和确认加入对等 实体群的对等实体身份使用双向单播安全管道进行一对一交互通信和共 享内容的传输采用多个一对多管道实现多对多交互通信和发布对等资源 通告选用聚合对等实体和中继对等实体实现多播转发受限的网络攀爬技 术广度搜索对等资源使用多线程技术服务多个用户,提高响应速度建 立索引并应用信号量互斥机制进行内容共享管理在扩展了的j x t a 协议集 基础上构建实现的p 2 p 信息交换和共享系统,用途广泛 关键词:对等网络?信息交换,、信息共享,并置对等协议 i 华中科技大学硕士学位论文 a b s t r a c t p 2 p t e c h n o l o g yp r e s e n t sa n e wk i n do fn e t w o r k c o m p u t i n gm o d e e v e r yn o d e ( p e e r ) i n t h ep 2 pn e t w o r kh a sa r e l a t i v e l ye q u a lp o s i t i o n ap e e r c a ns e n d r e q u e s t st oo t h e rp e e r s t oa s k f o rs e r v i c e sa n dc a l la l s op r o v i d es e r v i c e st oo t h e rp e e r s i tp l a y sr o l e so fb o t hc l i e n ta n d s e r v e ri n c s ( c l i e n t s e r v e r ) c o m p u t i n gm o d e l e v e r yt w op e e r s i np 2 pn e t w o r kc a n c o m m u n i c a t ew i me a c ho t h e r e a c hp e e ri sa l la c t i v ep a r t i c i p a n t i tp r o v i d e ss o m er e s o u r c e s s u c ha ss t o r a g es p a c e ,c p u c y c l e s ,a n ds h a r e d c o n t e n t sa n ds oo ni to w n e dt op 2 pn e t w o r k h o w e v e r ,i ti sn o te a s yt om a n a g ep 2 pn e t w o r kf o ra l lp e e r sc a n f r e q u e n t l yc o m m u n i c a t e w i t he a c ho t h e r e v e r yp e e rc r l l a r b i t r a r i l ym u l t i c a s ta n df o r w a r dm e s s a g e sa n ds h a r e d c o n t e n t s ,t h i sr e s u l t si nv e r yh i g ht r a 伍ca m o u n t si np 2 pn e t w o r k a f t e rt h ec o n n e c t i o n m e c h a n i s mo f c o m m o np 2 pn e t w o r ki sa n a l y z e d s o m e s h o r t c o m i n g s o f i ta l ep o i n t e do u ta n d a ni m p r o v e do n eh a sb e e nr a i s e do u t b a s e do np e e rg r o u p ,t h e i m p r o v e dc o n n e c t i o n m e c h a n i s mo n l yg r a n tt o p i c ko u tas m a l ln u m b e ro fp o w e r f u lp e e r st om u l t i c a s ta n dt o f o r w a r dm e s s a g e sa n dl i m i tt h en u m b e r o f n e i g h b o r se a c hp e e rc a nd i r e c t l yc o n n e c t t o i tc a n b e p r o v e db ys t o c h a s t i cp r o c e s s e sm o d e lt h a tt h ei m p r o v e dc o n n e c t i o nm e c h a n i s mc a n p r o d u c eg o o dc o n n e c t i v i t ya n dd i s t r i b u t et r a 伍ce v e n l ya n ds m o o t h l ya m o n gp e e r si np 2 p n e t w o r ka n dm a k et h ep 2 pn e t w o r k e a s y t om a n a g e b yu s i n g t h ep o w e r f u l p e e r s a s y s t e mu s e df o re x c h a n g i n ga n ds h a r i n gi n f o r m a t i o ni sd e v e l o p e do u ts u c c e s s f u l l yo n t h ei m p r o v e dc o n n e c t i o nm e c h a n i s mw h i c hi si m p l e m e n t e db ye x t e n s i o no fj x t a p r o t o c o l s s e tb a s e do np 2 pm o d e l i d e n t i t i e so f p e e r sw h i c hw a n tt oj o i nap e e r g r o u pi sl i m i t e da n d r e c o g n i z e db ym e m b e r s h i ps e r v i c e b i - d i r e c t i o n a lu n i c a s ts u r ep i p ei su s e di no n et oo n e c o m m u n i c a t i o na n dt ot r a n s p o r ts h a r e dc o n t e n t s s e v e r a lo n et om a n y p i p e s a r ee m p l o y e di n m a n y t om a n yc o m m u n i c a t i o n sa n dt op u b l i s h p e e r r e s o u r c e sa d v e r t i s e m e n t s b o t hm u l t i c a s t a n df o r w a r df i m c t i o n sa r eo n l y g r a n t e dt or e n d e z v o u sp e e r sa n dr e l a yp e e r st oc r a w l s 叩t h e p 2 pn e t w o r kt os e a r c hp e e rr e s o u r c e sw i d e l y t oa c c e l e r a t et h er e s p o n s es p e e d ,m u l t i p l e t h r e a d sa r es t a r t e dt os e r v em u l t i p l eu s e r s t h es h a r e dc o n t e n t sa 托i n d e x e da n ds e m a p h o r e m u t u a l l y e x c l u s i v em e t h o di su s e df o rc o n t e n tm a n a g e m e n t t h es y s t e mu s e df o re x c h a n g i n g a n d s h a r i n gi n f o r m a t i o n b a s e do ne x t e n s i o no f j x t a p r o t o c o l ss e th a sb r o a da p p l i c a t i o n k e yw o r d s :p 2 p , i n f o r m a t i o n e x c h a n g e , i n f o r m a t i o ns h a r e , j x t a p r o t o c o l i i 华中科技大学硕士学位论文 1 1 课题研究背景 1 绪论 随着连网设备中c p u 计算能力的快速增强,存储容量的成倍增大和网络带宽的 不断增加以及硬件体积的小型化,使得处于网络边缘设备的作用越来越大,性能较 弱的嵌入式系统逐渐得到充分利用计算能力和资源信息分布以中心服务器为主开 始向边缘扩散,网络设备之间能够以相对平等的地位互通信息,分担计算任务,共 享存储空间,均衡传输流量基于p 2 p ( p e e rt op e e r ) 模式“o 的对等网络应运而 生,从而充分利用处于网络边缘上数量众多的个人计算机,嵌入式和便携式设备等 提供的资源 基于p 2 p 模式的信息交换和共享系统不需要中心服务器控制,同一群体的成员 之间可以很方便的使用它交换和共享各自的信息、内容等它在有线、无线连网设 备中具有广泛的应用1 6 - 1 0 1 无线连网的手机、p d a 或m p 3 播放器可以使用它交换m p 3 等音乐文件;有线连网的p c 机、d v d 系统可使用它进行分布式存储,交换和共享任 何内容 本课题致力于研究基于p 2 p 模式的信息交换和共享技术 1 2 国内外研究概况 国内外有很多公司和研究机构正在进行p 2 p 计算模式方面的研究和开发工作 包括如下几个主要方面: ( 1 ) p 2 p 协同工作技术 大型公司的机构日益分散,使员工之间,企业和客户之间、企业和合作伙伴之 间能够方便的交流信息和协作完成事务,变得日益重要网络的出现,使协同工作 成为可能但传统的w e b 方式实现,给服务器带来了极大的负担,造成了昂贵的成 本支出通过p 2 p 技术实时协作、邀请新成员、互通信息和对工作组进行分类,或 1 华中科技大学硕士学拉论文 者在不对i t 基础设施产生聪力的情况下远程监控等,可以建立起一种安全方便的网 上协作工作方式 i i - 捌。l o t o u s 公司正在开缴基于p 2 p 技术的协同工作产品g r o o v e 软伴。 ( 2 ) p 2 p 搜索搜术 秃论是现在懿嚣录式搜索雩l 擎述是智能搜索雩 攀,其攫索都要依赖黢务器采完 成。而利用p 2 p 技术的搜索引擎 1 e - 2 4 ,则完企不用鼹服务器的限制。搜索指令从一 个对等节熹囊它的掰骞邻器节点发出,这些邻屠节煮再努别默类议麓规裁肉各垒静 邻居节点转发,如此数秒内,搜索撒围以几何级数邈速增长。它的搜索广殿和和深 痊是琨存熬穗索弓l 摹难毅跑糍酶。蔫名貔搜索弓| 擎公司g o o g l e 帮露度都藏在采用 p 2 p 技术来改避其搜索引擎。 ( 3 ) p 2 p 信怠共攀技术 在传统憋客户搬鼹务器方式孛,要实蜣文箨交换需要暇务器戆丈力参毒,通j 窭 将文件上传到某个特定的服务器,用户再到该服务器上搜索需要的文件,然后下载, 这秘方式靛不便之处不言蠢睃。瑟爨爝p 2 p 模式可扶溅经存煮共享绩感斡设备中直接 取出数据,光需服务器中转,共享内容更为快速和方便。当前已有不少该类产品问 鏊鲡n a p s t e r 、g n u t e l l a l 2 娶、i m e s h 、s c o u re x c h a n g e 等;搭劝p 2 p 信意共事帮交羧 技术c 2 6 - 3 们,冤需计算性能强大的服务器和高速带宽,就可以挟享、交换甚至拍卖任 毒大家喜欢静数字产暴。 ( 4 ) 海量分布式文件系缆 些大学和研究机构正程进行p e e r t o - p e e r 游由算法m 吲3 及熬于该算法的海 量分奄式文馋系统【”q 7 1 的磷镱l 工作,采用p e e r - t o - p e e r 计算模型,避免或缓解当 前网络服务器系统中稃在的i o 瓶颈问题和w 扩展问题,充分利用嘲络资源,从而 建立一耱具鸯蹇可扩麓性蠢燕可雳经f 弛t 姆l ,态度灵瀵翦分布式存储体系结稳。 1 。3 本课题主要舱研究内容 零瀑题熬磅究凑容氢括戳下咒个主要方蕊: ( 1 ) 考察普通p 2 p 网络逻辑构成和信息交换过程。p 2 p 网络计算模式有它自己的 2 华中科技大学硕士学位论文 特点、优势和逻辑构成,不同于其他网络计算模式。 ( 2 ) 分析普通p 2 p 网络计算模式的连接机制。 ( 3 ) 提出可行的改进策略。研究对等实体对消息的多播转发技术、对等资源的表 示方法和搜索技术。 ( 4 ) 研究p 2 p 信息交换和共享系统的实现技术。探索建立共享内容索引的方法和 各种对等资源在网络中的传输机制。 3 华中科技大学硕士学位论文 p 2 p 对等网络的逻辑组成 p 2 p 网络计算模式同其他网络计算模式相比,有它自己的特点和优势。本部分 主要讨论p 2 p 网络最基本的构成元素及其总体逻辑组成 2 1 几种网络计算模式的特点比较 最常见的网络计算模式包括以下三种:( 1 ) c s ( c li e n t s e r v e r ) 即客户机服务 器网络计算模式( 2 ) b s ( b r o w s e r s e r v e r ) 即浏览器w e b 站点服务器网络计算模 式( 3 ) p 2 p ( p e e rt op e e r ) 即对等网络计算模式。它们都有各自的特点。 2 1 1 c s 网络计算模式 目前最流行的网络计算模式是c s 模式,图2 1 是一个典型的c s 计算模式逻 辑结构。在这种计算模式中,客户机( c l l e n t ) 位于网络的边缘地带,主动向服务器 发出请求,消费服务器提供的服务;而服务器( s e r v e r ) 处于中心地位,它具有很强的 计算能力,庞大的存储容量和高速的传输带宽,它被动的接受客户机发起的请求,根 据相应的规则提供服务 图2 1c s 网络计算模式逻辑结构 c s 网络计算模式具有如下特点: ( 1 ) 以服务器为中心的集中计算方式,信息和数据都保存在服务器端只有服务 4 华中科技大学硕士学位论文 器端具有控制能力,客户端基本上只是一个高性能的i o 设备。传统的基于两层c s 模式的数据管理信息系统( 数据库服务器+ 客户端程序) 就是这样,客户机基本功 能就是显示、搜集相关数据并提交给服务器。 ( 2 ) 被发布信息的存贮与管理相对集中、规范。i n t e r n e t 国际互联网上所有可以 公开访问的信息基本上都保存在中心服务器上,服务器根据适当的规则管理本地信 息,按照相应算法应答客户端的访问请求或进行计算 ( 3 ) 服务器及服务器接入网络的带宽决定了网络的性能。每台服务器所能提供的 信息数量受到自身存储容量大小的限制,而任意时刻它所能支持的客户端访问数量 则既受到自身处理能力的限制也受到服务器所在网络吞吐能力和其网络接口性能的 限制。 ( 4 ) 被发布信息的分布与生存期很稳定服务器只发布内容提供商所要求的或机 器所有者想公布于众的信息,按照相关指示,这些信息将会在该服务器的存储器中 稳定地保存一段时间,并且该服务器通常也不间断地运行在网络上 ( 5 ) 根据上层特定的通信协议,信息资源的地址普遍使用u r l 用来表示,但是所 定位的信息的具体内容很少能通过u r l 直接体现出来,u r l 常常不能直接链接到具 体的内容上,还需多次进一步查找 2 1 2 b s 网络计算模式 b s 计算模式和c s 计算模式类似,其逻辑结构如图2 2 i j i 示。只是此时的客户端 图2 2b s 网络计算模式逻辑结构 华中科技大学硕士学位论文 软件是浏览器而已。在基于b s 模式三层( 数据库服务器+ w e b 服务处理层+ 客户端 浏览器) 体系结构中,增加了w e b 服务处理层,使用通用的h t t p 等协 义,更易于用户 在异构网络中访问多含数据库服务器,同时浏览器的统一操作界面和熟知功能,具 有 l c s 模式更好的易用性。大量用户可以通过浏览器方便访问由多个w e b 服务器提 供的信息。无论是c s 模式还是b s 模式,服务器和客户机之间都有明显的区分界限, 但是客户机和服务器通信联系紧密,而多个服务器之间或多个客户机之间几乎没有 通信联系,关系松散。 2 1 3p 2 p 网络计算模式 p 2 p n 络计算模式是非中心分散式结构,如图2 3 所示,它与c s 和b s 计算模式 有明显的差别。 图2 3p 2 p 网络计算模式逻辑结构 ( 1 ) 每一个对等节点( 对等实体) 具有相对平等的地位,既可以请求服务也可 以提供服务,同时扮演着c s 计算模式中的服务器和客户端两个角色,运行s e r v e n t 软件( s e r v e r + c ll e n t = s e r v e n t ) ,还可以具有路由器和高速缓冲存储器的功能, 从而弱化了服务器的功能,甚至取消了服务器,同时增强了客户机功能。 ( 2 ) p 2 p 技术可以让那些非互连网络用户很容易地加入到p 2 p 网络中。在p 2 p 网络 中的很多对等体通常不必使用固定的i p 地址,并且接入网络和断开网络具有不确定 性。在p 2 p 的计算环境中任何设备一一从大型机至t j d , 型嵌入式系统,移动设备,甚 至是传呼机一一均可以在任何时间,任何地点方便地加入进来p 2 p 计算技术不仅可 6 华中科技大学硕士学位论文 以应用于当前的有线互联网络,同时还可以应用于无线通信网中。 ( 3 ) 信息的存储及发布不能完全集中管理,一般根据冗余策略确定。 ( 4 ) 在使用p 2 p 计算模式的网络中,网络中每个对等实体都是主动参与者,都给 网络贡献一定的资源,如存储空间、c p u 执行周期等。对等实体构成全连通图的各个 顶点,彼此之间可以直接交流通信。每一个对等实体可以充分利用网络上其他对等 实体授予权限共享的信息资源、处理器周期、高速缓存和磁盘容量等。 ( 5 ) p 2 p 计算模式使用基于内容的寻址方式。这里的内容不仅包括通常所说的信 息的具体内容,还包括空闲机时、存储空间信息等,每一内容信息都有相应的识别 标识。在p 2 p 网络中,用户直接输入要索取的信息的内容特征,而不是所要信息的链 接地址,p 2 p 对等实体软件将会根据相应的算法把用户的请求转换成包含此信息特征 的节点的实际地址,而这个地址对用户来说是透明的 通过上面的总结分析,可以看出p 2 p 计算模式相对于c s 和b s 计算模式的一些主 要优点如下: ( 1 ) p 2 p 模式最主要的优点就是使p 2 p y ( 寸等网络中的资源能有高度利用率。在p 2 p 网络上,每个节点的闲散资源可以有机会得到充分利用,所有节点的资源总和构成 了整个网络的资源,整个网络可以被用作具有海量存储能力和巨大计算处理能力的 超级计算机在c s 模式和b s 模式下,资源仅集中在数量很小的服务器上,纵然数 目众多的客户端有大量的闲置资源,也无法被利用,因为客户机之间几乎没有什么 交互通信 ( 2 ) c s 模式和b s 模式下的互联网络是完全依赖于中心节点一一服务器的,如 果没有服务器,网络就不能对外提供服务,客户机即使数量再多也索取不到任何服 务,但又不能给其他客户机提供服务,从而使整个网络不具任何意义而p 2 p 网络中, 任何对等实体都可对外提供服务和信息,即使只有一个对等实体存在,网络也是活 跃的,节点所有者可以随时随意地将自己的信息发布到网络上 ( 3 ) 随着节点的增加,在c s 模式和b s 模式下,由于越来越多的客户的加入, 中心节点( 服务器) 的负载就越来越重,就会变得更加脆弱一些;中心节点( 服务器) 处会形成系统的计算资源瓶颈和带宽瓶颈,一旦服务器崩溃,整个网络也随之瘫痪。 例如,许多极受欢迎的w e b j 1 务器站点接受的访问量巨大,但因受限于通信网络带宽 华中科技大学硕士学位论文 和处理器负载,资源常常紧张的几近崩溃,甚至不可得到;而此b , j i n e f l l e t 上其他 大部分客户计算机却处于空闲等待状态。而在p 2 p 网络中,每个对等体都是一个活动 的积极参与者,每个对等实体都可向网络贡献一些资源,如存储空间、c p u 周期等。 所以,加入网络的对等实体越多,网络的资源越多,计算性能越好,网络随着规模 的增大而越发稳固,具有很强的可扩展性和很高的可用性。 ( 4 ) p 2 p 网络中,任何两个对等实体之间都有机会交互通信,信息在网络设备间 直接流动,流量相对均匀,高速及时,降低中转服务成本 ( 5 ) p 2 p 网络基于内容特征的寻址方式处于一个更高的语义层次,因为用户在搜 索时只需指定具有实际意义的信息标识而不是抽象的资源地址,每个标识对应着包 含这类信息的节点的集合这将有利于创造一个更加精炼的信息仓库和一个更加统 一的资源标识方法。 但是,p 2 p 计算模式也有不足之处首先,p 2 p 对等网络中的对等实体连网具有 不确定性,信息分散,较难管理;而对于c s 模式和s s 模式的网络,只需在中心 节点( 服务器) 进行控制,比较容易管理整个网络。再者,要保证p 2 p 网络中数据 的安全,需考虑很多因素,各个节点,在安全策略、备份策略等方面,p 2 p 的实现 要复杂一些。另外,由于对等点可以随意地加入或退出网络,会造成网络带宽和信 息存在的不稳定。 2 2 p 2 p 对等网络的逻辑组成 2 2 1 对等实体 对等网络由一个或多个对等实体构成对等实体软件( s e r v e n t ) 可以是任何已 经实现了一种或多种p 2 p 通信协议的软件任何可连网的设备,包括传感器,电话 机,个人数字助理p d a ,个人电脑,服务器和超级计算机等可根据自身能力运行对 等实体软件而成为对等实体一台计算机或设备上可以运行多个对等实体软件每 一个对等实体都能独立、异步运作,而不依赖或受限制于其他对等实体。通过对等 实体的身份标识来唯一识别该对等实体。 华中科技大学硕士学位论文 对等实体使用p 2 p 协议来发布一个或多个网络接口。每一个网络接口被广告称 为用来唯一标识该网络接口的对等体端点。对等实体使用对等体端点在两个对等实 体之间直接建立点到点的连接。 对等实体之间并不要求有直接的点到点的网络连接。由于不在同一物理网络上, 或因为网络配置原因如防火墙,代理等,一些对等实体被隔离,但它们可以通过中 介对等实体来帮助路由消息 网络中的对等实体彼此可以本能自发的发现对方,形成暂时或持久的关系从而 构成对等实体群。 2 2 2 对等实体群 对等实体群是由一些遵循一系列公共服务协议的对等实体构成的集合每一个 对等实体群都有一个唯一识别该对等实体群的身份标识对等实体可以自愿加入对 等实体群。每一对等实体群都能建立自己的成员资格隶属策略,包括从任何对等实 体都可加入的开放策略到必须有足够充分的信任证书才能加入的高度安全和受保护 的策略 一个对等实体可以同时隶属于多个对等实体群默认情况下,最初创建的对等 实体群被称为根群。所有对等实体都是根群的成员对等实体可以选择再另外加入 其他的对等实体群。同一个对等实体可以是多个对等实体群的成员。 p 2 p 协议描述了对等实体怎样公布发现、加入和监控对等实体群但不规定 何时或因何原因生成对等实体群 创建对等实体群有多种目的: ( 1 ) 产生一个安全的环境 对等实体群可以生成一个局部控制域,在该域内能够实施特殊的安全策略。这 种安全策略可以象基于普通文本的用户名密码交换机制一样简单,也可以象公共密 钥加密体系那样复杂在对等实体群的约束下,只有隶属于该群的对等实体成员才 可以访问和发布受保护的内容。对等实体群形成了一个逻辑上的区域,该区域的边 界会限制对该群体资源的访问。 华中科技大学硕士学位论文 ( 2 ) 产生一个作用域范围环境 对等实体群允许建立专门化的局部域。例如,一些对等实体聚合成一个群体来 共同构成一个文档共享网络或c p u 共享网络对等实体群可以把网络再细分成多个 抽象的逻辑区域以隐含提供范围划分机制。当搜索对等实体群的资源内容时,对等 实体群的逻辑边界线定义了搜索查找的范围。 ( 3 ) 产生一个跟踪监控环境 出于特定的目的如心跳检测,网络流量内省,费用计量等,对等实体群允许一 些对等实体跟踪监控其他一系列对等实体 对等实体群也可组成一个分层、分等级的父一子继承关系,每一个群体都由单 一的父群,形成倒立的树状分支。搜索请求主要在本群范围能传播。群的资源通告 则可以在父群和本群范围内公布 2 2 3 p 2 p 对等网络的逻辑组成形态 p 2 p 对等网络有运行s e r v e n t 软件的对等实体构成,这些对等实体使用p 2 p 协 议进行通信,即可对外提供服务,又能向其他对等实体发出索取请求。由于p 2 p 对 等网络是一种完全分散型的网络,如果不注意管理,将会出现一盘散沙的局面。为 图2 4 对等网络逻辑构成 了便于管理,对等实体根据各种目的,创建加入对等实体群,多个对等实体群互相 协作,共同组成整个p 2 p 对等网络,如图2 4 所示同时加入了多个对等实体群的 1 0 华中科技大学硕士学位论文 对等实体能够建立群与群之间的联系。 2 2 4p 2 p 对等网提供的基本服务 对等实体通过相互协作和交流通信来公布、发现、调用网络服务。对等实体可 以发布多个服务,通过对等实体发现协议来发现网络服务 p 2 p 对等网提供的两种级别的服务: a 对等实体服务 只有在公布对等实体服务的该对等实体处才能够访问这一服务。如果该对等实 体已离线或出现了故障,那么该服务也就随着不可用。服务的多个实例能够运行在 不同的对等实体上,但每个服务实例只发布它自己的广告 b 对等实体群服务 对等实体群服务由运行在该对等实体群的多个成员上的服务的一组相互协作的 实例的集合构成假定该服务仍然可以从另一个对等实体成员处获得并且是可用, 如果任一对等实体出现了故障,整体的对等实体群服务并不受影响对等实体群服 务是作为对等实体群通告的一部分公布的 服务可以被提前预装到一个对等实体上,或者是从网络上装载为了能够实际 运行一个服务,对等实体必须能断定本对等实体能够满足该服务的具体实现的运行 环境需求从网络上查找,下载和安装服务的过程同在i n t e r n e t 上查找一万维网页, 取回该网页接着安装所需要的插件的执行过程相似。 每一对等实体群都提供一系列被称作对等实体群体服务的服务。一些p 2 p 协议 定义了一套对等实体群体服务的核心集可以在此基础上开发发布附加的专有服务。 若两个对等实体期望通过使用服务来进行交互,它们必须都是隶属于同一对等实体 群的成员。 核心的对等实体群体服务包括: ( 1 ) 发现服务一群的对等实体成员使用发现服务来搜索对等实体群的资源,如对 等实体、对等实体群、管道和服务等 ( 2 ) 成员资格服务一群的当前成员使用成员资格服务来拒绝或接受该对等实体 华中科技大学硕士学位论文 群新的成员资格申请。一个对等实体若想加入某个对等实体群,它必须首先找到该 群当前的一个成员,然后申请) j h a 。加人群的申请是被拒绝或是被接受由该对等实 体群当前的一些成员集体决定。成员资格服务可以实行由该群的当前的一些成员集 体投票公认决定,也可以选举指派一个该群的代表来接受或拒绝新的成员资格申请。 ( 3 ) 访问控制服务一访问控制服务被用来验证一个对等实体向另一个对等实体 发出的请求,并使其生效如果访问被允许的话,接收到请求的对等实体需提供发 出请求的对等实体的信任证书和其他有关判断确认请求的信息。并非对等实体群中 的所有行动都需要使用访问控制服务来检查,只有那些受限于某些对等实体的行为 才必须接受检查。 ( 4 ) 管道服务一管道服务被用来在对等实体群的成员之间创建和管理通信管道 连接。 ( 5 ) 解析服务一解析服务被用来向其它对等实体发送通用询问请求。对等实体能 够定义和交换询问信息以找到任何所需要的信息,如服务的状态或管道端点状态。 ( 6 ) 监控服务一监控服务允许一个对等实体能够监控同一对等实体群中的其他 成员。 每一个对等实体群并非都必须实现上述所有的服务。一个对等实体群可以自由 选择仅仅实现它认为是有用的服务,并借助默认的根群提供非关键性的核心服务的 通用实现。 2 3 小结 在这一章里,通过将p 2 p ( p e e rt op e e r ) 计算模式同c s ( c ti e n t s e r v e r ) 计算 模式,b i s ( b r o w s e r w e bs i t es e r v e r ) 计算模式相比较,分析了各种计算模式的本 质特征,指出了p 2 p 计算模式同其他计算模式之间区别和联系,展示了p 2 p 计算模 式不可比拟的优点接着介绍了p 2 p 对等网络的逻辑组成,并归纳出p 2 p 网络一般 可提供的基本服务。 1 2 华中科技大学硕士学位论文 3 一种改进的p 2 p 对等网连接机制 3 i p 2 p 通信协议集所处的位置 0 s i 的七层协议体系结构概念清楚全面,但是它既复杂又不实用。t c p i p 协议应 用普及十分广泛,得到了全世界的承认,但它实际上并没有一个完整的体系结构。 我们在理解计算机网络的原理时常常采取的折衷办法,即综合o s i 和t c p i p 的优点, 用一种具有五层协议的原理体系结构40 1 ,这样可以简明的将概念阐述清楚p 2 p 通 信协议集在各种协议体系结构中的对应位置如图3 1 所示 o s i 体系t c p i p 体系原理体系 ,p 2 p 协议集位置 7 应用层应用层( 如h t t p , 6 表示层s m t p ,t e l n e t ,f t p应用层p 2 p 通信协议集 5 会话层 等协议)h t t f 4 运输层运输层t c p ,u d p运输层运输层t c p ,u d p 等 3 网络层网际层i p网络层网络层i p 等 2 数据链路层网络接口层数据链路层数据链路层 1 物理层物理层物理层 图3 1p 2 p 协议集所处的层次位置 在原理体系结构中,物理层协议主要功能是透明地传送比特流。该层确定二进 制比特0 、1 ( 即两种相反的状态) 应该怎样用电压或电流编码表示,如发送端 如何产生比特,接收端怎样识别比特等 数据链路层协议用于确保在两个相邻节点间的一段链路上以帧( f r a m e ) 为单位 传送二进制数据时不出差错每一帧包括相应的帧校验信息、地址信息、控制信息 和数据等。 网络层协议的任务包括屏蔽各种不同种物理网络的差异性,提供统一的寻址功 能它将原站运输层数据封装后以包( 分组) 为单位选择合适的路由,穿越不同的物 理网络按照地址找到目的站,并交付给目的站的运输层 运输层存在于通信的主机中,主要功能是封装上层协议数据,以报文为单位为 上层通信进程提供可靠的端到端的服务。主机中运输层以上的协议看不到运输层以 13 华中科技大学硕士学位论文 下的通信细节。路由器和交换机中一般没有运输层。运输层及其以下各层协议主要 负责网络传输问题,运输层以上的协议一般不再负责网络传输任务。 应用层协议根据用户发出的服务请求确定通信进程的逻辑操作,直接为应用进 程提供信息交换所需的语义表示。 p 2 p 底层通信协议位于网络协议层次中的应用层,它可以使用下层无线通信协议 提供的服务,也能使用i a t e r n e t 网的t c p i p 传输协议,由于i n t e r n e t 网的飞速发展, 很多p 2 p 底层通信协议都是在t c p i p 协议上实现的,需要使用下层u d p ,t c p ,i p 协 议提供的服务。若网络中存在防火墙或网络地址转换设备,则需要使用应用层的h t t p 协议,这时p 2 p 底层通信协议会调用h t t p 协议提供的服务,穿过防火墙或网络地址转 换设备( 速度较慢) ,然后再换用其他较快的运输层协议 3 2普通的p 2 p 对等网络信息流量分析 p 2 p 对等网络正逐渐成为为企业和互联网提供分布式服务( 如搜索,内容的综 合管理,彼此对等通信等) 的重要设施。这是因为:不能只依靠集中式的服务( 使 用服务器作为中心节点提供服务) ( 如查找服务) ,分布式对等网络中的每一个节点 各自维持它自己的索引和查找服务,可以相互协作或各自独立的为其它节点提供服 务。查询不再仅仅汇聚到达中央服务器,相反,它们呈扇形和树枝状分插散开到整 个网络中,得到的结果被收集和传回查询发起节点p 2 p 网络将允许查询结果是最 新的( 极端一点,查询结果甚至可以接纳从数据库事务中组装的动态内容,反映出 市场上商品的实时定价和存货信息) 。这种能使查询结果保持最新的实时动态特性在 传统的静态检索中是不可能出现的。在传统的以服务器为核心的网络中,只能依靠 服务器中的搜索引擎提前好几周依次访问列表中所有的信息站点,将所有相关信息 取回后再转存到本地数据库中,当客户需要查询时,服务器在自己数据库中查询以 前已经保存的信息,其中有些与客户查询的信息无关,得到所需要的结果后返回给 用户。这样,在许多企业中,传统的静态检索只能得到好几周以前的陈旧信息。然 而p 2 p 检索有一个缺点,由于很多对等实体都参与响应搜索请求或帮助路由和转发 询问请求,这就会使网络流量几乎是成指数形式或几何级数增加如图3 2 所示, 1 4 华中科技大学硕士学位论文 一个对等实体向其四个邻居节点发送搜索请求,其每个邻居节点都再向自己的邻居 转发请求,若每个对等实体都有四个以上的邻居节点,经过n 环转发后,网络中的 n 搜索请求消息的数量接近1 2 4 “个。与请求消息对应的响应消息返回到发起请求的 i = l 对等实体时,会使该对等实体应接不暇。 图3 2 搜索请求多播转发 当前的p 2 p 网络( 如f r e e n e t f 4 卜4 23 ) 由一些对等实体参与者构成,这些参与者通 常遵从他们自己不太协调的并且通常是比较独特的协议( 多数s e r v a n t 软件是在声 称兼容的情况下独立实现的) ,不太成熟。一些对等实体由于计算能力较弱,结果频 繁遭受网络超载的影响而那些被阻塞的节点因无充足的带宽以至于将数据块分割成 不连贯的碎片,逗留于对等网中,影响通信效率 怎样才能减少p 2 p 网络中到达同一个对等实体的消息数量呢? 由于p 2 p 对等网 是由很多对等实体群构成,我们可以先针对某一个对等实体群进行分析如图3 3 所示,设具有封闭曲线的某一p 2 p 对等实体群,长度不同的消息随机的进入该对等 实体群,然后按照在某一通道排队的先后再发送到下一目的节点 设在时间间隔( 0 ,t ) 内进入该p 2 p 对等实体群中的消息数目为p ( t ) ,而离 开该对等实体群的消息数目为o 【( t ) ,在此时间间隔里存储在这个p 2 p 对等对等实 体群中的消息数目为二者的差值: n ( t ) = b ( t ) 一a ( t )式( 3 1 ) 这里“离开对等实体群”是指一条消息在某一边界通道发送完毕 而在这段时间间隔( o ,t ) 内,所有消息在这个对等实体群中已经经历的时间之 和设为( t ) ,使用微积分方法有 华中科技大学硕士学位论文 ( t ) = i 。n ( x ) d x 式( 3 2 ) 由上式可求得在时间间隔( 0 ,t ) 内对等实体群中的平均消息数目n ( t ) 应为 n ( t ) = ( t ) t = ( 1 t ) i 。n ( x ) d x 式( 3 3 ) 每条消息在对等实体群中所经历的平均时间设为t ( t ) ,有( 2 ) 式可得 t ( t ) = ( t ) b ( t ) 。( 1 d ( t ) ) n l n ( x ) a x式( 3 4 ) 设时间间隔长度为t 时,消息的平均到达率记为入( t ) ,其表达式为 入( t ) = d ( t ) t式( 3 5 ) 联合式( 3 3 ) 、( 3 4 ) 、( 3 5 ) 可得: n ( t ) = 入( t ) + t ( t )式( 3 6 ) 图3 3 对等实体群中的消息交换模型 由式( 3 6 ) 式可知,存储在p 2 p 对等实体群中的消息数n ,等于消息的到达率入 乘以这些消息在对等实体群中经历的时间t 对等网络由多个对等实体群构成,要减少某段时间间隔里到达p 2 p 对等网络某 一对等实体的消息数量n ,需要减少消息的平均到达率入和消息在网络中经历的平 均时间t 。假设每个对等实体节点的硬件不升级和不更换,并且该对等实体节点接 人网络的带宽不变的情况下,消息的平均到达率同产生消息的对等实体数目x 相关, 同该对等实体在线连接的网络邻居数目l 相关,还和该对等实体共享的信息容量大 小有关在线网络邻居越多,共享的信息越多,可间接造成消息得到达率增大假 设在消息传递过程中,网络中的节点转发消息的速率不变,网络带宽不变( 双绞线, 光纤网络不升级换代) ,在无堵塞情况下,消息在网络中经历的平均时间同消息在网 络中所经历的平均路程( 节点数) 相关,路程越长,消息在网络中经历的时间也就 华中科技大学硕士学位论文 越长:除去消息在网络中循环现象,网络的直径越大,消息在网络中经历的时问也 就越长。因此,要想减少网络中过多的消息,需要控制对等实体在线连接的网络邻 居数目,减少多播转发消息的对等实体的数目,需要构建较合理的网络拓扑结构, 使得消息经历的网络直径不会太大,节点数目不致过多,并使流量分布相对均匀。 3 3普通的p 2 p 对等网络连接策略分析 要想使得网络中信息流量分布相对均匀,通信节点不致过多,需要分析p 2 p 网 络的连接策略,构建合理的p 2 p 网络拓扑结构。每一个参与p 2 p 网络的对等实体都 运行所谓的s e r v e n t 对等实体软件,该软件嵌入了启发式自学习探索功能模块,依 靠该模块制定的连接策略,对等实体节点可决定加入网络时首先应该搜寻哪些邻居 节点并建立连接。正加入网络的对等实体节点并不知道当前网络拓扑结构的全局信 息,甚至连p 2 p 网络中其他节点的身份标识( 如i p 地址) 也不知道。要产生执行性 能很好的网络拓扑结构,需要s e r v e n t 对等实体软件模块有很好的连接机制。针对 f r e e n e t 网络来说,并没有一致同意的答案。因为有多种多样的s e r v e n t 对等实体 软件模块的具体实现不断涌现,每一种都有它自己独特的启发式自学习连接策略, 虽然大部分相互兼容,但彼此各不相同,很少能够弄懂网络的实际演化情形。实际 上,许多基于i n t e r n e t 网络的服务提供商试图从p 2 p 计算模式杂乱无序的演化中找 到有序的应用【43 】f 4 4 】,但几乎都没法用严谨的方法获得切实可行的成功。 若s e r v e n t 对等实体软件模块都以一种统一的标准的方式实现,其具有的主要 优势是,启发式自学习连接策略的本地局部行为所产生的p 2 p 网络将具有很好的全 局属性。本文在后面提出了一种改进的启发式自学习连接策略,它基于j x t a 4 53 协 议集,能用于企业级p 2 p 产品,直观实用。如果每一个s e r v e n t 软件模块都遵循这 种策略,经过随机分析,可证明其产生的p 2 p 网络在网络的节点数目和其他属性上 将得到可靠的保证。 我们现在先以f r e e n e t 网络为例,简要分析该p 2 p 网络中一个对等实体中的 s e r v e n t 软件同其他对等实体中的s e r v e n t 软件的连接机理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论