(计算机应用技术专业论文)基于p2p网络的chord协议改进模型ptcc的研究.pdf_第1页
(计算机应用技术专业论文)基于p2p网络的chord协议改进模型ptcc的研究.pdf_第2页
(计算机应用技术专业论文)基于p2p网络的chord协议改进模型ptcc的研究.pdf_第3页
(计算机应用技术专业论文)基于p2p网络的chord协议改进模型ptcc的研究.pdf_第4页
(计算机应用技术专业论文)基于p2p网络的chord协议改进模型ptcc的研究.pdf_第5页
已阅读5页,还剩50页未读 继续免费阅读

(计算机应用技术专业论文)基于p2p网络的chord协议改进模型ptcc的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

兰州大学硕上学位论文基于p 2 p9 6 9 络的c h o r d 协议改进模型p t c c 的研究 摘要 自从1 9 9 9 年n a p s t e r 的流行,人们对p 2 p 技术的研究日益升温,呈现出迅猛发 展的势头。p 2 p 网络使i n t e r a c t 重返自由和平等的本质,极大地提高了资源的利用 率,使得资源共享上升到了一个更高的层次。p 2 p 的关键技术之一是在物理网络之 上搭建一层逻辑的覆盖网络,以提供资源组织和定位服务。 本文首先研究了n a p s t e r 、g n u t e l l a 、k a z a a 、c h o r d 这四种具有代表性的经典 协议,通过分析发现c h o r d 具有优异的性能。然后提出了一种基于物理拓扑的复合 c h o r d - - p t c c 模型,此模型在c h o r d 的基础上作了以下改进: 1 物理网络和逻辑覆盖网络拓扑的失配。使用具有未来必然趋势的i p v 6 协议 作为网络层协议,利用分段哈希节点i p v 6 地址的前缀和后缀的方式构造节点的标识 符,使得节点标识符携带了节点位置信息。这样,具有相同标识符前缀的节点位于 同一局域环,达到物理距离近的节点逻辑距离也相对较近。环内使用本地指针表进 行消息路由,环间则使用环间指针表。 2 资源拥有节点或索引节点失效时导致的资源不可用。采用哈希多关键词的 方法构造资源的多个标识符,然后将每个标识符同时发布到本地环和外地环中的索 引节点上。当其它节点拥有此资源时也再次发布。这样资源将有多个拥有节点和索 引节点,增强了资源的可用性。 3 热点问题引起的资源拥有节点或索引节点的负载失衡。经过上述方式发布 后,资源的访问很多都可以在本地环中进行。 最后,本文使用m i t 开发的p 2 p s i m 模拟器做了模型仿真和性能比较。结果表 明,p t c c 模型在查询效率等方面比c h o r d 性能更好。 关键词:p 2 pd h tc h o r di p v 6 p t c cp 2 p s i m 兰州人学硕士学位论文 基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 a b s t r a c t s i n c et h ei n c r e a s i n gp o p u l a r i t yo fn a p s t e ri n1 9 9 9 ,m o r ea n dm o r ea t t e n t i o nh a v e b e e np a i dt ot h er e s e a r c ho fp 2 pt e c h n o l o g y p 2 pt e c h n o l o g ym a k e si n t e r n e tr e g a i n si t s e s s e n c eo ff r e e d o ma n de q u a l i t y m e a n w h i l e ,w i t ht h eu t i l i z a t i o no fr e s o u r c e si m p r o v e d , t h et o t a lr e s o u r c e sc a nb es h a r e da tah i g h e rl e v e l o n eo ft h ek e yt e c h n o l o g i e si np 2 pi s t h a ti ts e t su pl o g i c a lo v e r l a yn e t w o r ku p o np h y s i c a ln e t w o r ks oa st op r o v i d es e r v i c e so f r e s o u r c eo r g a n i z a t i o na n dl o c a t i o n t h i sp a p e rb e g i n sb yr e v i e w i n gt h en a p s t e r , g n u t e l l a ,k a z z aa n dc h o r d f o u r t y p i c a lp r o t o c o l sd e t a i l e d l y t h r o u g ha n a l y s i s ,i tc o n c l u d e st h a tc h o r dp o s s e s s e sf i n e q u a l i t i e s i n s p i r e db yt h ec o n c l u s i o n ,ap h y s i c a lt o p o l o g yb e s e dc o m p o u n dc h o r d m o d e l - - p t c ci sp u tf o r w a r d b a s e du p o nc h o r d ,t h em o d e ls o l v e st h ef o l l o w i n gp r o b l e m s ( 1 ) t h em i s m a t c hb e t w e e np h y s i c a ln e t w o r ka n dl o g i c a lo v e r l a yn e t w o r kt o p o l o g y h e r e ,i p v 6p r o t o c o lw h i c hw i l lb ei n e v i t a b l ei nt h ef u t u r ei su s e da sn e t w o r kp r o t o c o la n d t h ew a yt od e v i d eh a s ht h ep r e f i xa n ds u f f i xo ft h en o d e si p v 6a d d r e s si se m p l o y e dt o c o n s t r u c tt h ei d e n t i f i e ro ft h en o d ew h i c hi sa b l et oc a r r yt h el o c a t i o ni n f o r m a t i o no ft h e n o d e i nt h i sw a y , n o d ew i t ht h es a m ei d e n t i f i e rp r e f i xw i l lb ei nt h es a m el o c a lr i n ga n d t h u sn o d e so fs h o r t e rp h y s i c a ld i s t a n c ew i l lc o r r e s p o n d i n g l yh a v es h o r t e rl o g i c a ld i s t a n c e a l s o ,w i t h i nt h er i n g ,l o c a lp o i n t e rt a b l ei su s e df o ri n f o r m a t i o nr o u t i n ga n db e t w e e n r i n g s ,i n t e r p o i n t e rt a b l ei su s e d ( 2 ) s o m er e s o u r c e sa r en o ta v a i l a b l eb e c a u s eo ft h ef a i l u r eo fr e s o u r c e so w nn o d e s o rt h e i ri n d e xn o d e s i nt h em o d e l ,t h es h a r er e s o u r c e si d e n t i f i e ra r ec o n s t r u c t e dw i t ht h e m e t h o do fm u l t i - k e y w o r dh a s h ,t h e ne a c hi d e n t i f i e ri sp u b l i s h e da tt h es a m et i m et ot h e i n d e xn o d e si nt h el o c a lr i n ga sw e l la si nt h ef o r e i g nr i n g b e s i d e s ,o t h e rn o d e sw i l la l s o p u b l i s ht h er e s o u c e sw h e nt h e yp o s s e s s e st h e m i nt h i sw a y , t h er e s o u c ei sc o r r e s p o n d i n g w i t hm a n yo w nn o d e sa n di n d e xn o d e s ,s oi tw i l lb eu t i l i z e db e t t e r ( 3 ) i m b a l a n c eo fl o a do ft h er e o u r c e so w nn o d e sa n di n d e xn o d e sc a u s e db yh o t s p o t s e et h ea b o v e t h em o s t l ya c c e s st or e s o u r c et h a tp u b l i s h e db yt h ea b o v ew a yc a nb e r e s o l v e dw i t h i nt h el o c a lr i n g f i n a l l y , s i m u l a t i o na n dq u a l i t yc o m p a r i s o na r em a d ei nt h et h e s i st h r o u g ht h eu s eo f p 2 p s i ms i m u l a t o rd e v e l o p e db ym i t t h er e s u l ts h o w st h a tp t c cm o d e lh a ss u p e r i o r q u a l i t i e st oc h o r do nl o o k u pe f f i c i e n c y k e y w o r d :p 2 pd h t c h o r di p v 6p t c cp 2 p s i m 原创性声明 本人郑重声明:本人所呈交的学位论文,是在导师的指导下独 立进行研究所取得的成果。学位论文中凡引用他人已经发表或未发 表的成果、数据、观点等,均已明确注明出处。除文中已经注明引 用的内容外,不包含任何其他个人或集体已经发表或撰写过的科研 成果。对本文的研究成果做出重要贡献的个人和集体,均已在文中 以明确方式标明。 本声明的法律责任由本人承担。 论文作者签名:盘趣笪 日 期: 关于学位论文使用授权的声明 本人在导师指导下所完成的论文及相关的职务作品,知识产权归属 兰州大学。本人完全了解兰州大学有关保存、使用学位论文的规定,同 意学校保存或向国家有关部门或机构送交论文的纸质版和电子版,允许 论文被查阅和借阅;本人授权兰州大学可以将本学位论文的全部或部分 内容编入有关数据库进行检索,可以采用任何复制手段保存和汇编本学 位论文。本人离校后发表、使用学位论文或与该论文直接相关的学术论 文或成果时,第一署名单位仍然为兰州大学。保密论文在解密后应遵守 此规定。 论文作者签名:她师签名:冬烛 兰州大学硕上学位论文 基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 第一章绪论 网络的飞速发展与迅速普及使得网络的规模越来越大,接入的设备数量和种类 越来越多,网络中蕴含了大量的计算资源、存储资源、信息资源、带宽资源等。但 这些资源在互联网中存在着大量的闲置,利用率不高。 如何组织、定位这些资源成为人们所关注的焦点问题。p 2 p 网络【1 1 ( p e e rt op e e r , 对等网络) 便应运而生,引发了目前非常热门的应用。自1 9 9 9 年以来,对等网的研 究一直是国外知名学府以及知名企业的研发机构关注的重点。 但是,目前的主流p 2 p 网络模型在实际的应用中还存着大量的问题,因此,对 于现在流行的p 2 p 网络模型还需要进一步探究。本论文主要是针对目前主流p 2 p 网 络模型在查询性能、可扩展性等方面进行研究,以期望能够得到一个高效、健壮、 负载均衡的模型。 1 1 研究背景 回顾计算机性能及其网络发展的历程,我们可知资源共享经历了主从模式:c s 模式和p 2 p 模式。 从计算机网络的诞生到上个世纪8 0 年代,计算机价格昂贵且功能相对较弱是 采用主从式模式的客观条件。在这种模式中,终端没有处理能力,只能用于输入和 输出。数据处理完全在主机上进行,使得主机资源得到最大的利用。然而该模式存 在以下缺点:主机负载太重;主机价格过于昂贵;可扩展性差;潜在单点故障等。 随着计算机性能的不断提高和价格的不断下降,上世纪8 0 年代 c s ( c l i e n t s e r v e r ,客户机朋艮务器) 模式开始发展。它的基本工作方式是客户机发出 请求,服务器接收请求并进行分析处理,然后将处理结果返回给客户机。在该模式 中,客户机具备一定的计算能力,但主要工作还是依赖于服务器来完成。虽然c s 模式克服了主从模式的很多缺点,但仍存在以下问题:存在性能瓶颈和单点失效; 可扩展性和容错性差;客户和服务器的角色分配缺乏灵活性;客户机资源没有被充 分利用造成浪费等等。目前,这种模式仍然是市场上的主流。 由于网络规模越来越大,连入设备的数量越来越多、性能越来越强。一方面, 传统的c s 模式把资源集中在少数节点的特性己成为其处理数据访问的瓶颈,而另 一方面,位于网络边缘的这些资源却没有得到充分的利用。如果能够将这些资源进 行充分利用将会有效缓解目前互联网所面临的一些问题嘲。 兰州大学硕l :学位论文 基于p 2 p 网络的c h o r d 协议改进模型p 1 c 的研究 p 2 p 就是充分利用这些闲置资源的技术。p 2 p 网络中的各个节点相互服务,每 个节点既具有s e r v e r 的功能提供服务,又可扮演c l i e n t 的角色享受服务,同时还具 有路由器的功能在应用层上转发消息。它打破了传统共享模式,消除了服务器和客 户机的区别,系统中每个节点具有平等的地位,共同分担负载,极大地提高了系统 资源的利用率,使互联网重返“非中心化”的边缘模式,恢复了互联网的本质特征。 自从n a p s t e r t l 4 l 文件共享系统流行以来,p 2 p 技术在分布计算、协同工作、文件 共享、搜索引擎等领域等都有很好的应用前景。p 2 p 技术成为人们关注的焦点。 1 2 国内外研究现状 欧美等西方国家对p 2 p 技术的研究势头强劲,国内研究工作处于跟进阶段。国 外开展p 2 p 技术研究的组织和机构主要包括大学、r r 公司和国际学术团体。大学侧 重于p 2 p 领域的理论研究,高新技术公司侧重于p 2 p 技术的应用开发和产品化,而 国际学术团体主要从事p 2 p 标准化工作。国外开展p 2 p 研究较为著名的大学和科研 机构主要包括u cb e r k e l e y , m i t 和a t & t 互联网研究中心。 在u cb e r k e l e y 大学,t a p e s t r y t l l l 项目和o c e a n s t o r e 嘲项目是p 2 p 技术相关项目。 t a p e s t r y 提供了一个分布式容错查找和路由基础平台。o c e a n s t o r e 是以t a p e s t r y 为 平台的适合于全球数据存储的p 2 p 应用系统。p a s t r y t a 是微软研究院和r i c e 大学在 2 0 0 1 年提出的提出的完全分布式的、可扩展的、自组织的对象定位和路由算法,可 用于构建大规模的p 2 p 系统。目前m i c r o s o f t 公司已经发布了基于p a s t r y 的软件包 s i m p a s t r y v i s p a s t r y 。r i c e 大学也在p a s t r y 的基础之上发布了f r e e p a s t r y 软件包。在 m r r , 开展了多个与p 2 p 相关的研究项目:c h o r d t g l 和r o n t s l 。c h o r d 项目的目标是提 供一个适合于p 2 p 环境的分布式资源发现服务。r o n 项目提出了在分布式广域网 中实施查找资源的系统框架。a t & t 的c a n t 加1 项目独特之处在于采用多维标识符空 间来实现分布式哈希算法。2 0 0 2 年i n t e l 发布了n e t 基础架构之上的a c c e l e r a t o rk i t ( p 2 p 加速工具包) 和p 2 p 安全a p i 软件包,从而使得微软n e t 开发人员能够迅速地 建立p 2 p 安全w e b 应用程序。s u n 公司以j a v a 技术为背景,开展了j x t a t 6 1 项目。 j x t a 是基于j a v a 的开源p 2 p 平台。j x t a 定义了一组核心业务和可选服务,在这 些服务的基础上,用户可以开发各种j x t a 平台上的p 2 p 应用。 国外开展p 2 p 研究的学术团体主要包括p 2 p 工作组( p e e r t o p e e rw o r k i n gg r o u p , p 2 p w g ) 、全球网格论坛( g l o b a lg r i df o r u m ,g g f ) 。p 2 p 工作组成立的主要目的是希 望加速p 2 p 计算基础设施的建立和推进p 2 p 标准化工作,但是在标准化方面工作却 兰州大学硕士学位论文基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 进展缓慢。 从目前国内研究现状来看,国内关于p 2 p 的研究仅处于起步阶段。m a z e 是北 京大学网络实验室开发的一个中心控制与对等连接相融合的对等计算文件共享系 统。g r a n a r v 阴是清华大学自主开发的对等计算存储服务系统。它以对象格式存储数 据。a n v s e e 嘲是华中科技大学设计研发的视频直播系统,它利用近播原则、分域调 度的思想,使用l a n d m a r k 路标算法直接建树的方式构建应用层上的组播树。目前 我国基于p 2 p 技术的产品还有很多,以q q ,p p l i v e ,k u g o o 等为代表的p 2 p 产品 在短短几年时间,用户的注册量不断增长,已成为许多网民不能离开的上网工具。 1 3 研究内容及研究意义 p 2 p 系统的路由性能往往直接关系到系统的性能。基于洪泛的纯分布式非结构 化p 2 p 网络具有吞噬大量带宽的缺点;基于集中索引或超级节点的非结构化p 2 p 网 络存在单点故障的不足;结构化p 2 p 网络主要采用分布式哈希表( d i s t r i b u t e dh a s h t a b l e ,d h t ) 的方式形成逻辑覆盖网络,有很多经典的路由算法,如文献【4 ,9 ,1 0 ,1 1 】 都基于这种方法。而d h t 类结构最大的问题是物理网络和逻辑覆盖网络的拓扑失 配问题。 本文在通过分析4 种具有代表性的p 2 p 网络模型的基础上,总结它们的优缺点, 最后提出了一个改进的基于物理拓扑的复合c h o r d - - p t c c 模型,旨在解决物理网 络和逻辑覆盖网络拓扑失配的问题,同时也希望能解决由于资源拥有节点或索引节 点失效而导致的资源不可用的问题和由于热点问题引起的资源拥有节点或索引节 点的负载失衡的问题。 1 4 本文工作及组织结构 本文主要做了一下工作: 1 概述p 2 p 网络的基本概念、特点、体系结构以及主要的应用领域,分析了 目前主要的p 2 p 协议的实现原理,并指出各自的优缺点。 2 提出了基于物理拓扑的复合c h o r d 模型- - p t c c ,该模型不但继承了c h o r d 在可扩展性和鲁棒性等方面的优点,同时考虑到了节点的物理网络和逻辑覆盖网络 拓扑失配的问题。使用具有未来必然趋势的i p v 6 协议作为网络层协议,利用分段哈 希节点i p v 6 地址的前缀和后缀的方式构造节点的标识符,使得节点标识符携带了节 点位置信息。这样,具有相同标识符前缀的节点位于同一局域环,达到物理距离近 3 兰州人学硕士学位论文基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 的节点逻辑距离也相对较近。 3 p t c c 模型采用哈希多关键词的方法构造资源的多个标识符,然后将每个标 识符同时发布到本地环和外地环中的索引节点上。当其它节点拥有此资源时也再次 发布。这样资源将有多个拥有节点和索引节点,增强了资源的可用性。采用这种方 法不但解决了由于资源拥有节点或索引节点失效而导致的资源不可用的问题,同时 也解决了由于热点现象引起的资源拥有节点或索引节点的负载失衡的问题。 本文的组织结构如下所示: 第一章,绪论。介绍论文方向的研究背景、研究现状、研究内容和意义。 第二章,p 2 p 网络概述。介绍p 2 p 网络的发展历程、概念、特点和应用。 第三章,p 2 p 网络的典范与c h o r d 算法分析。本章分析了基于集中索引的非结 构化网络的代表- - n a p s t e r 、基于泛洪算法的非结构化网络的代表- - g n u t e l l a 、基于 超级节点的非结构化网络的代表- - k a z z a 和基于分布式哈希表的结构化网络的代表 一c h o r d 。 第四章,基于物理拓扑的复合c h o r d 模型。提出了该模型的设计思想和总体结 构,详细介绍了节点标识符和资源标识符的构造、节点的数据结构、资源发布和查 找、节点的加入退出和状态的维护。 第五章,模型仿真。使用m r r 开发的p 2 p s i m 模拟器做了模型仿真,通过性能 比较表明,p t c c 模型比c h o r d 性能更好。 第六章,结论与展望。总结了论文的实际工作,提出了将要继续开展的工作。 4 兰州大学硕j :学位论文基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 第二章p 2 p 网络概述 本章分析了p 2 p 思想在整个互联网历程中的发展情况,总结了p 2 p 网络的本质 特点和应用领域。 2 1p 2 p 网络的定义 p 2 p 的英文全称是“p e e r - t o p e e r ”,其中p e e r 在英语里有“对等、同等者、伙 伴 等的意思,p 2 p 可以理解为“端对端,点对点 的意思,通常译为对等网络技 术。p 2 p 网络中每个节点的地位都是相同的,每个节点既充当服务器,为其他节点 提供服务,同时也充当客户机,享用其他节点提供的服务,打破了传统的c s 模式。 对等网络目前还没有统一的定义。o r a m 曾经给p 2 p 网络下了一个简单的定义: p 2 p 是利用i n t e r n e t 网络边缘可用的存储空间、c p u 计算能力、信息内容以及人力 等资源组织而形成的一种网络应用。这个定义以资源整合为主要内容,基本上概括 了现有互联网上p 2 p 应用的基本特征【l l 。 本文认为p 2 p 网络是以互联网用户为主体,进行资源共享、协同合作的网络应 用,它能够有效地组织、定位和利用互联网络( 包括核心网络和边缘网络) 中任何可 用的存储空间、计算能力、信息以及人力等资源完成特定的任务。 2 2p 2 p 网络的发展历史 1 p 2 p 思想的起源:互联网初创 信息在人类社会诞生之初就在不断的传递和交换过程中服务于人类。随着科学 技术的不断进步和互联网的不断发展,信息交换和传递最加快捷方便。 a r p a n e t 标志着互联网的诞生。每个人员、机构都平等地接入到网络中,贡 献他们的知识、智慧和信息资源,同时也获取其他人员、机构提供的资源。 1 9 7 1 年,第一个互联网应用一电子邮件系统一被发明。每人都是电子邮件的制 造、发送者,同时又是接收、消费者。用户之间都是对等的通信者。时至今日,这 种通信方式仍广泛应用于互联网,并具有旺盛的生命力。 在p 协议出现之前,各研究机构纷纷开发着自己的网络技术,导致当时的网络 技术种类繁多、彼此独立、无法互联。1 9 8 2 年,t c p i p 协议族的的出现统一了各 种已有的网络技术,所有网络在装载了该协议之后都可以无缝地接入互联网,共享 或获取丰富的信息资源。现代意义上的互联网真正诞生了。每一个接入的网络自身 具有丰富的信息资源及一定的用户,他们在互联网中既充当资源的提供者有扮演这 5 兰州大学硕上学位论文基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 资源的消费者,每一个都具有这样的双重角色,彼此之间关系对等,没有主从关系, 也不是c s 模式。 当时,互联网上的杀手锏应用主要有f r et e l n e t 等,它们采用客户端服务器端 模式。但从整体使用来看,它们呈现出对称模式。每一台主机可以同时充当客户、 服务器双重角色,用户间对等地提供资源共享和下载共享资源。这些应用都具有突 出的对等思想,形成一个个逻辑上独立的对等网络。 由此可以看出,早期的互联网无论从它设计之初的目的和思想,还是从它的参 与用户的行为,以及广泛被使用的应用和技术架构,都说明互联网只是信息传输的 媒质,它仍然没有根本性地改变人与人之间的社会关系模式。人仍然是主体,他不 断提供服务同时也享受服务。互联网从它瓜熟落地、嗷嗷出世之时就继承了社会关 系中人与人之间对等的特征,是一个p 2 p 网络。 2 p 2 p 模式的低谷:c s 模式兴起 八十年代末、九十年代初,越来越多的用户接入使互联网空前的繁荣壮大。并 成了用户获取信息资源的重要场所,网上的信息内容呈爆炸式增长,获取信息的速 度和便捷程度前所未有,互联网的商业化浪潮来临。 s e r v e r c l i e n t 图2 - 1c s 模型结构示意图 w e b 技术的出现不仅吸引了大量的用户,这其中的商机也强烈地吸引着许多企 业。于是,整合了各种信息资源的公司企业出现在互联网上,给普通网络用户提供 各种服务。到1 9 9 5 年,w e b 网络业务流量己经成为互联网中流量最大的网络应用。 w e b 技术的设计及使用完全基于c s 模式,如图2 - 1 所示。互联网向c s 模式的转 6 兰州大学硕上学位论文基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 变,加速了用户之间对等传递和交换信息的模式的改变,造成了用户角色的不对称。 普通用户成为互联网上单一的信息消费者,那些建立了网站的组织则成为单一的信 息发布者。 c s 模式造成的信息资源单向流动使得从客户端流向服务器的数据流量远远小 于反向的数据流量,因此出现了a d s l , c a b l em o d e m 等非对称接入技术。再加上防 火墙、n a t 等技术的应用,这些都严重阻碍了数据的对称双向流动,在很大程度上 限制了p 2 p 网络应用的设计、开发和普及。 3 p 2 p 技术及其应用的崛起 现在,人们已经意识到闲置在网络边缘的各种资源所潜藏的巨大能量,如果将 这些零散的资源加以整合并有效利用,不仅可以更高效地解决很多难题,还可以克 服c s 等集中模式所固有的高成本、容错性差等缺点。 1 9 9 9 年问世的n a p s t e r 在不到半年的时间就吸引了几于万的用户,占据了绝大 多数的网络流量。n a p s t e r 提供音乐文件共享、实时通信、聊天室等功能。每个用户 都是这个系统的主人,再次平等地充当信息的制造者和消费者双重角色。 随之而来的f r e e n e t ,g n u t e l l a ,e d u l e ,b i t t o r r e n t 等类似的文件共享系统,它 们提供给普通网络用户一个共享文件资源的平台。s e t i h o m e 等项目利用网络中 空闲的计算资源进行协同计算,大大提高计算能力,并节省了成本。i c q 等即时通 讯软件系统给普通用户提供了相互之间通信、聊天、交换信息的平台。 图2 - 2 p 2 p 网络结构示意图 p 2 p 技术及其应用的兴起让互联网重新回归本质:每个用户都是网络的主体, 7 兰州火学硕二i :学位论文基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 无论个体之间的能力差异如何,他们在互联网上有着同等地位,相互之间对等地共 享各种资源,在提供服务的同时也享受服务。如图2 2 所示。 现在的互联网,p 2 p 技术已经无孔不入、无处不在。许多i s p 报告他们的网络 流量中有大约超过5 0 的流量属于p 2 p 流量 1 2 1 。根据中国互联网络信息中心最新统 计数据显示,到2 0 0 5 年4 月底我国网民人数已经突破1 亿,仅次于美国居世界第 二位。如此大的用户数量,蕴藏着无限商机的同时,也潜藏着无穷的生产能量。 目前,随着博客( b l o g ,包含文字、声音、图像、视频) 等新一代互联网应用的 出现,给用户提供了一个展现自我、主动参与网络的个性化、社会化、自组织的平 台,用户的网络主体地位被更突出的强调,用户之间的联系更加紧密,也更加方便, 更利于用户之间的合作。这种原始的p 2 p 思想必将带来互联网能量的新一轮爆发, 互联网将更加繁荣,并日益被更加依赖。 2 3p 2 p 网络的特点 p 2 p 网络自从出现之后就广受关注,归根结底是因为p 2 p 技术的具有以下特点: 1 非中心化:网络中的资源和服务分散在所有节点上,信息的传输和服务的实 现都直接在节点之间进行,可以无需中间环节和服务器的介入,避免了可能的瓶颈。 p 2 p 非中心化的基本特点,决定了其在可扩展性、健壮性等方面的优势。 2 可扩展性:在p 2 p 网络中,随着用户的加入,不仅服务的要求增加了,系统 整体的资源和服务能力也在同步地扩充,始终能较容易地满足用户的需要。整个系 统是分布的,不存在瓶颈,理论上可以实现无限的系统可扩展性。 3 健壮性:由于服务是分散在各个节点之间进行的,部分节点的失效或受到攻 击对其他部分的影响很小,另外,p 2 p 网络在部分节点失效时能够自动调整整体拓 扑,保持其他节点的连通性。所以p 2 p 网络具有耐攻击、高容错的优点。 4 高性能价格比:采用p 2 p 可以有效地利用互联网边缘的大量普通节点中闲置 的计算资源或存储资源,以更低的成本提供更高的性能。 5 隐私保护:在p 2 p 网络中,所有节点都可以提供中继转发的功能,使得信息 的传输分散在各节点之间进行,无需经过某个集中环节,用户的隐私信息被窃听和 泄漏的可能性大大缩小,为用户提供更好的隐私保护。 6 负载均衡:p 2 p 网络中每个节点既是服务器又是客户机,消除了传统模式中 对服务器性能的依赖,同时因为资源分布在多个节点,更好的实现了整个网络的负 载均衡。p 2 p 应用可以根据所需策略进行灵活地发布信息。 8 兰州大学硕t 学位论文 基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 7 信息资源更丰富:任何p 2 p 节点能够发现活动节点并搜索所需的信息,然后 直接与目标节点通讯。每个节点都可以将其拥有的资源共享出来,请求率高的资源 能够很快地在系统中扩散开来,这样p 2 p 系统能够很快积累相当丰富的信息。 8 有效的搜索:w e b 搜索引擎只是从开放的服务器处得到巨大的搜索结果,并 且不会随着网络状态动态更新。而在p 2 p 系统中只有当节点在线时节点的信息才被 加入路由表,因此路由表与网络状态同步,这种动态性保证了查询的有效性。 2 4p 2 p 网络的应用领域 p 2 p 技术以其无可比拟的优势和广阔的应用前景,给互联网的分布、共享精神 带来了无限的遐想,有观点认为至少有1 0 0 种应用能被开发出来。随着国内外对p 2 p 技术的深入研究和不断实践,p 2 p 技术正不断应用到文件共享、分布式计算、协同 工作、即时通讯、网络游戏、信息检索等方面,其中文件共享应用最为广泛1 3 】。 1 文件共享 文件共享是p 2 p 最为典型的应用。传统的文件共享模式主要通过w e b 技术实 现,需要服务器对大量用户的访问提供有效的服务,对服务器的性能有极高的要求, 服务器往往成为系统的性能瓶颈。基于p 2 p 技术的文件共享系统将共享信息文件存 储在网络边缘节点上,节点之间可以直接共享和传输文件而不需要通过中央服务 器。这样不仅节约了资源,还提高了系统的可扩展性、鲁棒性。 第一个p 2 p 应用是1 9 9 9 年f a r m 开发的文件共享系统n a p s t e r 1 4 1 ,它在发布不 久便拥有了几百万用户,取得了极大的成功。此后g n u t e l l a 1 5 1 ,k a z a a 1 6 1 ,b i t t o r r e n t 等p 2 p 文件共享系统不断涌现。用户数量的持续增长和应用的迫切需求使得文件共 享成为当前p 2 p 系统中最主流的应用。 文件共享的应用很快延伸到了信息共享。例如在线拍卖使人们不必到拍卖网站 上登记要卖的商品了,在自家的硬盘上建个商店就可以了。基于p 2 p 的w e b 缓存 系统也得到了广泛的研究1 7 1 ,局域网内所有个人计算机能够共享本地缓存,所有查 询无需通过代理服务器发送到远程的服务器。 2 科学计算与协作 在现代科学研究中,高能物理、天文、生物信息等许多重大科学领域正面临着 巨大的挑战。这些领域的数据计算和存储要用p e t a 数量级来衡量,使用超级计算机 不仅价格昂贵,还难以满足需求。p 2 p 技术可以充分利用网络中所蕴含的海量的闲 置资源来完成这些任务。 9 兰州大学硕士学位论文基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 1 9 9 9 年开始的s e t l h o m e t 堋项目致力于通过分析射电望远镜采集的无线电信 号,试图搜寻外太空生命,到现在已经得到5 , 0 0 0 ,0 0 0 以上用户的支持2 0 0 0 年斯坦 福大学开发的f o l d i n g h o m e ( 1 9 1 i 页, 目致力于研究蛋白质折叠、误折、聚合及由此引 起的相关疾病,到目前己经吸引了4 0 0 ,0 0 0 个用户加入。2 0 0 3 年o l s o n 实验室主持 的研究艾滋病的项目f i g h t a i d s h o m e 2 0 j 也吸引到了9 , 0 2 0 个用户。 3 数据存储 当今社会处于一个信息爆炸的时代,需要大量的存储空间来存储信息。p 2 p 技 术允许数据分散存放在多个p 2 p 节点上,而不是存放于专用服务器。 伯克利大学丌发的分布式海量存储系统o c e a n s t o r e t 2 1 1 采用t a p e s t r y t l l l 技术,提 供了全球范围内的一致性数据存储。m i t 研究的c f s 项目采用c h o r d t g l 技术,提供 了一致性的分布协同文件存储。r i c e 大学和微软公司联合研究的p a s t 项目采用 p a s t r y f 3 啦技术,提供了大规模的、可扩展的、协同的分布文件存储服务。清华大学 开发的基于p 2 p 技术的分布式广域网存储系统g r a n a r y m ,能提供面向对象的数据 存储和管理,具有更好的数据访问模式和更强的查询处理能力。 4 搜索引擎 p 2 p 技术的另一个优势是可开发出强大的搜索工具,使用户能够深度搜索文档, 达到传统搜索引擎( 只能搜索到达2 0 3 0 的网络资源) 无可比拟的深度( 理论上将 包括网络上的所有开放的信息资源) ,采用的分布式结构避免了单点失效,充分利用 了网络边缘的空闲资源,且不必专门建立强大的服务器系统。 比如由d i g i t a l 公司开发的全新搜索引擎p a n d a n g o 采用p 2 p 搜索理念来对互联 网络进行全位的搜索将搜索引擎技术升到一个新的层次。2 0 0 1 年s u n 公司开发的 p 2 p 分布式搜索引擎j x t as e a r c h t 2 2 1 可以基于元数据集合进行分布式搜索,能有效 地跟踪数据的更新、提高搜索的有效性以及检索的效率。s u e l 等人讨论了p 2 p 分布 式搜索引擎的基本设计原则,并设计了一个原型系统o d i s s e a t 2 3 1 ( o p e nd i s t r i b u t e d s e a r c he n g i n ea r c h i t e c t u r e ,o d i s s e a ) 。 5 流媒体视频应用 通过应用层组播来实现大规模流媒体共享。视频组播对带宽要求很高,因此传 统基于服务器客户机模式的视频组播系统往往由于服务器出口带宽的限制而导致 系统的可扩展性差。在基于p 2 p 结构的视频组播系统中,只有少数节点从服务器直 接获取数据,更多的节点一方面从其它节点处获得数据,一方面也向其它节点提供 1 0 兰州火学硕上学位论文 基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 数据,充分利用了节点之间的可用带宽,使得系统的可扩展性大为提高。整个系统 的体系结构为树状结构或者网状结构。例如华中科技大学基于p 2 p 技术开发的视频 直播系统a n y s e e t s ) ,在2 0 0 4 年奥运会期间向教育网进行了2 0 * 2 4 小时的直播服务, 共有1 0 万人次使用。典型的系统还有p p l i v e 、p p s t r e a m 等。 6 即时通讯 即时消,息( i n s t a n tm e s s a g i n g ,i m ) 是对等网络的重要应用之一,在当前已经得到 相当普遍的应用。与b b s 、w e b 聊天室相比,p 2 p 的即时通讯软件不仅可以随时知 晓对方是否在线,而且交流双方的通讯完全是点对点直接进行,不依赖服务器的性 能和网络带宽。尽管目前的即时通讯技术一般都具有中心服务器,但中心服务器仅 是用来控制用户的认证信息,帮助完成节点之间的初始互联工作。例如y a h o o m e s s a g e r , m s nm e s s e n g e r 以及腾讯q q 等吸引了大量的用户使用,大多采用中心服 务器的方式认证用户的基本信息,用户的帐户、好友列表等都由s e r v e r 集中保存, 节点之间可以直接进行数据通信,也可以经过s e r v e r 转发。 s e r v e r l e s s 型的i m 基本不需要s e r v e r 的支持,只要人们以某种形式形成p 2 p 网 络互联,就可以相互之间识别并通讯,中间过程无需s e r v e r 的介入,比如s k y p e 。 s k y p e 是一个语音实时通信系统,当用户之间需要进行语音通信时,s k y p e 在覆盖 网中找寻出一条当前带宽最大的覆盖网通路,通过多跳转发的方式进行数据传送。 兰州人学硕 j 学位论文基于p 2 p 网络的c h o r d 协议改进模型p t c c 的研究 第三章p 2 p 网络的典范与c h o r d 算法分析 拓扑结构是指网络中各个实体之间的物理或逻辑的互联关系,是确定系统类型 的重要依据。根据拓扑结构的关系可以将p 2 p 研究分为4 种形式【2 4 1 :中心化拓扑 ( c e n t r a l i z e dt o p o l o g y ) ;全分布式非结构化拓手t ( d e c e n t r a l i z e du n s t r u c t u r e dt o p o l o g y ) ; 半分布式拓$ 1 ( p a r t i a l l yd e c e n t r a l i z e dt o p o l o g y ) 和全分布式结构化拓于 ( d e c e n t r a l i z e d s t r u c t u r e dt o p o l o g y ) 。本章详细分析了四种p 2 p 网络拓扑结构的代表性协议,研究 了它们的实现原理以及优缺点,为下一章新模型的提出奠定了坚实的理论基础。 3 1 中心化拓扑的典范:n a p s t e r n a p s t e r t l 4 】是最早出现的p 2 p 音乐文件共享系统,属于中心化p 2 p 网络,是最 为典型的集中目录式对等网络模型。它打破了传统c s 和b s 的资源共享方式,率 先实现了文件查询与文件传输的分离,使得用户之间可以相互直接共享数据,有效 地节省了中央服务器的带宽消耗,减少了系统的文件传输延时,可以说是文件共享 技术领域乃至p 2 p 领域里的一次巨大飞跃。 n a p s t e r 文件共享系统的工作原理如图3 - 1 所示。它由一群高性能的中央服务器 保存着网络中所有节点共享资源的目录信息。当需要查询某个文件时,节点会向中 央服务器发出文件定位请求。中央服务器进行相应的检索和查询后,会返回符合条 件的节点地址信息列表。接收到应答后,节点会根据网络流量和延迟等信息进行选 择,与合适的节点建立连接,并开始文件传输。 :s e t v e q :p e e r r :r e s p o n s e q :q u e r y d :f i l ed o w n l o a d 图3 - 1n a p s t e r 工作原理图 由于n a p s t e 采用了中心化的目录服务器,所以查找算法灵活高效并能够实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论