已阅读5页,还剩57页未读, 继续免费阅读
(信息与通信工程专业论文)bittorrent类型p2p文件共享系统的建模及性能分析研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
南京邮 也人学顾 j 学位论义 摘要 摘要 随着因特网( i n t e m e t ) 技术同新月异的发展,一系列具有创造性的分布式应用成果相 继出现。对等网( p e e r - t o p e e r ,简称p 2 p ) 作为以文件共享为初始目的的应用网络,允许 任意终端用户对等体( p e e r ) 之间通过i n t e m e t 完成文件交换。虽然p 2 p 技术的发展才经 历了短短的几年时间,但是它已经得到了大量的应用,并占据了半数以上的i n t e m e t 流量, 与之相关的研究工作也得到了学术界的广泛关注。b i t t o r r e n t 是当今非常流行的基于p 2 p 技术的文件共享系统之一,通过它能够快速、有效地在i n t e m e t 的网络结点之间共享大的 文件,而不会给某个特定的服务器带来过重的负载,显然对该系统进行性能分析方面的研 究工作具有重要的理论和现实意义。本文的主要内容是对b i t t o r r e n t 类型对等网络系统的 建模研究以及相应的性能分析,全文大致可以分成三个部分。 第一部分( 第l 一3 章) 主要描述了对等网络的基本原理、技术特点、发展过程及拓 扑结构:概述了b i t t o r r e n t 类型p 2 p 文件共享系统的协议、主要算法;介绍了p 2 p 网络的 研究现状和存在的问题。 第二部分( 第4 5 章) 是全文的重点,对于b i t t o r r e n t 类型p 2 p 文件共享系统,本文在 分析其基本原理的基础上,并在一定的假设条件下,对于单片段文件以及多片段文件两种 情形的b t 系统,分别建立了排队模型,根据所建立的模型得到相应的连续参数马氏过程的 q 矩阵,借助于矩阵几何方法对相应的拟生灭( q u a s i b i r t ha n dd e a t h ,简称q b d ) 过程的 平稳分布进行了求解,并进而给出了b i t t o r r e n t 系统性能分析的有关结果。 第三部分( 第6 章) 对全文进行了总结和展望。 关键词 p 2 p ;b i t t o r r e n t :拟生灭过程:m m m p p 1 ;性能分析 南京邮电人学颁i j 学位论义a b s t r a c t a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fi n t e r a c t ,as e r i e so fc r e a t i v ed i s t r i b u t e dn e t w o r ka p p l i c a t i o n h a v eb e e np r o p o s e d p e e r - t o p e e r ( p 2 p ) ,w h o s ep r e l i m i n a r yp u r p o s ei st os h a r ef i l e s ,m a k e s e x c h a n g i n gf i l e sa m o n ge n d u s e rp e e r st h r o u g hi n t e r n e tc o m e st r u e w i t hi t sd r a m a t i c d e v e l o p m e n td u r i n gt h el a s tf e wy e a r s ,p 2 pf i l e s h a r i n gs y s t e m sh a v eo c c u p i e dam a j o r i t yo f i n t e m e tt r a f f i c sa n da t t r a c t e dm u c ha t t e n t i o ni nt h er e s e a r c ha r e a s b a s e do np 2 p p a r a d i g m , b i t t o r r e n t ( b t ) i sav e r yp o p u l a rf i l e s h a r i n gi n s t r u m e n tn o w a d a y s ,t h r o u g hw h i c hl a r g ef i l e s c a nb ed i s t r i b u t e dq u i c k l ya n de f f i c i e n t l yt on e t w o r kn o d e sw i t h o u tb r i n g i n gt o oh e a v yl o a dt o a n yf i x e ds e r v e r t h e r e f o r e ,t h ep e r f o r m a n c ea n a l y s i so ft h eb ts y s t e mh a sg r e a tt h e o r e t i c a la n d p r a c t i c a ls i g n i f i c a n c e t h em a i ns u b j e c to ft h i st h e s i si st om o d e lt h eb i t t o r r e n t l i k ep 2 ps y s t e m a n d c a r r yo u tt h ep e r f o r m a n c ea n a l y s i s t h ew h o l et h e s i si sc o n s i s t i n go ft h r e ep a r t s t h ef i r s tp a r t ( c h a p t e r1t o c h a p t e r3 ) d e s c r i b e st h e b a s i c p r i n c i p l e s ,t e c h n o l o g y c h a r a c t e r i s t i c s ,d e v e l o p m e n tp r o c e s sa n dt o p o l o g yo fp 2 pn e t w o r k ;s u r v e y st h ep r o t o c o l ,t h e m a i na l g o r i t h mo fb i t t o r r e n t - l i k ef i l e - s h a r i n gp 2 ps y s t e m ;i n t r o d u c e st h ec u r r e n tr e s e a r c h s i t u a t i o na n de x i s t i n gp r o b l e m s t h es e c o n dp a r t ( c h a p t e r4a n dc h a p t e r5 ) i st h ef o c u so ft h i st h e s i s b a s e do nt h ea n a l y s i so f t h eb a s i cp r i n c i p l eo fb t - l i k ef i l e - s h a r i n gp 2 ps y s t e ma n du n d e rc e r t a i na s s u m p t i o n s ,t h i sp a r t e s t a b l i s h e st w oq u e u i n gm o d e l sf o rt w ob ts y s t e m sw i t ht h ef i l ec o n s i s t i n go fo n es i n g l e f r a g m e n ta n dm u l t i p l ef r a g m e n t s ,r e s p e c t i v e l y t h e n ,c o n s t i t u t i n gt h ec o r r e s p o n d i n gqm a t r i x a c c o r d i n gt ot h em o d e l ss e tu pa n db yt h ea s s i s t i n go ft h em a t r i x g e o m e t r i ct e c h n i q u ef o rt h e c o r r e s p o n d i n gq u a s i b i r t h a n d d e a t h ( q b d ) p r o c e s s ,t h es t a t i o n a r yd i s t r i b u t i o no ft h em o d e li s g i v e n t h ep e r f o r m a n c em e a s u r e m e n to f t h eb ts y s t e ma r et h e r e f o r eo b t a i n e d t h et h i r dp a r t ( c h a p t e r6 ) c o n c l u d e st h ew h o l et h e s i sa n dp r e s n e t ss o m ef u t u r ew o r k k e yw o r d s p 2 p ;b i t t o r r e n t ;m m m p w l ;q b dp r o c e s s ;p e r f o r m a n c ea n a l y s i s 南京邮电大学学位论文独创性声明 本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成 果。尽我所知,除了文中特别加以标注的地方外,论文中不包含其他人已经发表或撰写过 的研究成果,也不包含为获得南京邮电大学和其它教育机构的学位或证书而使用过的材 料。与我一起工作的同志及对本课题研究所做的任何贡献均已在论文中作了明确的说明并 表示谢意。 研究生签名:痉叙日期:竺望年生基够 南京邮电大学学位论文使用授权声明 南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交的学位论 文复印件和电子文档,可以采用影印、缩印或其它复制手段保存论文。本人电子文档的内 容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以 公布( 包括刊登) 论文的全部内容或部分内容。论文的公布( 包括刊登) 授权南京邮电大 学研究生部办理。 研究生躲投导师躲建煎竺生! 隅砑:丝幺 南京邮也人学颀j j 学位论文第一章绪论 1 1 对等网络概述 第一章绪论 近年来,对等( p e e r - t o p e e r ,简称p 2 p ) 网络迅速成为计算机界关注的焦点,该网络 中的关键技术,即p 2 p 技术,已经被看作是影响因特网( i n t e r n e t ) 未来的重要科学技术 之一。目前p 2 p 技术在文件共享、分布式计算、基于i n t e r n e t 通信等多个领域中的应用已 经取得了很大的成功。p 2 p 系统由于方便、快捷和开销少的特点受到了数以千万计的网络 用户的欢迎。根据几大网络运营商统计,p 2 p 应用占据了i n t e r n e t 整个流量的6 0 一8 0 2 6 】。 而p 2 p 的各种应用提供的实时通讯技术也在逐步取代传统的通讯服务,从而引发了电信 服务商、电信设备商和网络营运商的新一轮的业务整合。 p 2 p 技术不但在产业界迅速发展,在学术界也同样受到科研工作者的高度关注。p 2 p 技术的研究工作已经在全球很多知名科研机构中迅速展开。自2 0 0 0 年起,在系统结构和 分布式计算方向的国际项级学术会议上不断出现关于p 2 p 技术的重要研究成果。值得一 提的是,学术界还专门举办了针对p 2 p 技术的学术会议i p t p s ,其已经成为影响p 2 p 技 术研究方向的风向标。 p 2 p 技术揭开了i n t e m e t 发展的新时代的序幕,为i n t e m e t 带来了新的生命力,是构 建智慧化、个性化的i n t e m e t 的丌端。因此,研究p 2 p 技术、构造p 2 p 应用、以及提升 p 2 p 系统的性能,已经成为网络技术研究的一个重要课题。 当前的互联网是以服务器客户机( s e r v e r c l i e n t ,简写为c s ) 结构的应用模式为主 的,这样的应用模式要求在网络内设置一台服务器,信息通过服务器才可以传递。信息或 是先集中上传到服务器保存,然后再分别下载( 如网站) ,或是按服务器上专有规则( 软件) 处理后才可在网络上传递流动( 如邮件) 。但是如果利用p 2 p 系统软件,普通的个人计算 机就可以不通过服务器而直接与另一台拥有同样p 2 p 系统软件的个人计算机形成互联, 双方共享资源,协同完成某种行动。而捌有同一p 2 p 软件的设备或用户,可以形成一个为 其自己所有的在互联网上的p 2 p 专用网。 p 2 p 技术的主要特征就是弱化了服务器的作用,甚至取消服务器。它的核心思想是, 所有参与系统的结点处于完全对等的地位,没有客户机和服务器之分,也可以说每个结点 既是客户机,也是服务器;既向别人提供服务,也享受来自别人的服务。p 2 p 运算带来的 好处首先是经济性:不需要功能强大的服务器进行集中的运算,而是把闲置的运算能力加 1 南京邮电大学硕j j 学位论义第一章绪论 以利用:另一个好处就是小区性:可以组建一个专门的环境,在这个坏境内不仅可以共享 资源、共同合作,而且安全性好、效率高。 由于p 2 p 技术具有无可比拟的优势,因此p 2 p 技术具有广阔的应用前景。近年来, 随着p 2 p 技术研究的深入和业界的实践,p 2 p 计算技术正不断应用到军事、商业、政府信 息、通讯等领域。目前,对等网络主要应用范围包括:文件共享、协同工作、对等计算、 广域网分布式存储共享、实时通信等。 1 2 文件共享类型对等网络 文件共享是p 2 p 技术最广泛的一个应用,它的特点是那些作为客户机下载共享文件的 结点,随后会成为服务器去为其它结点服务。 1 9 9 9 年诞生的文件共享系统n a p s t e r 4 ,是最早的p 2 p 实用系统,它提供给用户在互 联网上共享m p 3 ( m p e ga u d i o l a y e r3 的简写) 音乐文件的p 2 p 应用。n a p s t e r 通过p 2 p 技术成功解决了w e b 服务器的瓶颈问题。参与系统的是大量个人计算机用户,每个用户 将自己愿意共享的文件提供出来,同时可以下载其它用户共享的文件。n a p s t e r 目录服务 器只提供索引服务,而文件存储和下载服务在n a p s t e r 用户之间进行,因此它支持上万结 点同时在线。n a p s t e r 在发布后迅速流行起来,很快成为增长最快的网络应用系统。 n a p s t e r 第一次验证了p 2 p 思想在广域网范围内的可行性。此后,更多的p 2 p 文件共 享系统不断地出现,其中最著名的是g n u t e l l a l 4 。g n u t e l l a 对n a s p t e r 的体系结构进行了 彻底的改变,不再使用中心目录服务器,转而将n a p s t e r 提供的文件索引功能的目录服务 器分布到所有参与结点中,通过由所有参与结点构造的g n u t e l l a 覆盖网来进行文件检索, 实现了全对等结构。这种不具备中心服务器的结构具有很高的可扩展性,系统不再有中心 结点成为瓶颈,可以扩展到上百万甚至上千万结点的规模。并且,由于不存在易受攻击的 关键结点,系统的鲁棒性也得到了提高。k a z a a 、f a s t t r a c k 软件对g n u t e l l a 做了进一步 的改进【2 2 ,3 6 1 。它们采用了层次的结构,将系统中的结点分成两种:强结点和弱结点。会 话时间长的结点为强结点;反之,为弱结点。强结点之间构造类似于g n u t e l l a 的覆盖网, 而弱结点只连接到一个或几个强结点,并把自己的元资料( 即共享文件的列表) 发送给强 结点,文件搜索只在强结点上进行。这样,k a z a a 、f a s t t r a c k 获得了比g n u t e l l a 更高的 稳定性和搜索效率。 p 2 p 文件共享系统的成功促使人们致力于在更多方面丌拓p 2 p 结构的应用,其中大文 件分发系统是最为成功的应用,例如b i t t o r r e n t l 5 1 l ( 又称为比特流下载或变态下载,简称 2 南京邮f 乜人学倾f j 学位论义 第一章绪论 b t ) 、e d o n k e y e m u l e ( 又称为电驴【5 2 1 ) 。b i t t o r r e n t 试图充分利用下载用户之i 日j 的带宽 进行数据传输,从而减轻服务器负担,提高下载速度和系统的可扩展性( 指同时下载人数) 。 b i t t o r r e n t 的基本策略是:一个文件被分为很多小的文件块,每个用户可以同时并行地下 载多个文件块。一个用户只要有一个文件块就可以给其它用户提供服务,而不需要等下载 完成整个共享文件之后。也就是说,每个用户下载一部分不同的数据,用户之间互相交换 对方没有的数据,最终使所有用户都获得全部数据。b i t t o r r e n t 在推出之后迅速流行,由 于越来越多的人使用b i t t o r r e n t 进行数据下载,很快使得b i t t o r r e n t 系统成为占据3 5 以 上i n t e r n e t 网络流量的首要应用【7 12 1 。e d o n k e y e m u l e 采用了和b i t t o r r e n t 相似的工作原理。 在当今i n t e r n e t 中,由于对网络服务能力的需求不断地增长,有效地利用网络的资源就变 得越来越重要。比起传统的服务器客户机存储和传输信息文件模式,p 2 p 文件共享系统 有以下两个主要优势: ( 1 ) 负载均衡:需求服务可以向那些已经接受和复制了文件的网络结点获得。p 2 p 文件共享系统有效地减轻了源服务器的负载,提高系统的稳定性。 ( 2 ) 服务资源的共享:当一个用户加入系统请求服务后,它也会贡献自己的服务资 源( 尤其是网络带宽) 给系统。因此,系统的服务能力会随着需求的增长而增加。 目前,实现p 2 p 文件共享系统,需要关注以下的问题: 信息定位:它给系统用户提供了基本共享资源信息,例如哪个结点和哪个资源在网络 中是可获得的,以便结点可以直接联系其它系统结点询问所需资源。 文件传输:指p 2 p 结点之间如何传输、分布和复制共享文件。在i n t e m e t 中,主要的 传输方式有单对单传输、多对单传输、多对多传输。例如b i t t o r r e n t 系统将一个大的文件 分割成多个文件块,结点可以同时从多个结点下载不同的文件块,同时将自己的文件块上 载给不同的结点,实现了多对多的传输方式。 协作与激励:协作是指p 2 p 文件共享系统中结点之间建立相互协作的关系去完成任 务,而不需要通过中心服务器去收集和转播信息,从而实现资源共享。激励则是鼓励用户 多贡献自己的资源,阻止搭便车( f r e e r i d i n g ) 行为,提高系统的公正性。例如b i t t o r r e n t 系统通过“t i t f o r - t a t 策略激励用户贡献资源,而e d o n k e y 根据结点的历史资源贡献记录 来确定目f j i f 所享用的资源。 覆盖网拓扑结构:在p 2 p 文件共享系统中,结点数量巨大并且分布非常广泛,不可 能使用全连接的拓扑结构。此外结点的异构性很强,参与结点在存储能力、计算能力和带 宽能力上都有着很大差异。p 2 p 系统需要将大量节点组成有序的结构,有效地将所有结点 的可用资源都充分利用起来去提高系统各方面性能i 3 南京邮电人学硕 :学位论文第一章绪论 分布和下载性能:文件分布和下载性能是指文件大小和下载此文件所用的时i b j 两者之 间的关系。目前很多共享文件都是大文件,例如大多数多媒体文件,系统是否能很好地支 持大规模的下载结点同时下载共享文件、系统中各项指标对整体性能的影响是p 2 p 文件共 享系统必须仔细研究的问题。 1 3 本文研究的目标和主要内容 本章前两节简单介绍了p 2 p 网络和文件共享类型p 2 p 网络的基本知识,其中 b i t t o r r e n t 是当今i n t e r n e t 上最为流行的新一代p 2 p 文件共享系统,它是典型的基于p 2 p 技术的文件共享工具,在实际应用和学术研究中都吸引了人们大量的关注。 2 0 0 3 年,c o h e nb 首次在p 2 pe c o n o m i c sw o r k s h o p 上提出b i t t o r r e n t 系统【8 1 ,该系统 就引起了人们广泛的关注。2 0 0 4 年,y a n gx 和v e c i a n ag 在i n f o c o m 、q i ud 和s f i k a n t r 在s i g c o m m 、和2 0 0 5 年,p o u w e l s ej a 和g a r b a c k ip 在i p t p s 上分别发表了针对 b i t t o r r e n t 系统的研究成果【5 0 ,3 8 , 3 7 1 ,迅速将b i t t o r r e n t 系统的研究推向了一个高潮。近年 国际会议例如i n f o c o m 、i p t p s 、i c d c s 和i w q o s 等,不断出现关于b i t t o r r e n t 系统的 重要研究成果。很多在真实环境或模拟环境下的测量研究b i t t o r r e n t 网络的能1 3 7 , 2 0 1 ,这 些研究发现b i t t o r r e n t 系统有非常好的性能支持大规模的下载结点同时下载共享文件。文 献【5 0 】提出了一个b i t t o r r e n t 系统的数学模型去分析b i t t o r r e n t 系统的文件分布能力和服 务性能。文献【3 8 】通过建立一个流体模型研究了b i t t o r r e n t 系统在稳定状态的性能。这些 研究成果从不同的角度分析和研究了b i t t o r r e n t 系统的性能、机制和策略。 本文根据b i t t o r r e n t 类型p 2 p 文件共享系统的基本原理,利用随机过程中的拟生灭过 程,按照不同的假设条件建立b i t t o r r e n t 类型p 2 p 文件共享系统的单片段系统模型和多片 段系统模型,根据所建立的模型得到相应的连续参数马尔可夫链的q 矩阵,并通过对q 矩阵平稳分布等的求解,获得性能分析的直接条件,进而给出了b t 系统性能分析的有关 结果。 1 4 本文的结构和安排 论文的章节组织如下: 第一章主要概述了p 2 p 网络和文件共享类型p 2 p 系统的基本原理、发展过程、特点 及b i t t o r r e n t 类型文件共享系统的研究现状,并给出本文的研究内容和文章组织结构。 第二章详细介绍p 2 p 网络的定义、技术特点、p 2 p 系统的网络拓扑结构模型、p 2 p 协 4 南京邮电人学硕i :学位论义 第一章绪论 议和软件,以及p 2 p 网络的研究现状及问题。 第三章概述b i t t o r r e n t 类型p 2 p 文件共享系统,包括b i t t o r r e n t 协议、客户端和t r a c k e r 服务器的功能、b i t t o r r e n t 的主要算法等。并引出本文的研究内容。 第四章是本文的核心章节,在第二、三章的基础上,对b i t t o r r e n t 类型p 2 p 系统建立 相应的数学模型并给出对应的q 矩阵。 第五章则对第四章的模型进行研究,借鉴前人的方法,计算出模型的平稳分布,根 据模型中参数的物理意义,求出b i t t o r r e n t 类型p 2 p 文件共享系统的下载者在系统中的平 均逗留时间等,并全面精细的分析系统中的各个参数对系统性能的影响。 第六章对全文进行归纳总结,并给出下一步的工作展望。 南京邮r 乜人学硕i j 学位论义第二章p 2 p 系统概述 2 1p 2 p 简介 第二章p 2 p 系统概述 p 2 p 是p e e r - t o - p e e r 的缩写,p e e r 在英文早是“同等者”、“同事”及“伙伴”的意 思。因此,p 2 p 网络也就称为对等网络。 p 2 p 技术是目前国际计算机网络技术领域研究的一个热点,被财富杂志誉为将改 变互联网未来的四大新技术之一【6 】,目前微软、s u n 、i m b 等很多著名的企业和公司都投 入到对p 2 p 技术的研究之中。 对于p 2 p 的定义,不同的机构有着不同的理解,每种理解方式本质上并不矛盾,都从 不同的侧面揭示了p 2 p 网络的特点,下面列举几个常用的定义供参考。 定义2 1 【5 3 1 p 2 p 是一种通信模型,其中的每个参与者都具有相同的能力,任何一方 都可以发起一次通信会话。与之相对应的模型有c l i e n t s e r v e r 模型和m a s t e r s l a v e 模型。 在一些应用中,丌发者使各个通信节点同时具有服务器和客户端两者的功能,以此实现对 等通信。在i n t e r a c t 上,p 2 p 是一种网络类型,它允许运行相同网络程序的一组计算机用 户相互建立连接,直接访问对方硬盘上的文件。 定义2 2 f 4 8 】p 2 p 是一种利用位于i n t e r a c t 边缘的各种可用资源( 如存储空间、计算 能力、媒体内容) 的应用。访问这些分散的资源,就意味着要在连接不稳定和i p 地址不 可预见的环境罩工作,网络上大量的节点工作在域名系统( d o m a i nn a m es y s t e m ,简写 为d n s ) 之外,这些分散的资源具有不稳定的连通性和未知的网络间互连的协议( i n t e m e t p r o t o c o l ,简写为i p ) 地址,因此p 2 p 节点不能再使用d n s 来进行访问,并且节点从中 央服务器中获得极大的自主权。 定义2 3 t 3 p 2 p 是一种对等网络计算技术,就是利用客户端的处理能力,实现客户 端之间的点到点通信,实现通信与服务端的无关性( 或者说客户端就是服务端) 。它使得网 络上的每个用户直接连接到其它用户的计算机上,而不是连接到服务器上。因为消除了中 间环节,p 2 p 技术使得网络上的沟通变得更容易、更直接。p 2 p 改变了i n t e m e t 现在以大 网站为中心的状态、重返“非中心化”,并把权力交还给用户。 虽然上述定义稍有不同,但共同点都是p 2 p 打破了传统的c s 模式,在网络中的每 个结点的地位都是对等的。每个结点既充当服务器,为其它结点提供服务,同时也享用其 它结点提供的服务。 6 南京邮电大学硕i j 学位论义第一二章p 2 p 系统概述 当前在互联网络中流行的通信模式是c s 服务器模式,在这种模式下要求在网络中必 须配置服务器,以服务器为中心,信息通过服务器进行转发。而在这种中心化网络体系结 构中,随着客户不断的加入,整个网络的不断扩大,每个信息发送都是通过服务器,服务 器的压力就越来越大。在服务器处会产生计算资源瓶颈和带宽瓶颈,服务器的崩溃会造成 整个系统的瘫痪。而这时,在网络中大部分的客户机却处于空闲状态。如何合理利用那些 闲置的资源和其它未用的带宽,同时防止瓶颈问题,p 2 p 计算模式提供了较好的解决办法。 在p 2 p 网络中,每台机器都运行特定的程序来了解、提供信息,并向其相邻的节点请求 数据或服务。邻节点既可以为请求提供服务,也可将请求中转传递给其它邻居。这样,数 据存储、处理能力和带宽等都以一种完全分散、异步的方式运行,各种负载可以得到合理 的分配。 p 2 p 模式是非中心结构的对等模式,p 2 p 模式与c s 模式的区别【蚓为: ( 1 ) 每一个对等点具有相同的地位,既可以请求服务也可以提供服务,同时扮演着 c s 模式中的服务器和客户端两个角色,还可以具有路由器和高速缓冲存储器的功能,从 而弱化了服务器的功能,甚至取消了服务器。 ( 2 ) p 2 p 技术可以使得非互连的网络用户很容易地加入到系统中,每一个对等体可 以充分利用网络上其它对等体的信息资源、处理器周期、高速缓存和磁盘空间:对等体通 常没有固定的i p 地址,并且可常常从网络上断丌,信息的存储及发布具有随意性,缺乏 集中管理。 ( 3 ) p 2 p 是基于内容的寻址方式,内容包括信息、空闲机时、存储空间等。p 2 p 网 络中,用户直接输入要索取的信息的内容,而不是信息的地址,p 2 p 软件将会把用户的请 求翻译成包含此信息的节点的实际地址,这个地址对用户来说是透明的。 p 2 p 模式相对于c s 模式有如下主要优点【2 5 】: ( 1 ) 资源的高度利用率。在p 2 p 网络上,闲散资源有机会得到利用,所有节点的资 源总和构成了整个网络的资源,整个网络可以被用作具有海量存储能力和巨大计算处理能 力的超级计算机。c s 模式下,纵然客户端有大量的闲置资源,也无法被利用。 ( 2 ) 随着节点的增加,c s 模式下,服务器的负载就越来越重,形成了系统的瓶颈, 一旦服务器崩溃,整个网络也随之瘫痪。而在p 2 p 网络中,每个对等体都是一个活动的 参与者,每个对等点都向网络贡献一些资源,如存储空间、中央处理器( c e n t r a lp r o c e s s i n g u n i t ,简称为c p u ) 周期等。所以,对等点越多,网络的性能越好,网络随着规模的增 大而越发稳定。 ( 3 ) 基于内容的寻址方式处于一个更高的语义层次,因为用户在搜索时只需指定具 7 南京邮q 土人学硕i j 学位论文第二章p 2 p 系统概述 有实际意义的信息标识而不是物理位置,每个标识对应包含这类信息的节点的集合。这将 创造一个更加精炼的信息仓库和一个更加统一的资源标识方法。 ( 4 ) 信息在网络设备问直接流动,高速及时,降低中转服务成本。 ( 5 ) c s 模式下的互联网是完全依赖于中心点服务器的,没有服务器,网络就 没有任何意义。而p 2 p 网络中,弱化服务器的功能,甚至取消服务器,任意两台个人电 脑( p e r s o n a lc o m p u t e r ,简写为p c ) 互为服务器及客户机,即使只有一个对等点存在, 网络也是活动的,节点所有者可以随意地将自己的信息发布到网络上。p 2 p 的技术方式将 导致信息数据成本资源向所有用户的p c 均匀分布,即“边缘化”趋势。 但是,p 2 p 也有不足之处。首先,p 2 p 不易于管理,而对c s 网络,只需在中心点进 行管理。随之而来的是p 2 p 网络中数据的安全性难于保证。因此,在安全策略、备份策 略等方面,p 2 p 的实现要复杂一些。另外,由于对等点可以随意地加入或退出网络,会造 成网络带宽和信息存在的不稳定。p 2 p 技术与c s 技术性能比较如下面的表2 1 。 表2 1p 2 p 技术与c s 技术性能比较 性能数据 数据 数掘数据数据 数据数据 数据 成本 管理 互动实时安全覆盖 方便 比较发布 接收 性性性 更新质量 控制 率性 p 2 p 好中好好差好中差好差 c s差好差差 好 差好好差好 2 2p 2 p 系统的网络拓扑结构模型 p 2 p 系统的最大特点就是用户之间直接共享资源,其核心技术就是分布式对象的定位 机制,这也是提高网络可扩展性、解决网络带宽问题的关键所在。迄今为止,p 2 p 网络已 经历了三代不同的网络模型【4 4 1 ,各种模型各有优缺点,有的还存在本身难以克服的缺陷。 因此,在目前p 2 p 技术还远未成熟的阶段,各种网络结构依然能够共存,甚至呈现相互 借鉴的情况。 2 2 1 集中目录式网络模型 集中目录式p 2 p 结构是最早出现的p 2 p 应用模式。由于它仍具有中心化的特点,因 而也被称为非纯粹的p 2 p 结构。它采用星型结构( 见图2 1 ) ,群组中的对等节点都与中 心目录服务器相连,并向其发布共享的文件列表。对等节点可以向中心目录服务器发起文 南京邮电人学颀 学位论文第- 二章p 2 p 系统概述 件检索命令,得到回复后,文件交换即可直接在两个对等节点之问进行。该过程中,目录 服务器负责记载群组所有参加者的信息,以进行适当的管理。 对等1 ,点 对书;耵j 图2 1 集中目录式p 2 p 网络 用于共享m p 3 音乐文件的n a p s t e r 是其中最典型的代表,其用户注册与文件检索工 程类似于传统的c s 模式,区别在于所有数据并非存储在服务器上,而是存储在各个节点 上。查询节点则根据网络流量和延迟等信息选择合适的节点建立直接连接,而不必经过中 央服务器进行。这种网络结构非常简单,但是它显示了p 2 p 系统信息量巨大的优势和吸引 力,同时也揭示了p 2 p 系统本质上所不可避免的两个问题:法律版权和资源浪费问题。 2 2 2 纯p 2 p 网络模型 图2 2 纯p 2 p1 卜结构化拓扑结构 9 南京邮电大学硕士学位论文第_ 二章p 2 p 系统概述 纯p 2 p 模式也被称为广播式p 2 p 模型。它取消了集中的服务器,每个用户随机接入 网络,并与自己相邻的一组节点通过端到端连接,从而构成一个逻辑覆盖的网络。对等节 点之间的内容查询和内容共享都是直接通过相邻的节点广播接力传递,同时每个节点还会 记录搜索轨迹,以防止搜索环路的产生。如图2 2 所示。 2 2 3 混合式网络模型 混合式网络模型在纯p 2 p 分布式模型基础上引入了超级节点的概念,综合了集中式 p 2 p 快速查找和纯p 2 p 去中心化的优势,见图2 3 。k a z a a 模型是p 2 p 混合模型的典型代 表,k a z a a 模型将节点按能力不同( 计算能力、内存大小、连接带宽网络滞留时间等) 区 分为普通节点和搜索节点两类,其中搜索节点与其临近的若干普通节点之间构成一个自治 的簇,簇内采用基于集中目录式的p 2 p 模式,而整个p 2 p 网络中各个不同的簇之间再通 过纯p 2 p 的模式将搜索节点相连起来,甚至也可以在各个搜索节点之间再次选取性能最 优的节点,或者另外引入一新的性能最优的节点作为索引节点来保存整个网络中可以利用 的搜索节点信息,并且负责维护整个网络的结构。 由于普通节点的文件搜索先在所属的簇内进行,只有查询结果不充分的时候,再通过 搜索节点之间进行有限的泛洪( f l o o d i n g ) 。这样就有效地消除纯p 2 p 结构中使用泛洪算 法带来的网络拥塞、搜索迟缓等不利影响。然而,由于超级节点本身的脆弱性也可能导致 其簇内的结点处于孤立状态,因此这种局部索引的方法仍然存在一定的局限性。这导致了 结构化的p 2 p 网络模型的出现。 图2 3 混合式p 2 p 模型 l o 南京邮电人学硕 :学位论文第 二章p 2 p 系统概述 2 2 4 结构化网络模型 所谓结构化与非结构化模型的根本区别在于每个节点所维护的邻居是否能够按照某 种全局方式组织起来以利于快速查找。结构化p 2 p 模式是一种采用纯分布式的消息传递机 制和根据关键字进行查找的定位服务,目前的主流方法是采用分布式哈希表( d i s t r i b u t e d h a s ht a b l e ,简称d h t ) 技术【i 引,这也是目前扩展性最好的p 2 p 路由方式之一。 由于d h t 各节点并不需要维护整个网络的信息,只在节点中存储其临近的后继节点 信息,因此较少的路由信息就可以有效地实现到达目标节点,同时又取消了泛洪算法。该 模型有效地减少了节点信息的发送数量,从而增强了p 2 p 网络的扩展性。同时,出于冗 余度以及延时的考虑,大部分d h t 总是在节点的虚拟标识与关键字最接近的节点上复制 备份冗余信息,这样也避免了单一节点失效的问题。但是基于d h t 的拓扑维护和修复算 法也比非结构化的系统要复杂得多,目前大量实际应用还大都是基于无结构的拓扑和泛洪 广播机制,大多采用d h t 方式的p 2 p 系统缺乏在i n t e r n e t 中大规模真实部署的实例,成 功应用还比较少见。 2 3p 2 p 的应用领域及常见协议 2 3 1p 2 p 的主要应用领域 目前,已有多种网络服务都采用了p 2 p 技术,主要有如下应用【5 习: ( 1 ) 实时通讯,如i c q ( 名称来自is e e ky o u ,简称为i c q ) 、s k y p e d 2 1 ; ( 2 ) 文件共享,下载和上传文件不通过中央服务器,或者中央服务器只起辅助作用。 这是目前p 2 p 技术在网络中最广泛的应用,如n a p s t e r 、b t 、e d o n k e y 、国内的p 2 p 软件 o p e n e x t 、百度下吧、r e a l l i n k 等也提供了文件共享功能: ( 3 ) 协同工作,使用p 2 p 技术,可以建立一个安全的企业级协同工作平台,提供互 动的供求信息,帮助用户进行经销管道维护、售后服务等,如g r o o v e 、国内的k d t ( 快 递通的简写) ; ( 4 ) 对等计算,可联接上力- 台p c ,利用它们的空闲时间进行协同计算,完成超计算 量的工作,如d i s t r i b u t e n e t 、s e t i h o m e ; ( 5 ) 搜索,用来在p 2 p 网中完成信息检索。此类应用软件有i n f r a s e a r c h 、p o i n t e r a ; ( 6 ) 存储,用于在网络上将存储对象分散化存放,而不像现在存放于专用服务器。 南京邮电人学硕i :学位论文第一二章p 2 p 系统概述 此类应用软件有f a r s i t e ( m i c r o s o f t ) 、o c e a ns t o r e ; ( 7 ) 游戏,采用p 2 p 技术建立起来的分布式小组服务模型,配以动态分配的技术, 每个服务器的承载人数将在数量级上超过传统的服务器模式,这将大大提高目前多人在线 交互游戏的性能。 一 2 3 2p 2 p 的常见协议及软件 ( 1 ) n a p s t e r n a p s t e r 是s h a w nf a n n i n g 和s e a np a r k e r 于1 9 9 9 年5 月共同创办的文件共享社区网 站,同名软件n a p s t e r 使用p 2 p 技术提供免费m p 3 文件下载服务【4 1 1 。 n a p s t e r 是混合式、非结构化的p 2 p 文件共享网络。中央服务器本身并不存贮m p 3 文件,它实际上提供的是所有在线节点所存m p 3 文件的“目录”,m p 3 文件分布在网络 中的每一个节点中。客户端搜索并下载音乐文件的整个过程如下:节点打开n a p s t e r 客户 端软件,向服务器发送搜索请求;服务器通过目录索引查找与该节点搜索请求相匹配的 m p 3 文件信息。并向该节点发送拥有该m p 3 的所有节点的i p 地址、端口号和存放路径 等信息来响应节点的搜索请求;然后,该节点根据服务器所提供的信息,p i n g 每一台拥 有所需m p 3 的节点,计算返回时间,与距离最近的节点直接建立连接,开始下载文件。 ( 2 ) g n u t e l l a g n u t e l l a 是n u l l s o f t 公司的j u s t i nf r a n k e l 于2 0 0 0 年推出的一款开放源代码音乐文件 共享工具。最初的g n u t e l l a 网络是分布式、非结构化的文件共享网络。对等结点a 在初 始化时知道已经在g n u t e l l a 网络中的对等结点b 的i p 地址,当a 和b 连接后,a 可以 获得b 所知道的所有系统结点信息,这样a 就可以和它所感兴趣的结点建立直接的t c p i p 连接。每个g n u t e l l a 节点都定义了本地的共享文件央,它们可以根据文件名的部分或者 完全匹配进行查找。查找按照简单泛洪方式进行,即首先传播到所有相邻结点,然后再传 播到相邻节点的相邻节点,直到达到预先确定的层次为止。 ( 3 ) f a s t t r a c k f a s t t r a c k 协议及其客户端软件k a z a a 最初是由荷兰的一家公司c o n s u m e r e m p o w e r m e n t 于2 0 0 1 年3 月推出的【4 引。f a s t t r a c k 网络是有超级节点的非结构化的p 2 p 文件共享网络。基于f a s t t r a c k 的软件k a z a a 的工作流程如下: 节点每次启动时先到服务器上注册,从服务器上得到2 0 0 个超级节点的列表,本机上 的k a z a a 程序会自动检查本节点是否为超级节点,如果是,就连到其它超级节点,如果 1 2 南京邮电大学硕l j 学位论文第一二章p 2 p 系统概述 不是就选择一个超级节点作为父节点进行连接;用户搜索文件时,发送搜索请求到父节点, 然后父节点向其连接的超级节点广播这个搜索请求,直到生存时间( t i m et ol i v e , 简称 为t t l ) 为o 。最终父节点在给用户的应答中会提供一个可用的文件列表,以及文件所在 节点的位置:最后用户从可用文件列表中选择一个地址,进行t c p 连接请求,连接成功 后,即可丌始传输文件。 ( 4 ) c h o r d c h o r d 是麻省理工学院开发的分布式、结构化p 2 p 搜索协议f 4 2 1 。在c h o r d
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026届丽水市重点中学高一化学第一学期期中学业水平测试模拟试题含解析
- 银行客户风险评估标准
- 企业环境保护责任制实施细则
- 服装制版新手入门详解及常见问题
- 银行客户风险评估操作流程详解
- 柴油发电机组安装施工技术方案
- 四年级古诗知识竞赛出题方案
- 投资安全回报保障承诺书(9篇)
- 玉柴出口营销方案
- 墙板隔音施工方案
- 医院纪律管理办法
- 青田县中部引水工程环评报告
- 租赁公司员工手册考核规定
- 鸽子协会管理办法
- 冀南遗韵:隆尧秧歌的历史、现状与传承发展研究
- 健康手环销售方案
- 供应链金融-洞察及研究
- 金螳螂培训-精装修工程工艺标准要点图解183P
- 企业内物流培训课件
- JJG 1148-2022电动汽车交流充电桩(试行)
- 低压电工证考试题(附答案)
评论
0/150
提交评论