(计算机应用技术专业论文)gnutella协议中为解决网络过载问题的一些改进.pdf_第1页
(计算机应用技术专业论文)gnutella协议中为解决网络过载问题的一些改进.pdf_第2页
(计算机应用技术专业论文)gnutella协议中为解决网络过载问题的一些改进.pdf_第3页
(计算机应用技术专业论文)gnutella协议中为解决网络过载问题的一些改进.pdf_第4页
(计算机应用技术专业论文)gnutella协议中为解决网络过载问题的一些改进.pdf_第5页
已阅读5页,还剩51页未读 继续免费阅读

(计算机应用技术专业论文)gnutella协议中为解决网络过载问题的一些改进.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士毕业论文 摘要 摘要 p e e r - t o p e e r 是近年来国际上磺究得比较热门的一个题目。它不仅掀起7 一场前 瞬毒有的资源共享热蘧且冲击了当前i n t e r n e t 环境下的c l i e n t s e r v e r 模式,本 片论文讨论7p e e r t o p e e r 文件共享两络协议g n u t e l l a 的历史和发曩过程,其 体介绍7g n u t e l l a 协议的规范。着重指出7g n u 把l l a 协议由于不加限锄的连接 网络中的节点导致髓络过载阃题昀产生同时由于网络中存在过多的p 讯消 息郓p u s h 消息导致礴络带宽被极大浪费,本文针对这些因素绘出7 髭g 眦t e t l a 协议的修改意见通过弓| 入7 最大连通数的概念以及改进7p 消息和p u s h 消息的处理枫翻来缓和g n u t e l l a 协议对甄络带宽的影响,本文还通过两络模拟 器实验来显示对g n u t e l l a 协议的这些少量修改可以显著提高整个嘲络的使再效 牵;。 关键字:p e e r t o p e e r ,p 2 p ,g n u t e l l a 协议网络过载, v v 第1 页 两络模拟器 一, 硕士毕业论文 a b s t r a c t a b s t r a c t t o p i c so np e e r - t o - p e e rh a v eb e e np u to nr ps p o t l i g h ti nr e c e n ty e a r s , b r i n g i n ga t r e n do f r e s o u r c es h a r i n ga r o u n dt h ew o r l dw i t hag r e a ti n f l u e n c eo nt h ec l i e n t s e r v e r m o d e a n dt h i sp a p e rm a i n l yc o n c e n t r a t e so nt h eh i s t o r ya sw e l la st h ee v o l u t i o no f p e e r - t o - p e e rf i l es h a r i n gn e t w o r kp r o t o c o l - g n u t e l l a e l a b o r a t i n go ng n u t e l l a p r o t o c o ls p e c i f i c a t i o n , jw a n tt op u ta n e m p h a s i so nt h ep r o b l e m sr i s i n gf r o m g n u t e l l a , p a r t i c u l a r l yu n l i m i t e dc o n n e c t i o n s , w h i c hl e a dt ot h en e t w o r kb a n d w i d t h w a s t a g eb e c a u s eo fe x c e s s i v ep i n g sa n dp u s h e s a tt h es a m et i m e , ,i n t e n dt op u t f o r w a r dm ys u g g e s t i o n so f m o d i f i c a t i o n so nt h ep r o t o c o lb yi n t r o d u c i n gt h ec o n c e p to f m a x i m a lc o n n e c t i o n s :t a r g e t i n ga ta m e l i o r a t i n gt h em e c h a n i s ma n d a l l e v i a t i n gt h e n e g a t i v ee f f e c t sb r o u g h tb yt h eg n u t e l l a 缈m e a n so fe x p e r i m e n t so nn e t w o r k s i m u l a t o r , w em a yd r a w 口c o n c l u s i o nt h a tt h ew h o l en e t w o r kc o u m p r o b a b l yo p e r a t e w i t hah i g h e re f f i c i e n c yi f t h e s es u g g e s t i o n sa t ea p p l i e d k e y w o r d s p e e r - t o - p e e r , g n u t e l l ap r o t o c o ln e t w o r k - o v e r l o a d i n g , n e t w o r ks i m u l a t o r 第2 页 硕士毕业论文 第一章前言 第一章前言 1 1 研究背景 2 0 0 0 年7 月,以s o n y 、b m g 、时代华纳、e m l 、环球为首的美国唱片工 业协会以侵犯音乐版权为由将成立不到两年的网络公司n a p s t e r 告上法庭,从 而使p e e r - t o p e e r ( 对等联网或点对点技术) 重新登上了历史舞台。 n a p s t e r 所代表的网络应用模式的确给互联网的冬天带来一缕春风,它依然 是利用现在的网络设备和网络协议,与e - m a i l 、下载、网页浏览等传统网络应 用结合在一起,最大的不同就是p e e r - t o p e e r 中提供服务的不再是中心服务器, 也不必强制用户必须登录服务器才能获得需要的信息。它把用户的电脑直接连 接起来,实现,文件共享、文件交换和分布计算等功能。 g n u t e l l a 则更进了一步,它不像n a p s t e r 一样需要一个中心服务器来记录 用户和共享信息索引,每个节点既是服务器又是客户端,节点之间通过广播和 信息转发进行通讯,完成查询和下载功能,所以被称为是“纯粹”的 p e e r - t o p e e r 。 p e e r - t o p e e r 应用的出现,使网民围着网站转的局面变成了网民围着网民 转的形式,网民不必为了获取信息而对网站俯首帖耳,而完全可以独立行走于 网络之间。p e e r - t o - p e e r 的应用使传统的节点式信息服务变成蛛网式的信息服 务,每一台电脑就是一个信息点,所有连接起来的电脑构成了一个无比巨大的 信息网。p e e r - t o - p e e r 中的个人电脑与前段时间倡导的瘦客户机或网络计算机 的概念正好互相对立,它使每台电脑都是一个特定的信息的集散地。 1 2 研究目标 p e e r - t o - p e e r 文件共享网络协议g n u t e l l a 虽然倍受关注,并且从诞生的第 一天起就开始迅速膨胀,然而其发展却并非一帆风顺,5 个月后g n u t e l l a 网络 就遭遇了网络过载问题,网络的稳定性和服务质量大大下降。本文的研究目的 就是要通过对g n u t e l l a 网络深入仔细的研究分析,试图找到产生网络过载问题 的原因,并能通过对协议的修改减少g n u t e l l a 网络中不必要的网络流量,解决 或者缓解g n u t e i i a 网络的网络过载问题。 1 3 文章结构 本文共分七章,第一章前言对p e e r - t o - p e e r 文件共享网络协议g n u t e l l a 的 研究背景、研究目的作简要的介绍,同时给出文章的组织和创新所在。第二章 从p e e r - t o - p e e r 的概念和发展历史入手,介绍了p e e r - t o - p e e r 的概念、发展历 第3 页 硕士毕业论文第一章前言 史、其互联网本质、现有的两种模型、始终应用以及所处的困境。第三章简单 介绍了g n u t e l l a 的发展历史,详细介绍了g n u t e l l a 节点的结构以及g n u t e l l a 协议的规范( v 0 4 ) 。 文章第四章详细论述了g n u t e l l a 协议在网络负载方面存在的问题网络 过载问题和网络中存在过多消息问题,并分析及产生的原因。第五章针对第四 章中提出的问题给出详细的协议改进方案。第六章中通过模拟程序对改进前后 的规范进行模拟测试,并对结果进行分析。第七章给出本文的结论,以及对 g n u t e l l a 协议的一些展望。 1 4 本文的创新处 本文从近年来国际上讨论得比较热门的p e e r - t o p e e r 的特点谈起,介绍了 无中央服务器的p e e r - t o p e e r 文件共享网络协议g n u t e l l a ,并指出g n u t e l l a 网 络中存在的网络过载问题。 文章通过对g n u t e l l a 协议的深入详细地研究分析,发现网络中的节点无视 本身可用的有效带宽,不加限制连接网络中的其它节点是造成网络过载问题的 主要原因,同时协议的简单性也造成了网络中存在了过多的p i n g 消息和p u s h 消息,加重了对整个网络的负担。 由此本文对g n u t e l l a 协议进行了修改和补充,在其中引入了最大连通数的 概念,防止节点因为建立了超过其负担能力的连接而导致网络过载的现象发生。 同时本文还改进了p i n g 消息和p u s h 消息的处理机制,调整了部分消息的结构。 通过改进,将彻底消除网络过载问题,网络中的p i n g 消息和p u s h 消息也将极 大减少,缓和了g n u t e l l a 对网络带宽的影响。 本文的意义在于通过对g n u t e l l a 协议的改进,可以使g n u t e l l a 用户摆脱网 络过载问题困扰,同时也提高了网络的稳定性和服务质量,使更多用户可以通 过g n u t e l l a 网络提供的便利服务,共享其它用户提供的资源。 第4 页 硕士毕业论文第二章p e e r - t o p e e r 介绍 第二章p e e r t o p e e r 介绍 2 。1p e e r - t o p e e r 的概念 p 2 p 是p e e r - t o p e e r 的缩写,p e e r 在英语里有“( 地位、能力等) 同等者”、 “同事”和“伙伴”等意义。这样一来,p 2 p 也就可以理解为“伙伴对伙伴”的意思, 或称为对等联网。目前人们认为其在加强网络上人的交流、文件交换、分布计算 等方面大有前途。 对于p e e r - t o - p e e r 经典的定义是: 一个p e e r - t o p e e r 系统是由很多分布式节点的集合所组成。 每个节点同时是客户端又是服务端,节点既能够给其它节点提供服务,又能 够使用其它节点提供的服务 简单的说,p 2 p 直接将人们联系起来,让人们通过互联网直接交互。p 2 p 使 得网络上的沟通变得容易、更直接共享和交互,真正地消除中间商。p 2 p 就是 人可以直接连接到其他用户的计算机、交换文件,而不是像过去那样连接到服务 器去浏览与下载。p 2 p 另一个重要特点是改变互联网现在的以大网站为中心的 状态、重返“非中心化”,并把权力交还给用户。p 2 p 看起来似乎很新,但是正 如b 2 c ,b 2 b 是将现实世界中很平常的东西移植到互联网上一样,p 2 p 并不是 什么新东西。在现实生活中我们每天都按照p 2 p 模式面对面地或者通过电话交 流和沟通。 2 。2p e e r - t o p e e r 的发展历史 即使从网络看,p 2 p 也不是新概念,p 2 p 是互联网整体架构的基础。互联网 最基本的协议t c p ,l p 并没有客户机和服务器的概念,所有的设备都是通讯的平 等的一端。在十年之前,所有的互联网上的系统都同时具有服务器和客户机的功 能。当然,后来发展的那些架构在t c p i p 之上的软件的确采用了客户机朋艮务器 的结构:浏览器和w e b 服务器,邮件客户端和邮件服务器。但是,对于服务器 来说,它们之间仍然是对等联网的。以e m a i l 为例,互联网上并没有一个巨大的、 唯一的邮件服务器来处理所有的e m a i l ,而是对等联网的邮件服务器相互协作把 e m a i l 传送到相应的服务器上去。另外用户之间e m a u 则一直对等的联络渠道。 但是过去的5 年里,互联网的发展至少从表面上远离了p 2 p ,互联网上绝大 部分的节点也不能和其他节点直接地交流。n a p s t e r 正是唤醒了深藏在互联网背 后的对等联网。n a p s t e r 的文件共享功能在局域网中共享目录也是再平常不过的 事情。但是n a p s t e r 的成功促使人们认识到把这种。对等联网”拓展到整个互联网 范围的可能性。当然,在许多人的眼中,n a p s t e r 并不是纯粹的p 2 p ,它仍然需 第5 页 硕士毕业论文第二章p c c r _ t o p e e r 介绍 要一个处于中心协调机制。 事实上,网络上现有的许多服务可以归入p 2 p 的行列。即时讯息系统譬如 i c q 、a o li n s t a n tm e s s e n g e r 、y a h o op a g e r 、微软的m s nm e s s e n g e r 以及国 内的o l c q 是最流行的p 2 p 应用。它们允许用户互相沟通和交换信息、交换文 件。用户之间的信息交流不是直接的,需要有位于中心的服务器来协调。但这些 系统并没有诸如搜索这种对于大量信息共享非常重要的功能,这个特征的缺乏可 能正是为什么即时讯息出现很久但是并没有能够产生如n a p s t e r 这样的影响的 原因之一。 另外一个可以归入p 2 p 是拍卖网站譬如e b a y ,人们在总结e b a y 的模式的 时候用了c 2 c ,是不是和p 2 p 有一点类似? e b a y 就是一个将人们联系的和交 易物品的社区,用户可以方便的搜索其他用户叫卖的商品。e b a y 提供了一些使 得交易得以顺利进行的服务,但是交易是直接在用户之间进行的。如果将“交易” 的概念推广,c 2 c 就是p 2 p 的一个特例,这里人们互相交换的是商品。 但如果仔细深究的话,n a p s t e r 和即时讯息在赋予用户之间直接交流的能力、 e b a y 使用户可以直接交易的同时,却破坏了服务器端的那种自互联网出现之初 就存在的对等联网思想,因为它们都需要有一个位于中心的服务器来协调,而不 是分布在世界上不同地方的、对等联网的许多服务器。这也正是诸如g n u t e l l a 和f r e e n e t 不断的宣称它们创造了“纯粹”的p 2 p ,完全没有中心服务器的p 2 p 服务的原因。 2 3p e e r - t o p e e r 的思想是互联网的本质 如果回顾一下,我们会发现在 ,出现伊始p 2 p 就是互联网的本质特征 之一。人们各自建立网页、互相做链接,人们上网是沿着链接冲浪。那时的w e b 是真正的“网”( w e b ) 。但是当y a h o o ! 和l y e o s 建立了搜索引擎和门户站点后, 人们上网的方式被改变了,人们从此到一个地方去获取所有的信息。记得新浪曾 经有一段时间说它们是。目标站点1 模式,但是如果多问一句,现在人们一条一条 地阅读新浪的新闻,在头脑中还有一个。网”的概念吗? 最大的问题是,这些站点 控制了信息的流动、充斥了过时的信息、阻碍了真正的交流,或者对于很多人来 说,另外还有太多的广告。p 2 p 就是把控制权重新还到用户手中去。人们通过 p 2 p 可以共享硬盘上的文件、目录甚至整个硬盘。这种能量是非常令人激动的, 那些费心存储在自己的硬盘上的东西肯定是我们认为最有价值,所有人都共享了 他们认为最有价值的东西,这将使互联网上信息的价值得到极大的提升。 因为每个p e e r 都代表了其后的人,基于自组织的网上社区也正在显现。与 门户站点从上而下建立社区的方式不同,人们将以自发的方式形成社区。 第6 页 硕士毕业论文 第二章p e e r - t o p e e r 介绍 当人们加入p 2 p 网络的时候,所有人都拥有了平等的机会,所有人都拥有 了极容易地在网络上创造“内容”的机会。当然,真正在网络上创造或提供内容的 人还是少数的,据统计g n u t e l l a 的用户中仅仅有2 向其他用户提供了内容,即 使在比较活跃的u s e n e t 张贴文章的用户也仅占所有用户的7 。但是,p 2 p 第 一次使得所有上网的人都拥有了平等的机会。 我们可以用三句话来揭示p 2 p 的影响: 对等联网:是只读的网络的终结( p e e r - t o p e e r i s t h e e n do f t h er e a d o n l y w e b ) 对等联网:使你重新参与互联网( p e e r - t o p e e ra l l o w sy o u t op a r t i c i p a t e i nt h ei n t e m e ta g a i n ) 对等联网:使网络远离电视( p e e r - t o p e e rs t e e r i n gt h ei n t e r n e ta w a y f r o m 丁,1 如上文所言,p 2 p 不是一个新思想,从某些角度看它甚至是整个最初创建互 联网的最基本的思想。 2 4p e e r - t o - p e e r 的模型 从网络中是否存在中央服务器,p e e r - t o p e e r 可以划分为两种模型,些交 换软件,如n a p s t e r 等,属于中央服务器模型,或者可以称为“中心文件目录, 分布式文件系统”,交换数据时是通过中央服务器来进行目录管理的。另外一类 属于完全p 2 p 的,这类软件没有中间服务器,如g n u t e l i a ,这类软件更接近于 绝对的自由,因为没有中i 1 f i 艮务器各个节点通过相互的握手来进行通讯和数据 交换。 2 4 1 中央服务器模型 图表1n a p s t e r 的中央服务器模型 在具有中央服务器的n a p s t e r 网络中,一个用户( 如u s e r l ) 需要在网络中 查找m p 3 文件,首先会向n a p s t e r 的中央服务器发送一个查询请求( s e a r c h q u e r y ) ,由于在中央服务器中存放有所有用户可以提供的文件目录列表,经过 第7 页 硕士毕业论文第二章p c c r o t o - p c c r 介绍 检索匹配之后,满足查询请求的结果集将作为查询反馈( s e a r c hr e s p o n s e ) 发 还给提出请求的用户( u s e r l ) ,该用户就可以根据结果集中的信息到含有所需 文件的用户那里下载需要的文件,如图中所示,用户u s e r 2 的电脑中含有用户 u s e r l 所需的文件,u s e r l 就可以直接同u s e r 2 建立连接,下载文件。 中央服务器模型的优点在于机制简单,查询效率高,对网络的要求不大。缺 点在于对中央服务器的依赖很大,服务器的瘫痪将导致整个网络的瘫痪。 2 4 2 非中央服务器模型 图表2g n u t e i l a 的非中央服务器模型 非中央服务器模型的本质是一个一个分布式网络,由于不像n a p s t e r 存在用 于协调的中央服务器提供文件索引和查询功能,网络中的节点首先必须查明所需 要的文件在网络的什么地方,然后才能设法得到。 如上图的g n u t e l l a 网络中,如果节点a 想要在网络中查询所需要的信息, 首先需要将查询请求( s e a r c hq u e r y ) 发送到相邻接的节点b ,节点b 接收到 查询请求后会将请求转发到它所相邻的节点c 、d 、e 、f ( 不包括请求发来的节 点a ) ,接收到查询请求的节点( b 、c 、d 、e 、f ) 会在本地共享文件中匹配查 询请求,如果有匹配的结果,就将结果反馈给发出请求的节点。在图中,节点f 第8 页 硕士毕业论文第二章p e e r - t o - p e e r 介绍 含有匹配的文件,就将匹配信息发送给请求传来的节点b ,节点b 接收到反馈, 发现不是自己所需要的,就将匹配信息转发给请求传来的节点a ,就这样节点a 知道在节点f 上有它所需要的文件,于是同节点f 直接建立连接,下载需要的 文件。 同中央服务器模型相比,非中央服务器模型的最大优点在于其可靠性,由于 没有中央服务器提供服务,部分节点断线或者发生问题并不会影响其它节点间的 通讯,网络始终可以提供服务。但是为了查询信息增加了很多握手过程,产生了 很多额外的通讯,在效率和带宽占用方面就不是十分理想。 2 5p e e r - t o p e e r 的应用 p 2 p 引导网络计算模式从集中式向分布式偏移,也就是说网络应用的核心从 中央服务器向网络边缘的终端设备扩散:服务器到服务器、服务器到p c 机、p c 机到p c 机,p c 机到w a p 手机所有网络节点上的设备都可以建立p 2 p 对 话。这使人们在i n t e r n e t 上的共享行为被提到了一个更高的层次,使人们以更主 动深刻的方式参与到网络中去,正如1 2 ( 第二代互联网) 之父d o u g v a n h o u w e l i n g 在几个月前的中国之行时说到的:“下一代互联网民们将真正参与到 网络中来,每个人都能为网络的资源和功能扩展作出自己的贡献。” p 2 p 给互联网的分布、共享精神带来了无限的遐想有观点认为至少有1 0 0 种应用能被开发出来,但从目前的应用来看,p 2 p 的威力还主要体现在大范围 的共享、搜索的优势上。在这方面主要引发了,或者是说更好的解决网络上四大 类型的应用:对等计算、协同工作、搜索引擎、文件交换。 2 5 1 对等计算 通过众多计算机来完成超级计算机的功能,直是科学家梦寐以求的事情。 采用p 2 p 技术的对等计算,正是把网络中的众多计算机暂时不用的计算能力连 结起来,使用积累的能力执行超级计算机的任务。任何需要大量数据处理的行业 都可从对等计算中获利,如天气预报、动画制作、基因组的研究等,有了对等计 算之后,就不再需要昂贵的超级计算机了。在硅谷现在有许多公司正在投入对等 计算的开发,如p o p u l a rp o w e r ,c e n t r a t a ,u n i t e dd e v i c e s ,e n t r o p i a 等,并 获得了巨大的风险资金。i n t e l 也利用对等计算技术来设计其c p u ,并为其节省 极大的费用,同时对等计算的发展是以p c 机资源的有效利用为根本出发点的, 自然也极力受到i n t e l 的极力推祟。从本质而言,对等计算就是网络上c p u 资源 的共享。 第9 页 硕士毕业论文第二章p e e r - t o - p e e r 介绍 2 s 2 协同工作 公司机构的日益分散,给员工和客户提供轻松、方便的消息和协作的工具, 变得e l 益重要。网络的出现。使协同工作成为可能。但传统的w e b 方式实现, 给服务器带来了极大的负担,造成了昂贵的成本支出。p 2 p 技术的出现,使得 互联网上任意两台p c 都可建立实时的联系,建立了这样一个安全、共享的虚拟 空间,人们可以进行各种各样的活动,这些活动可以是同时进行,也可以交互进 行。p 2 p 技术可以帮助企业和关键客户,以及合作伙伴之间建立起种安全的 网上工作联系方式,因此基于p 2 p 技术的协同工作也受到了极大的重视。 2 5 3 搜索引擎 p 2 p 技术的另一个优势是开发出强大的搜索工具。p 2 p 技术使用户能够深度 搜索文档,而且这种搜索无需通过w e b 服务器,也可以不受信息文档格式和宿 主设备的限制,可达到传统目录式搜索引擎( 只能搜索到2 0 一3 0 的网络资 源) 无可比拟的深度( 理论上将包括网络上的所有开放的信息资源) 。以g n u t e l l a 进行的搜索为例:一台p c 上的g n u t e l l a 软件可将用户的搜索请求同时发给网 络上另外1 0 台p c ,如果搜索请求未得到满足,这1 0 台p c 中的每一台都会把 该搜索请求转发给另外1 0 台p c ,这样,搜索范围将在几秒钟内以几何级数增 长,几分钟内就可搜遍几百万台p c 上的信息资源。可以说,p 2 p 为互联网的信 息搜索提供了全新的解决之道。 2 5 4 文件交换 可以说文件交换的需求直接引发了p 2 p 技术热潮。在传统的w e b 方式中, 要实现文件交换需要服务器的大力参与,通过将文件上传到某个特定的网站,用 户再到某个网站搜索需要的文件,然后下载,这种方式的不便之处不言而喻。电 子邮件是方便了个人间文件传递问题,却没法解决大范围的交换。这也是w e b 的重要缺陷,n a p s t e r 就是在情况下横空出世,抓住人们对m p 3 喜欢的需求, n a p s t e r 的m p 3 交换直接引发了网络的p 2 p 技术革命。 文件交换的需求也很轻松地延伸到了信息的交换,在线拍卖也被赋予了新的 形式,大家也不必要到拍卖网站登记要卖的商品了,在自家的硬盘上建个商店就 可以了。由此又可以延伸到,一切中介网站都会被替代。 当然以上四类型应用决不是p 2 p 仅有的应用,被认为至少还有10 0 种应用 等着去开发。与b 2 c 、b 2 b 、c 2 c 、c 2 b 等一些概念不同,p 2 p 是技术,甚至 技术思想的革命。更重要的是,p 2 p 技术将实现互联网的大部分潜力,将互联 网从一个基于文件的网页和电子邮件网络转变成一个动态的、颗粒状网络,在网 第1 0 页 硕士毕业论文 第二章p c c 十t o - p c c r 介绍 络中,特定的信息组件可被有效地放置和分享。网络与计算机将不再有什么差别 了。 2 6p e e r - t o p e e r 的困境 虽然p 2 p 是一片充满希望的热土,但还是存在着不少的困境,除了p 2 p 的 赢利模式尚处在无法验证的摸索过程p 4 夕i ,p 2 p 本身也存在着许多亟待克服的 困难: 2 6 1 版权问题 就像n a p s t e r 的出现冲击着唱片公司的利益一样,大多数p 2 p 服务都将不 可避免地和知识产权发生冲突。n a p s t e r 险些被联邦法院强令关闭,直到今天仍 然因身陷版权官司的沼泽之中吉凶为h 。尽管美国唱片协会等一些组织在寻找一 种新的方式来保护知识产权,但是,每一个提供文件共享服务的p 2 p 公司都不 得不认真审视p 2 p 网络面临的版权问题。 2 6 2 管理困难 p 2 p 网络的精髓在于其“乌托邦”式的管理方式,这种方式给了用户更多的自 由,但是这也陷入了“无政府主义”的困境。可以想象,缺乏管理的p 2 p 网络将会 成为病毒、色情内容以及非法交易的温床。许多p 2 p 公司打算通过p 2 p 网络开 展电子商务,但是付费问题、流量计算、商品价值的验证等等都是一时很难克服 的困难。 2 6 3 垃圾信息 由于p 2 p 网络的用户众多,当某个用户进行搜索时,自然会得到大量的搜 索结果。而除了少数有用的信息以外,其它大多数的信息可能都属于垃圾信息。 在缺乏统一的管理的情况下,p 2 p 网络很难对搜索结果进行排序,用户将不可 避免地陷入垃圾信息的汪洋大海。现在已经有公司尝试着将人工智能技术、专家 数据库技术引入p 2 p 网络中,希望能够克服垃圾信息的困扰。 2 6 4 吞噬网络带宽 p 2 p 使网络变得空前活跃,大多数用户愿意利用p 2 p 网络在计算机之间传 送文件,这将大量吞噬网络带宽,特别是在大多数用户更喜欢传送大体积的m p 3 文件、视频文件的时候,这个问题更加不容忽视。在我国,网络带宽较窄成了 p 2 p 应用难以逾越的障碍。不过,业界人士都把2 0 0 1 称为。宽带上网年”,希望 宽带上网能够彻底解决p 2 p 网络面临的带宽危机。 第l l 页 硕士毕业论文 第二章p e e r - t o p e e r 介绍 2 6 5 慈善病毒 安全问题永远能跟上互联网的发展节奏,这一点可以从i s s ( 美国最著名的 网络安全厂商之一) 在纳斯达克股市上的稳健表现看出来。像美国在线的“即时 信使”和眼下的几种p 2 p 软件对源代码的加密并不可靠,很容易就会被反向汇编 得出源代码,这些源代码最终像开放源代码软件一样在网上随处可得。这一方面 会有利于人们针对不同的操作系统平台和功能需求重新编译这些程序。另一方 面,一些居心不良的黑客也能借机篡改软件源代码,为将来的不义之举留下方便 之门。尽管这需要一个黑客具备相当的编程经验和技巧,但总能有少数“专家级” 的黑客能随心为之。可以想象,这些系统隐患将来会象瘟疫一样在黑客组织里扩 散传播,成为p 2 p 软件的附骨之蛆。如果事情发展到这步田地,纵使p 2 p 软件 魅力无穷,也只能接受“慈善病毒”的称呼了。 2 6 6 标准之争 i n t e l 是p 2 p 的热心鼓吹者,并且试图以p 2 p 开发组织盟主的身份去领导p 2 p 的未来。为什么i n t e l 最积极。其实答案非常明显。众所周知,p c 机处理器芯片 依然是i n t e l 的主要收入来源和核心竞争力所在,而对等计算的主要用途之一是 充分挖掘连接在网络上的亿万个p c 的处理能力和存储能力以处理一些需要大 型机,甚至超级计算机才能担纲的任务,这无疑意味着p c 机的一次集体革命, 将进一步刺激p c 产业的发展,对i n t e l 来说,诱惑来自市场空间的极大拓展。 可惜事情的进展并未随了i n t e l 的愿,在i n t e l 主持的p 2 p 工作组首次会议上, 上至旧m 、s u n 、h p 这样的l t 巨头,下至一些头天才冒出来的一些初创公司, 没有人将i n t e l 视作权威。与会者纷纷指责i n t e l 的组织无方,呼吁p 2 p 工作组 应当参照i e t f ( i n t e r n e t 工程任务组) 的管理模式s u n 公司甚至另开“小会”,主 张基于j a v a 和j i n i 语言的p 2 p 应用开发。利益的分歧导致开发标准的难以统一, 这将成为p 2 p 发展道路上的另一个难迈的坎。 除了上述的缺点以外,p 2 p 网络还是一种比较脆弱的网络:在现有的p 2 p 网络中无法进行诸如安全管理、身份认证、流量管理、计费等功能。不难想象, 一个拥有众多用户的p 2 p 网络将会成为黑客的攻击目标,这将极大地威胁p 2 p 网络的安全。 但是,p 2 p 并不是先天缺钙。作为一个刚刚展露头角的新技术,p 2 p 还需要 一个发展过程。我们有理由相信,通过后天的营养补充,p 2 p 会强壮并且最终 成熟起来。 第1 2 页 硕士毕业论文第三章g n u t c l l a 介绍 第三章g n u t e l l a 介绍 3 1g n u t e l l a 的发展历史 “g n u t e l l a ”软件由开发m p 3 播放软件“w i na m p ”而一举成名的n u l l s o f t 公司 的嘉斯廷富兰科尔制作,用于交换m p 3 等文件。2 0 0 0 年3 月1 4 日在网站上公 开该软件后,n u l l s o f t 公司的母公司a m e r i c ao nl i n e ( a o l ) ,担心该软件的普 及可能产生预测不到的影响,在过了约1 个半小时后就关闭了该网站。但是,众 多的m p 3 迷们早就翘首以盼w i n a m p 的开发者推出“类似n a p s t e r 的软件”。就 在那一个半小时内有几千个用户下载了该软件。而且其后事情的进展之快着实令 人咋舌。人们在下载g n u t e l l a 后纷纷将其公开,甚至还有人改造该软件,科隆 该软件。很快g n u t e l l a 在全世界流传了开来。 g n u t e l l a 与n a p s t e r 的区别在于,g n u t e l l a 不需要中央服务器。也就是说, 该软件是以p e a r t op e a r ( 终端对终端) 的形式检索及下载文件。换句话说,只 须在上网的个人电脑中运行g n u t e l l a ,就可以建立起一个g n u t e l l a 社区。 其实g n u t e l l a 的潜在功能并不仅限于交换m p 3 文件。只要指定扩展名,就 可以检索其它任何格式的文件。也就是说,除了音乐文件以外,诸如文本、动画、 图像、程序等文件都将成为交换的对象。只要是数码数据就可以用来交换。在此 基础上,如果g n u t e l l a 进化到可以检索h t m l 文件内容的话又会怎样呢? 您猜 得对,到那时用户就不必再劳架检索网站了。只要指定用户公开的信息内容参加 g n u t e l l a 社区,则无须通过检索网站等第三方,就可以实时地在全球范围内检索 g n u t e l l a 终端。可以说,g n u t e l l a 是一种极有可能改变目前因特网概念的潜力无 限的软件。 3 2g n u t e l t a 节点的结构框架 g n u t e l l a 网络是一个分布式网络,网络中不存在用于协调的中央服务器。一 旦一个g n u t e l l a 主机连接到g n u t e l l a 网络中,就能够自由而且平等地同其它主 机交换文件。 第1 3 页 硕士毕业论文第三章g n u t e l l a 介绍 一个g n u t e l l a 主机通过同g n u t e l l a 网络中一个或多个主机建立连接加入到 g n u t e l l a 网络中,由于不像n a p s t e r 有中央服务器提供文件索引和查询功能, g n u t e l l a 网络中的节点首先必须查明所需要的文件在网络的什么地方,然后才能 c o m p u t e r d 设法得到。 在图中,c o m p u t e ra 发送一个“s e a r c h ”消息给所有与之连接的主机 ( c o m p u t e rb ,c ,d ) ,接收到“s e a r c h ”消息的c o m p u t e rb 则将这则消息继 续转发给与它相连接的主机( c o m p u t e re ,f ) ,通过这种方式“s e a r c h ”消息在 相连着的节点间不断传播。当然这个消息不会无止境的传播下去,消息中包含有 一个“1 1 m et ol i v e ”字段( t t l 字段) ,每次转发节点都将t 丁l 字段递减,当 t t l 字段减为0 时,该消息也就不再被继续传播了。当一个节点包含有同 “s e a r c h ”消息相匹配的文件时,节点就会发送一个“s e a r c hr e s u l t ”消息,该 消息沿着“s e a r c h ”消息传递过来的路径原路返回。一旦“s e a r c hr e s u l t ”消息 传递到发送“s e a r c h ”消息的节点,该节点就可以从含有文件的节点直接建立连 接,下载目标文件。图中,c o m p u t e r a 从c o m p u t e re 中直接下载了一个文件。 在g n u t e l l a 协议中共有五种消息被定义,分别是p i n g ,p o n g ,q u e r y ( s e a r c h ) ,q u e r y h i t ( s e a r c hr e s u l t ) 和p u s h ,它们将在下一节中被详细阐述。 g n u t e l l a 节点间的连接都采用t c p i p 连接,在节点间连接的初始化过程中h t t p 消息“c o n n e c t ”、“o k ”、“g 盯”、“g i v ”将被使用到。 3 2 1g n u t e l l a 节点的结构 第1 4 页 硕士毕业论文 第三章g n u t c l l a 介绍 g i l u t e i bp e e r 图表3g n u t e l l a 节点结构图 如上图所示,在一个g n u t e l l a 节点中最多有四类并发的进程存在:连接处理 器( c o n n e c t i o nh a n d l e r ) 、协调进程( c o o r d i n a t i o ni n s t a n c e ) 、下载进程 ( d o w n l o a di n s t a n c e ) 和上载进程( u p l o a di n s t a n c e ) 。 连接处理器负责管理所有连接的建立工作,包括自身发起的以及其它节点发 起的连接。每个协调进程则负责处理某一条具体的用于握手、查询的连接的活动 以及状态。当这个节点需要上载文件或者下载文件时,一条相应的上载连接或下 载连接将被建立,该连接的所有活动、状态也将由一个上载进程或下载进程来进 行监控。 值得注意的是,在同一时间,节点中有且仅有一个连接处理器,但可能会有 0 个或多个协调进程、下载进程或上载进程。 3 2 2g n u t e l l a 节点的连接处理器 第1 5 页 硕士毕业论文第三章g u t e | l a 介绍 图表4 连接处理器状态转移图 上图给出了连接处理器( c o n n e c t i o nh a n d l e r ) 的状态转移图。连接处理器 共有六个状态:“o f f l i n e ”、“w a i t i n gf o ra c k ”、“p i n g ”、“o n l i n e ”、“s e a r c h ”和 “c o n n e c t i o nr e q u e s t ”。当g n u t e l l a 的节点同个或多个其它节点建立连接时, 它的状态就是“o n l i n e ”。同时连接处理器还存有一个全局变量“c c o u n t ”,用来 保存当前的连接数。 开始的时候,连接处理器的状态为“o f n i n e ”,变量c c o u n t 的值为0 。它通 过发送出一个h t t p 的“c o n n e c t ”消息向远端的一个节点发出连接请求,同 时它的状态转变为“w a i t i n gf o ra c k ”。如果连接发生错误,由于变量c c o u n t 的 值仍然为0 ,连接处理器的状态就会转回到“o 俏i n e ”。如果远端的节点返回个 h t t p 的“0 k ”消息作为响应,说明请求建立的连接已经建好,连接处理器会将 变量c c o u n t 的值递增,同时连接处理器的状态将会转为“o n l i n e ”。至于新建立 起来的连接,节点会发起一个新的协调进程来对之进行管理和监控。 当一个节点需要进行查询时,该节点首先会将连接处理器的状态转为 “s e a r c h ”,然后将具体的操作交给每一个协调进程来实现,当所有的协调进程 通过所管理的连接将查询请求发送给每一个与之相邻的节点,并且接收到返回查 询结果,节点就会将连接处理器的状态转回为“o n l i n e ”。 第1 6 页 硕士毕业论文第三章c m u t c | l a 介绍 节点会在所有的查询结果中选择需要下载的文件,如果含有该文件的节点没 有隐藏在一个防火墙后面,那么连接处理器会根据查询结果中包含的远端节点的 t c p i p 连接信息用h t t p 的g e t 消息发起建立连接,连接成功创建之后会移交 给一个新的下载进程( d o w n l o a di n s t a n c e ) 处理。如果含有相关文件的远端节 点躲在一个防火墙后面,那么一个相应的p u s h 请求将被发送。 协调进程的终结将导致变量c c o u n t 的值递减,当更改后的变量c c o u n t 的值 大于0 时,连接控制器的状态将始终为“o n l i n e ”,一旦c c o u n t 的值递减为o , 连接控制器的状态将变为“o f f i n e ”。 当远端的一个节点请求发起一个连接,连接控制器的状态将变为“c o n n e c t i o n r e q u e s t ”。如果远端节点送来一个c o n n e c t 消息,那么一个o k 消息将会作 为响应被送回,变量c c o u n t 将会递增,该连接将会被移交到一个新的协调进程 ( c o o r d i n a t i o ni n s t a n c e ) 中。如果远端节点送来的是一个g e t 消息,那么该 连接将被移交到一个新的上载进程( u p l o a di n s t a n c e ) 中。如果远端节点送来 的是一个g i v 消息,那么该连接将被移交到一个新的下载进程( d o w n l o a d i n s t a n c e ) 中。如果远端节点送来一个无效的信息或者连接发生错误,那么该连 接将被关闭。以上任何一种情况完成之后,连接控制器的状态将会改为“o n l i n e ”。 3 2 3g n u t e l l a 节点的协调进程 协调进程有两个状态:“w a i t i n gf o rm e s s a g e ”和“t e r m i n a t e ”。 当一条用于节点间握手通讯的连接建立起来的时候,一个协调进程同时也被 创建,用于管理该新连接的所有活动和状态。 协调进程在创建初期处于“w a i tf o rm e s s a g e ”状态,在这个状态下,协调 进程会收到五种消息,它们分别是p i n g 、q u e r y ( s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论