(计算机应用技术专业论文)基于p2pbittorrent协议文件共享系统的研究与实现.pdf_第1页
(计算机应用技术专业论文)基于p2pbittorrent协议文件共享系统的研究与实现.pdf_第2页
(计算机应用技术专业论文)基于p2pbittorrent协议文件共享系统的研究与实现.pdf_第3页
(计算机应用技术专业论文)基于p2pbittorrent协议文件共享系统的研究与实现.pdf_第4页
(计算机应用技术专业论文)基于p2pbittorrent协议文件共享系统的研究与实现.pdf_第5页
已阅读5页,还剩88页未读 继续免费阅读

(计算机应用技术专业论文)基于p2pbittorrent协议文件共享系统的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

。 j 独创性声明 删j j j j j 删 y 18 0 2 4 9 0 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 为获得电子科技大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 血薹鲁日期:如卜年s 月冲日 论文使用授权 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁 盘,允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文 的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或 扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名: 壹豸釜 导师签名: 日期:加7 , j 一 摘要 摘要 当今时代,因特网技术的发展呈现出日新月异的面貌,而p 2 p 的出现更是作 为一项崭新的革命性成果在业界掀起了轩然大波,它被广泛应用于我们的日常生 活当中并将日趋完善。p 2 p 即对等网络或者对等计算,可以简单的定义成通过直接 交换来实现不同计算机网络系统之间的资源和服务共享。p 2 p 的应用范围主要集中 在共享、搜索及存储等方面,现在我们耳熟能详的许多网络游戏、q q 、p p l i v e 等 都是p 2 p 技术的具体应用,它极大的便利及丰富了我们的日常生活。 p 2 p 模式相对于c s 模式来说,摒弃了之前的s e r v e r c l i e n t 的理念,让每一 个参与文件下载的用户都为整个网络的下载做出贡献,而使用p 2 p 协议的文件服 务器的性能也不会再受负荷、带宽的影响。它高效地利用了闲置资源,解决了 i n t e r n e t 上各节点之间必须通过服务器而不能直接的对资源进行共享的问题,使用 p 2 p 技术,用户可以方便、快捷的在i n t e r n e t 上查找、获取和发布数据等资源。 本文在剖析p 2 p 的现状及未来发展趋势的基础上,研究了p 2 p 关键技术中现 有的四种网络拓扑结构以及在此基础上的两种有代表性的资源搜索算法:d h t 搜 索算法和洪泛算法;研究了现有的文件共享技术所使用的常见的几种协议: n a p s t e r 、g n u t e l l a 、e m u l e 和b i t t o r r e n t 协议;其中,b i t t o r r e n t 是一个文件分发协 议,它主要是通过采用u r l 来识别内容的方式,以求实现和网络无缝结合的目的, 它的主要优势在于:诸多下载者之间在下载同一个文件的同时可以为其他下载者 提供种子,由此大大的提高了下载速度;文章还研究了b t 文件共享系统的组成、 工作原理等相关知识。b t 是现如今几乎老少皆知的一种基于p 2 p 技术的下载工具, 下载的人越多,种子越多,下载速度也就随之而变得越快。 最后,本文结合p 2 p 技术的相关理论和技术,设计一个基于b i t t o r r e n t 协议的 文件共享系统,并对该系统的组成、结构进行了全面的叙述和解释。同时针对于 传统的b t 文件系统中,t r a c k e r 服务器自身面临的问题,我们结合d h t 网络的基 础知识,提出了对t r a c k e r 服务器进行d h t 拓扑排序的新方案,用于减轻t r a c k e r 服务器自身的压力和负载,提高系统的效率和稳定性。经过实验发现,经过改进 的b t 文件共享系统具有稳定,可靠,高效等诸多特点。 关键词:p 2 p 技术,b i t t o r r e n t 协议,文件共享系统 a b s t r a c t a b s t r a c t i nt h i se r a ,t h ed e v e l o p m e n to f i n t e m e ti sa m a z i n g ,w h i l et h ee m e r g e n c eo f p 2 pi s an e wr e v o l u t i o n a r ya m o n gt h i sw h i c hh a v ea t t r a c t e dp e o p l e s a t t e n t i o nt oav e r yr e a l e x t e n t p 2 p ( t h a ti sa l s oc a l l e dp e e r - t o p e e rn e t w o r ko rp e e r - t o p e e rc o m p u t i n g ) i s w i d e l ya p p l i e dt oo u rd a i l yl i f ea n di sa c h i e v i n gm a t u r i t yd a y b y d a y ,w h i c hc a n a c h i e v e t h ep u r p o s eo f s h a r i n ga l ls o r t so f r e s o u r c e sa n ds e r v i c e st h r o u g hd i r e c te x c h a n g eb e t w e e n t w oc o m p u t e r sm i g h t i l yb e l o n g i n gt od i f f e r e n ti n t e r n e ts y s t e m s n o wt h ep 2 pa p p l i c a t i o n s c o p em a i n l yc o n c e n t r a t e si ns o m ea s p e c t ss u c ha sf i l es h a r i n g ,r e s o u r c es e a r c h i n g ,a n d m e m o r ys p a c e ,e t c s o m eo n l i n eg a m e s ,q q ,p p l i v ea r ea l lt h es p e c i f i ca p p l i c a t i o no f p 2 p t e c h n o l o g y ,w h i c hg r e a t l yf a c i l i t a t e da n de n r i c h e do u rd a i l y l i f e c o m p a r i n g t ot h ec sm o d e l ,p 2 pm o d e la b a n d o n e dt h ef o r m e rs e r v e r c l i e n ti d e a , i nw h i c he a c hp a r t i c i p a t i o ni nd o w n l o a da c t i v i t i e sm a k eac o n t r i b u t i o nt ot h ee n t i r e n e t w o r k sd o w n l o a d i n ga b i l i t y w i t ht h ep 2 pp r o t o c o l ,t h ef i l es e r v e r sp e r f o r m a n c ei sn o l o n g e ra f f e c t e db yt h ec a p a c i t ya n db a n d w i d t ho ft h en e t w o r k ,a sar e s u l t ,t h ei d l e r e s o u r c e sc a nb eh i g h l yt a k e na d v a n t a g eo f t h r o u g ht h i sp e o p l es o l v e dt h ei s s u et h a ti nt h ep a s tt h es h a r i n go f r e s o u r c e sb e t w e e n a n yt w op e e rc o u l d n te x c h a n g ed i r e c t l yb u tm u s tp a s st h r o u g ht h es e r v e r w i t hp 2 p t e c h n o l o g y ,u s e r sc a nd i s c o v e r ,a c c e s st oo rr e l e a s ea n yk i n d so f r e s o u r c e so nt h ei n t e r a c t v o l u n t a r i l y o nt h eb a s i so ft h ea n a l y s i so ft h ec u r r e n ts i t u a t i o na n dd e v e l o p m e n t a lt r e n do fp 2 p t e c h n o l o g y ,f i r s t ,t h ep a p e ri n t r o d u c e ds o m ek e yt e c h n i q u e so fp 2 pi n c l u d i n gf o u rt y p e s o fn e t w o r kt o p o l o g ya n dt h e c o n s e q u e n t i a lt w or e p r e s e n t a t i v er e s o u r c e s e a r c h i n g a l g o r i t h m s :d h ta l g o r i t h ma n dt h ef l o o d i n ga l g o r i t h m ;s e c o n d ,t h ep a p e rs t u d i e dt h e e x i s t i n gf o u rp r o t o c o l su s e di nt h ef i l e - s h a r i n gt e c h n o l o g y :n a p s t e r ,g n u t e l l a ,e m u l e ,a n d b i t t o r r e n t b i t t o r r e n t ,w h i c hi sa l s oc a l l e db t ,i saf i l ed i s t r i b u t i o np r o t o c o l ,a n di tc a n d i s t i n g u i s hv a r i o u sc o n t e n t sb ym e a n so fu r l i no r d e rt oa c h i e v es e a m l e s si n t e g r a t i o n w i t ht h en e t w o r k t h ep r i n c i p a la d v a n t a g eo fb ti st h a te a c hu s e rd o w n l o a d i n gt h es a m e f i l ec a np r o v i d es e e df o ro t h e ru s e r sa tt h es a m et i m e ,t h r o u g hw h i c ht h ee n t i r es p e e di s g r e a t l yi m p r o v e d ;t h i r d ,t h ep a p e ra l s os t u d i e dt h ec o m p o s i t i o n ,w o r k i n gp r i n c i p l ea n d t i o t h e rr e l a t e dk n o w l e d g eo ft h eb t f i l e s h a r i n gs y s t e m ,b ti sat y p eo fd o w n l o a dt o o l b a s e do np 2 p t e c h n o l o g y ,a n di ti ss op o p u l a rt h a ta l m o s te v e r yn e t i z e nk n o w si t t h em o r e p e o p l ed o w n l o a d i n g ,t h em o r es e e d s ,a l s ot h ef a s t e rs p e e d f 1 n a l l y ,c o m b i n i n gw i t ht h er e l e v a n tt h e o r i e sa n dt e c h n i q u e so fp 2 p ,t h e p a p e r d e s l g n e daf i l e 。s h a r i n g s y s t e mb a s e do nt h eb i t t o r r e n t p r o t o c o l , a n dm a d ea c o m p r e h e l l s l v en a r r a t i v ea n de x p l a n a t i o no ft h ec o m p o s i t i o na n dm es 咖c t u r eo ft h e s y s t e l l l a tt h es a m et i m e ,c o n c e r n i n gt h ei s s u e st h et r a c k e r s e r v e rc o n f r o n t e di t s e l f i nt h e t r a d i t i o n a lb t f i l i n gs y s t e m ,c o m b i n i n gw i t ht h eb a s i ck n o w l e d g eo fd h t n e t 、) l ,o r k t h e p a p e rp r o p o s e dap r o g r a mc a r r y i n go nt h ed h t t o p o l o g i c a ls o r t i n gt ot h et r a c k e rs e 眈 w h l c hi st or e d u c et h ep r e s s u r ea n dt h el o a do f t h e t r a c k e rs e r v e r ,i na d d i t i o n ,t h es v s t e r n s e f f i c i e n c ya n dt h es t a b i l i t yi s h i g h l yr a i s e dt o o a c c o r d i n gt ot h e e x p e r i m e n tw e d l s c o v e r e dt h a tt h ep 2 pf i l es h a r i n gs y s t e mw ed e s i g n e di s s t a b l e , r e l i a b l e ,a n dh i g h l v k e y w o r d s :p 2 pt e c h n o l o g y ,b i t t o r r e n tp r o t o c o l ,f i l e ss h a r i n gs y s t e m i i i 目录 目录 第一章绪论1 1 1 课题背景1 1 2 国内外研究现状2 1 2 1 国外研究现状3 1 2 2 国内研究现状3 1 3 论文主要研究内容4 1 4 论文结构4 第二章p 2 p 概述6 2 1p 2 p 的基本知识6 2 1 1p 2 p 的定义6 2 1 2 三种网络计算模式的演变6 2 1 3p 2 p 模式与c s 模式的比较7 2 1 4p 2 p 技术的特点9 2 2p 2 p 的网络拓扑结构1 0 2 2 1 中心化拓扑结构1 0 2 2 2 全分布式非结构化拓扑结构1 1 2 2 3 全分布式结构化拓扑结构1 2 2 2 4 半分布式拓扑结构1 3 2 2 5 四种结构类型的比较1 5 2 3 资源搜索算法1 5 2 3 1d h t 搜索算法1 5 2 3 2 泛洪搜索算法:1 7 2 4p 2 p 与文件共享1 9 2 4 1 文件共享技术原理1 9 2 4 2 文件共享使用的协议2 0 2 5 本章小结2 2 第三章b t 文件共享系统分析2 3 i v 目录 3 1b t 文件共享系统的组成及内部联系2 3 3 2b e n c o d e i n g 的编码规则2 4 3 3 静态种子文件的构成2 5 3 4 客户端与t r a c k e r 服务器的工作原理2 7 3 5p e e r 与t r a c k e r 服务器之间的通讯协议2 9 3 6 节点间的对等协议3 l 3 7 本章小结3 3 第四章基于盯协议的p 2 p 文件共享系统设计3 4 4 1 总体概述3 4 4 2b t 文件共享系统的需求分析3 5 4 3 系统原理分析3 5 4 3 1b t 文件共享系统的组成3 5 4 3 2b t 文件共享系统中文件下载的过程分析和设计3 6 4 4 系统总体设计4 0 4 4 1 客户端程序4 0 4 4 2t r a c k e r 服务器端程序4 2 4 5 关键技术说明4 4 4 5 1 基于h t t p 协议的通信技术4 4 4 5 2w i n s o c k 网络编程技术4 6 4 5 3 多线程程序设计技术4 7 4 6 本章小结4 7 第五章基于b t 协议的p 2 p 文件共享系统的实现及优化4 8 5 1p e e r 客户端的实现4 8 5 1 1 网络管理模块4 8 5 1 2 种子处理模块4 8 5 1 3t r a c k e r 通信模块5 0 5 1 4p e e r 通信模块5 4 5 1 5 文件下载管理模块5 7 5 2t r a c k e r 服务器端的实现5 9 5 2 1 网络管理模块5 9 v 目录 5 2 2 种子处理模块5 9 5 2 3p e e r 通信模块6 l 5 3 主要算法设计和优化6 3 5 3 1 文件片段选择下载算法的设计和优化6 3 5 3 2 文件块分配算法的设计和分析6 7 5 4 改进的文件共享系统7 0 5 4 1 系统描述7 0 5 4 2 系统分析7 2 5 5 模拟实验测试结果和分析7 3 5 5 1 实验环境7 3 5 5 2 数据收集和处理方法7 4 5 5 3 实验结果和分析7 4 5 6 本章小结7 6 第六章总结与展望7 7 6 1 工作总结7 7 6 2 下一步的研究工作7 7 参考文献7 9 致谢8 2 v l 第一章绪论 第一章绪论 随着i n t e r n e t 的日益普及,文件的下载已成为最常见的应用之一。传统的文件 下载方式一般是将文件从s e r v e r ( 服务器) 端传送到c 1 i e n t ( 客户) 端。在这种方 式下,由于所有用户之间都是通过同一台服务器进行下载,而服务器所能提供给 用户的带宽又是有限的,因此当用户数目超出其所能承载的范围时,系统将变得 不堪重负,进而被迫降低下载速度。为了解决这种问题,p 2 p 技术应运而生,它从 根本上突破了传统的文件下载局限。目前基于b t 协议的文件下载软件已经被广泛 使用,它所应用的核心技术正是p 2 p 技术,这类软件如b t 彗星等。在这种应用软件 中,文件的下载速度不但不会降低,反而会随着用户数目的不断增加而不断得到 提高。 1 1 课题背景 近几年来,由于计算机网络技术的飞速发展、电脑硬件等设施价格的不断下 降以及人民生活水平的持续提高等多种因素,接入计算机网络中的设备、计算单 元的个数和类别也越来越多,信息资源的取得和发布也变得十分便利和迅捷, i n t e m e t 已经日渐渗透到人们的日常生活、学习和工作中。基于i n t e m e t 的多种应用 通过对信息资源的收集、存储、传输、加工和利用,在全球范围内把各个国家和 地区更加紧密地联系在一起,并迅速影响着人类社会的方方面面。i n t e m e t 上的信 息资源几乎呈爆炸性的增长趋势,现有的c s 模式已经变得很难满足和支持大规模 范围的网络应用,分布式计算变成了一种新的商业需求。i n t e r n e t 应用的新趋势就 是将服务器与客户机的概念逐步剥离,用“网络就是计算机”的概念来取代,即 将整个i n t e r n e t 的自治资源和系统之间相互组合起来,以实现资源共享。p 2 p ( p e e r - t o p e e r ) 计算模型正是在网络资源规模不断加大的情况下,为了解决海量 信息资源的合理开发利用问题而提出的分布式计算模型。在p 2 p 模式下,服务器与 客户机的界限被取消了,网络应用的核心已经开始从服务器端转向网络终端设备 边缘化,没有再依赖于集中式服务器。成员之间互相协作,直接从其它的成员那 里获益。由于数据存储、处理和网络带宽等均是以一种完全分散、异步的方式来 运行,各种负载就可以得到合理的均衡,合理高效地解决了资源服务的一系列瓶 电子科技大学硕士学位论文 颈问题,并可以加以扩展。 p 2 p 的概念并不仅仅局限于文件共享,它被广泛应用于网络电话、网络视频, 互动娱乐等多个领域。它在网络上的对等节点之间共享资源和服务,其中用来共 享的计算机资源包括c p u 的计算能力、存储器和磁盘等。p 2 p 网络是一种分布式 的动态网络体系结构,网络中的参与者动态地共享它们之间的部分资源( 包括c p u 、 存储器、网络带宽、外部设备、软件、服务等等) ,并且这些资源直接被其对等节 点访问而无需中介参与,从而网络的各个参与者既是资源的生产者,又是资源的 消费者。 近年来,p 2 p 技术的发展日新月异,p 2 p 技术已成为了目前计算机领域的关注 焦点之一,其主要原因在于它具有充分利用网络上的各种资源和网络带宽等诸多 优点。目前p 2 p 应用已经成为i n t e m e t 的主要应用之一,基于p 2 p 的应用是越来越 多,b i t t o r r e n t 、e m u l e 、e d o n k e y 、q q 、m s n 等等各种应用目前已经被人们所熟悉。 c a c h e l o g i c 公司曾经进行过一项统计,统计数据表明当前p 2 p 软件流量已经占据了 超过半数的网络带宽,而全球最广泛应用的p 2 p 文件分发软件e m u l e 和b i t t o r r e n t 所产生的流量又占据了p 2 p 总流量的半数以上。目前,全球关于p 2 p 的研究项目 日益增多,应用范围也愈来愈广。在不久的将来,伴随着对p 2 p 研究的进一步深 入,p 2 p 的研究和应用必将迎来一个崭新的阶段。 1 2 国内外研究现状 p 2 p 技术在i n t e r n e t 的历史中是一门新兴的技术,由于众多学术研究机构及企 业的积极参与,自2 0 0 0 年开始,国内外出现了多个p 2 p 产品,其中以国内k u g o o 、 o p e n e x t 、p o c o 和国外n a p s t e r 、o p e n c o l a 、g r o o v e 等为典型的p 2 p 产品,仅仅 经过了几年的时间,注册的用户数量持续增长,已经成为众多网民上网必不可少 的软件。在传统的文件下载方式中,文件下载请求服务必须由一台s e r v e r 来提供, 用户需要下载的文件、资源等要事先存放在s e r v e r 上。用户通过t c p 协议或u d p 协议和s e r v e r 建立连接并开始传输数据,这种方式带来的最大不利之处在于 s e r v e r 的压力太大。而p 2 p 协议的核心概念就是摒弃之前s e r v e r c l i e n t 的理念, 让每一个参与到其中的用户都为整个网络的下载做出贡献,而使用p 2 p 协议的服 务器的性能也不会再受负荷、带宽的影响,从而高效的利用了闲置资源,解决了 i n t e m e t 上各节点之间必须通过服务器而不能直接地对资源进行共享的问题,使用 p 2 p 技术,用户可以方便、快捷的在i n t e m e t 上查找、获取和发布数据等资源【2 】。 2 第一章绪论 1 2 1 国外研究现状 国外进行p 2 p 技术研究的学术团体主要包括全球网格论坛( g g f ) 、p 2 p 工作 组( p 2 p w g ) 。p 2 p w g 的成立,主要是为了加速p 2 p 的相关基础设施创建和进行一 系列的标准化工作。p 2 p w g 成立之后,统一了p 2 p 计算中的各种术语,也初步形 成了相关的一些草案,但是却在标准化工作等方面进展缓慢。目前g g f 已经和 p 2 p w g 进行了合并,由该论坛负责与p 2 p 计算相关的工作,而由g g f 管理p 2 p 计算和网格计算等相关的标准化工作。 国外的公司在p 2 p 计算的研发工作上也投入了大量精力和物力,其中i n t e l 公 司、s u n 公司和m i c r o s o f t 公司投入较大。i n t e l 公司于2 0 0 0 年8 月宣布成立了p 2 p 工作组,拉开了本公司研究p 2 p 工作的序幕,并于2 0 0 2 年研究并发布了p 2 p 安全 a p i 软件包和p 2 p 加速工具包,从而使得微软n e t 研发人员可以方便快捷地对p 2 p 应用程序进行开发。s u n 公司成立了j x t a 项目,它是一个基于j a v a 的开源p 2 p 平台,这样做的好处是任何组织和个体均可以凭自己的意愿自由加入或退出该项 目。因此,该项目已经得到p 2 p 研发人员的广泛认可和应用。p a s t r y 项目组是 m i c r o s o f t 公司成立的一个主要致力于对p 2 p 计算技术进行研发工作的项目组,它 也为p 2 p 技术的发展做出了卓越的贡献。 1 2 2 国内研究现状 从国内来看,已经有以下三个学术研究机构对其进行研究并取得了一定的成 就,第一个:北京大学m a z e ,m a z e 是一个对等计算文件共享系统,它将对等连 接与中心控制两者相交融,由这所知名学府的网络实验室独立研发。第二个,清 华大学一g r a i l a r y ,g r a n a r y 是一个对等计算存储服务系统,由这所知名学府大学独 立研发。第三个:华中科技大学一a i 】v s e e ,a n y s e e 是一个视频直播系统,它所采 取的服务模式是一对多,而且对防火墙的穿越和部分的n a t 也提供了支持。从企 业研发产品方面上看,在此也列举三个比较著名的产品,第一个:广州数联软件 技术有限公司p o c o ,p o c o 的p 2 p 分享平台是目前国内来说最大的,也是全球 范围内还很少见的盈利p 2 p 平台。第二个,深圳市点石软件有限公司一o p ,它可以 以最快捷的方法找到您想要的音乐、电影、软件、图片、书籍以及各种文档,方 便用户随时随地在线进行文件的共享,容量竟然达到数以亿计。第三个,是现在 广泛流行的p p l i v e ,p p l i v e 是一款共享软件,它可以在i n t e m e t 上进行大规模视 频直播。在基于p 2 p 技术进行文件共享方面,国内也有多家企业将自己的产品推 电子科技大学硕士学位论文 向了市场,目前主要有t o p e r s o n 、k u r o 、j e l a w a t 、e z p e e r 、w o r k s l i n k 、等。 p 2 p 技术在国内还处于刚刚起步的阶段,有着广阔的发展前景,但目前仍然有 一部分人对其认识不够深入,甚至产生了一定的误解。这些问题都可能会成为p 2 p 继续发展的阻碍。例如我们可以想到的安全与管理问题、版权问题等,但是我们 不应该因噎废食。p 2 p 技术也正是在不断出现新问题和解决新问题的过程中,飞速 进步和发展的。从这个方面来说,问题的产生甚至是技术进步的催化剂,并将不 断推动p 2 p 技术使其不断成熟。 1 3 论文主要研究内容 本论文在介绍p 2 p 技术的基本原理、优势地位以及涉及到的几项关键技术的 基础上,着重分析了两种资源搜索算法:d h t 搜索算法和洪泛算法,并针对d h t 算法的工作机制进行了详细的介绍,为后文将d h t 网络的结构化思想运用到我们 的系统中做了理论准备;同时本论文结合当前主流的文件共享技术的协议:b t 协 议,在对其深入理解的基础上进行了剖析,在第五章中对b t 系统中极其重要的片 段选择算法和文件块分配算法进行了介绍和分析,并进行了改进,在一定程度上 解决了其弊端。最后,基于大规模的数字媒体资源,本文设计了一个基于p 2 p 技 术以及b i t t o r r e n t 协议的文件共享系统。经过实验发现,文章中设计的p 2 p 文件共 享系统,具有稳定,可靠,高效等诸多特点。 1 4 论文结构 本论文是按照总共六章的结构来构思,以下是简要介绍: 第一章:绪论,着重介绍了p 2 p 技术的课题背景、作者所做的工作、当前国 内外在这项技术上的投入以及研究现状; 第二章:介绍了p 2 p 技术的相关知识,包括p 2 p 技术与c s 技术的比较、p 2 p 的网络拓扑结构、以及在此基础上所采取的两种基本类型的资源搜索算法,并对 这两种算法进行了详细的阐述;最后,在对文件共享的原理进行简要分析的基础 上,详细阐述了当前文件共享技术所使用的几种基本协议,并为下一章b t 系统的 阐述埋下伏笔; 第三章:对整个b t 文件共享系统进行了全面的介绍和分析,从b t 系统的组 成原理、工作机制等方面入手对其进行了研究; 4 该 设 及 步 5 电子科技大学硕士学位论文 第二章p 2 p 概述 p 2 p 即p e e r - t o p e e r ,也被作为对等网络的代名词而被人们所熟悉,什么是 p 2 p ? 想要对它下一个很确切的定义很难,仁者见仁、智者见智,思考的方式与角 度不同,就会形成不同的观点或理解。在这种网络中,各个结点的角色,行为等 都是对等的。为了说明该问题,举一个简单通俗的例子,一种情况:大家同时抄 一本书,抄完为止;另一种情况:大家相互抄,你抄我抄好的,我抄他抄好的, 这个例子与对等网络的思想有异曲同工之妙。 2 1p 2 p 的基本知识 2 1 1p 2 p 的定义 如上文所说,p 2 p 的定义至今没有一个统一的版本,但是,我们却可以深入理 解它的思想内涵。p e e rt op e e r 即对等网络或者对等计算,简称为p 2 p ,可以简单 的定义成通过直接交换来实现不同系统之间的资源和服务共享。当然,这里的资 源和服务的涵盖范围非常广泛,其中资源包括:c p u 、磁盘空间、甚至缓存等; 而服务不仅包括信息之间的交换,还包括数据计算等。在p 2 p 网络环境中,通过 i n t e m e t 连接的计算机被看作是平等的参与者,它们的地位是彼此对等的,被称为 一个p e e r ,它们承担的任务不单单是服务的使用者,同时它们还作为服务的提供 者。网络上的任何一个节点都被分散地赋予了资源的所有权以及一部分控制权, 突破了传统的必须依靠服务器来传输信息的局限,这样网络拥塞的状况被大大的 降低,同时也大大提高了资源的利用率。i n t e r n e t 的构想就是让i n t e r n e t 上的计算 机彼此之间无需任何的中介就能够自由地进行直接通信。 2 1 2 三种网络计算模式的演变 现如今,网络计算正处于一个迅猛发展的阶段,但是实际上关于它的定义人 们至今还没有达成一致意见,但绝大多数人可以认同的一个观点是:“网络计算” 是把i n t e m e t 连接起来的各种资源和系统进行组合,以实现资源共享、协同工作和 联合计算,为各种类型的用户提供基于i n t e m e t 的多种类型的服务。 6 第二章p 2 p 概述 网络计算模式的演变,至今为止共经历了三个典型阶段并将不断向前发展【3 】。 ( 1 ) 主从式模式( m s ) 在这种模式下,整个系统的构成包括大型主机和微型计算机终端;从i n t e m e t 诞生起到2 0 世纪8 0 年代,计算机对人们来说都是一种近乎奢侈的昂贵消费品, 还没有进入千家万户,同时在当时条件下,计算机的性能比较低,这些都是采用 此种模式的客观现实环境。其中微型计算机终端对大型主机是完全依赖的。 ( 2 ) 客户机服务器模式( c s ) 在这种模式中,系统被严格地区分为两个部分s e r v e r 和c l i e n t ,其工作也 由两部分来共同协作完成,它的基本工作方式是c l i e n t 向s e r v e r 发出一个请求并 被接收后,s e r v e r 对这个请求加以一定的分析和处理,紧接着便将分析处理的结果 反馈给c l i e n t 。在该模式中,c l i e n t 具备相当的计算能力,但是其中重要的计算任 务还是必须要依赖于s e r v e r 来处理。 ( 3 ) 对等计算模式( p 2 p ) 在上面介绍的c s 计算模式中,s e r v e r 的活动是被动地对c l i e n t 的请求做出响 应,从不主动去请求c l i e n t 的协助。而在当前能够充当c l i e n t 这一角色的计算机的 性能已经极大地得到提高,可以跟早期的大型主机相媲美甚至于超过他们的性能, 他们发展到一定程度之后就可以主动的去请求其他对等节点的服务,这就是p 2 p 模式。 2 1 3p 2 p 模式与c s 模式的比较 p 2 p 模式是一种非中心结构的模式,它与c s 模式之间的区别在于【3 j : ( 1 ) p 2 p 网络中,每一个p e e r 节点的地位都是无差别的,它们在对服务发出请 求的同时还可以对其他p e e r 来提供相应的服务,承担着c s 模式中s e r v e r 和c l i e n t 的双重角色,从而在一定程度上弱化了服务器的必须性。 ( 2 ) p 2 p 技术允许用户自由选择加入或者离开网络,它更大的优势在于,参与 网络的每一个用户都可以遨游在网络上的巨大资源库之中,每一个p e e r 的i p 地址 是动态可变的,可以随时从网络上断开而不需要背负任何负担,以及随意地在网 络上传输、发布信息。 ( 3 ) p 2 p 的寻址方式是基于内容的,它的内涵十分丰富。在p 2 p 网络中,当某 个用户要搜索当前所需要的信息时,输入的关键字并非是确切信息的地址而是信 息的内容,p 2 p 软件就会负责把用户的这个请求信息按照特定的规则翻译成目的 7 电子科技大学硕士学位论文 p e e r 的实际地址,当然这个地址以及转换过程对发出这个请求的用户来说是完全 透明的。 p 2 p 模式相对于c s 模式来说,主要的优点在于【47 】: ( 1 ) 资源被高效的利用。在p 2 p 网络上,以往大量的闲散资源变得触手可得, 网络的资源是由所有p e e r 节点所拥有资源的总和构成,这个数量相当巨大。而c s 模式下,这些数目巨大的闲置资源就被浪费掉了,使之未能得到充分的利用。 ( 2 ) 伴随着新加入的节点越来越多,在c s 模式下,当服务器所承受的压力超 过临界点时,可能由此导致服务器崩溃,进而引起整个网络不能正常运行。而反 观p 2 p 网络,每一个p e e r 的加入都会对系统做出贡献,所以,新加入的节点越多, 网络的性能不仅不会下降反而会随之上升! ( 3 ) p 2 p 网络的寻址方式是基于内容的,用户在搜索信息时需要提供的不是某 一个具体的物理地址,而是一个信息标识,任何一个标识都对应着一个节点的集 合,这些节点都包含了这类请求的信息,从而资源标志方法得到了统一。 ( 4 ) c s 模式中,服务器是网络的中心节点,离开了它,网络也就失去了存在的 意义。而在p 2 p 网络中,服务器的功能则遭到了削弱,甚至可以完全排除服务器 的存在,网络中的任何两台计算机都彼此互为服务器以及客户机,哪怕是当前只 剩下一个p e e r ,网络也处于活动状态,p e e r 的所有者可以随心所欲地发布信息到 网络上。 但是,尽管p 2 p 的优点如此众多,它也存在着自己的缺陷。第一,p 2 p 管理 起来比较复杂,由此导致的是p 2 p 网络中数据的安全性难以保证,而对c s 网络 来说,绝大部分的工作只在于对服务器的管理以及维护。第二,由于p e e r 的加入 和退出网络是自由的,由此可能会造成的后果是信息存在和网络带宽的不稳定性。 第三:安全问题,由于p 2 p 软件本身的漏洞,p 2 p 软件的安全问题主要集中在编写 软件的时候部分代码或者软件的工作原理上,容易遭受黑客攻击;另外,目前p 2 p 软件是传播病毒和木马的一个主要途径,木马可以轻易地包含在电影和图片中, 一旦你下载了这些电影和图片,电脑就会被种上木马。因此,必须提供一定的安 全策略来尽可能低地避免出现这些问题。 p 2 p 技术与c s 技术性能比较如下表2 1 所利4 1 。 第二章p 2 p 概述 表2 1p 2 p 技术与c s 技术性能比较 性能比较 数据发布数据接收数据互动性数据及时性数据安全性 p 2 p 好 中好好差 c s差 好 差差 好 性能比较数据更新数据质量数据覆盖率成本控制管理方便性 p 2 p 好 中差 好差 c s差 好好差好 2 1 4p 2 p 技术的特点 对等计算模式具有极大的优势,因此也具有更加广阔的发展前景,它的特点 主要体现在如下几个方面: ( 1 ) 非中心化:i n t e r n e t 上的信息和资源的分布被均衡的分散在所有的对等结 点上,所有操作都是直接发生在两个对等结点之间,这个过程中无需s e r v e r 的介 入,从而摆脱了在传统模式下需要担忧的瓶颈问题。 ( 2 ) 可扩展性:网络中的用户数目越多,所产生的需求也就越多,但是,用 户的数量和服务的质量之间不是此消彼长的关系,而是相得益彰的关系,可以这 样解释:用户越多,贡献的资源越多,所能查找的资源库越巨大越方便,服务的 质量也就得到相应的提升,我们可以做出这样一个假设:在理论上其可扩展性是 不存在任何限制的。 ( 3 ) 健壮性:当网络中出现失效节点时,p 2 p 网络能够对此做出主动响应, 调整网络拓扑结构以保持整个网络的连通性,从而避免了出现网络瘫痪的状况。 p 2 p 网络中的组成成员不是固定不变的,节点的加入和退出都不是强制性的,而是 可以自由选择,这样的一种灵活的组织方式保证了网络具有一定的抗攻击能力。 ( 4 ) 高性价比:i n t e r n e t 中密集的散布着海量的普通节点,这些节点相互独立, 彼此间对对方所拥有的资源、信息是不可知的,因此要实现共享也就存在着很大 的障碍,但是在p 2 p 架构中,这些障碍将被扫清,它不仅使网络上的资源变得可 知,并且最充分的利用了这些空闲的资源和计算能力,实现了海量存储、自由下 载的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论