(计算机应用技术专业论文)p2p局域网文件共享系统的研究与实现.pdf_第1页
(计算机应用技术专业论文)p2p局域网文件共享系统的研究与实现.pdf_第2页
(计算机应用技术专业论文)p2p局域网文件共享系统的研究与实现.pdf_第3页
(计算机应用技术专业论文)p2p局域网文件共享系统的研究与实现.pdf_第4页
(计算机应用技术专业论文)p2p局域网文件共享系统的研究与实现.pdf_第5页
已阅读5页,还剩64页未读 继续免费阅读

(计算机应用技术专业论文)p2p局域网文件共享系统的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

o j :il 西华大学学位论文独创性声明 1 1 1 11111 1 1 11 11 11 1 1111i 17 5 0 2 7 8 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意。 嚣篓警黼搿参7 劣 日期:1 力co 6 。1 日期 1 刀f d 厶、。 西华大学学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,在校 攻读学位期间论文工作的知识产权属于西华大学,同意学校保留并向国家 有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,西 华大学可以将本论文的全部或部分内容编入有关数据库进行检索,可以采 用影印、缩印或扫描等复印手段保存和汇编本学位论文。( 保密的论文在解 密后遵守此规定) 学位论文作者签名:虐富嗡指导教师签名: 日期:加b 1 嗍枷 谚 摘要 随着信息化建设的推进,各单位内部局域网相继建成,并通过统一出口接入i n t e r n c t ; 随着互联网的发展和普及,互联网的用户数和网络数据量急剧增加,当前的网络的主流 c s 模式服务器端负担越来越重。为此,一种基于端的无中心的p 2 p 网络计算模式成为 当前研究的热点。而p 2 p 文件共享技术无疑是其中的最重要的研究问题之一。 当前,人们往往选择从i n t e m e t 上下载所需资源,而忽略了身边存在的巨大资源, 这就是局域网内各用户所拥有的资源。但是由于没有一个统一的共享平台,无法把这些 资源统一组织起来提供给局域网内用户使用。本文正是为了解决局域网内各用户资源方 便地实现共享的问题,在对现有的p 2 p 技术发展现状以及主流的文件共享系统实现模式 进行分析的基础上,实现了一种基于j x t a 平台下的p 2 p 局域网文件共享系统。本文主 要从以下几个方面展开课题研究: 1 ) 阐述了本人对p 2 p 程序设计与j x t a 技术规范理论的研究,这些理论研究包括 p 2 p 的定义,分类,结构,现状未来以及j x t a 的设计目标,虚拟网,分层结构,安全 性,协议等等。同时阐述了本人基于这些理论基础和j x t a 开源项目而研究的p 2 p 计算 平台j x t a n e t f r m a w e o r k 参考实现的设计与部分代码实现,其中设计包括逻辑架构, 点,点发现协议,安全服务等。 2 ) 如何高效地搜索p 2 p 网络上的资源是p 2 p 网络实现的最为关键的问题。非结构 化的对等网络,一般以广播方式作为其搜索的基本策略,引发较大的网络流量和盲目性。 针对以上问题,引入人工智能领域的蚁群算法,利用蚂蚁信息素的多样性和正反馈机制, 有效的指导节点选择查询,以便更快地找到查询结果。仿真结果表明,该算法有效地减 少了查询带来的网络流量和盲目性,提高了查找的成功率。 关键词:p 2 p ;j x t a ;对等点;蚁群算法;文件共享 c e n t e rb e c o m e sah o ts p o to f c u r r e n tr e s e a r c h s ot h ep 2 pf i l e s h a r i n gt e c h n i q u eb e c o m e so n eo f t h em o s ti m p o r t a n tr e s e a r c hp r o b l e m sa m o n gt h e mu n d o u b t e d l y u s u a l l y ,p e o p l ed o w n l o a dt h ef i l e sw h i c ht h e yn e e df r o mi n t e m e t , b u td o w n l o a d i n g f i l e f r o mi n t e r a c tc o s tp e o p l em u c ht i m ea n dm o n e yb e c a u s eo ft h el o wt r a n s m i s s i o nr a t e i n f a c t ,t h e r ee x i t sah u g en u m b e ro ff i l er e s o u r c ei nt h el 蝌b u tw i t h o u t au n i f i e ds h a r i n g p l a t f o r m ,c a np u tt h e s e r e s o u r c e so r g a n i z e dt op r o v i d eu n i f o r ml 必u s e r s n l i sp a p e rd e s i g na l a nf i l es h a r i n gs y s t e mb a s e do np 2 pt or e s o l v et h i sp r o b l e m b a s e do nt h ea n a l y s i so ft h e d e v e l o p m e n t s t a t u so f t h ec u r r e n tp 2 pn e t w o r kt e c h n o l o g ya n dr e a l i z a t i o nm o d eo f c u r r e n tp 2 p f i l e s h a r i n gp r o g r a m d e s i g nak i n do fd e s i g na n d r e a l i z a t i o no nj x t ap l a t f o r mf o rap 2 p f i l e s h a r i n gl a n i nt h ef o l l o w i n g ,t h e r ea r es e v e r a ls t u d i e sp r e s e n t e di nt h i sp a p e r 1 、,n l ep a p e re x p o u n d e do nt h et h e o r e t i c a ls t u d yo np 2 pp r o g r a m m i n ga n dt h ej x t a t e c h n o l o g y , i n c l u d i n gp 2 p sd e f i n i t i o n s ,c l a s s i f i c a t i o n s ,s t r u c t u r e ,f u t u r ea n dj x t a s o b j e c t i v e s ,v i r t u a ln e t w o r k ,h i e r a r c h y ,s e c u r i t y ,p r o t o c o l ,a p i sa n ds o o n ia l s oe x p l a i n e dt h e d e s i g na n ds o m ec o d e so fj x t a n e tf r a m e w o r k r e a l i z a t i o nb a s e do i lt h e s et h e o r e t i e sa n d j x t ao p e ns o u r c cp r o j e c t t l l ed e s i g ni sm a i n l ya b o u tt h e1 0 r 百e a lf r a m e w o r k ,p e e r & p e e rg r o u p c l a s s e s ,p e e rd i s c o v e r ya p i s ,s e c u r i t ys e r v i c ea n ds oo n 2 、h o wt os e a r c ht h er e s o u r c e si nt h ep 2 pn e t w o r k se 伍c i e n t l yi st h ek e yp r o b l e mw h e n t h ep 2 pn e t w o r k sa r ed e v e l o p e d ,u n s t r u c t u r e dp e e r - t o - p e e rn e t w o r k su s u a l l yu s eb r o a d c a s t i n g a si t sb a s i cs e a r c hs t r a t e g ya n dc a u s eal a r g e rn e t w o r kf l o w sa n db l i n d n e s s a n tc o l o n y o p t i m i z a t i o n ( a c o ) i na r t i f i c i a li n t e l l i g e n c ei si n t r o d u c e d , t h i sm e c h a n i s m d i r e c t st h eq u e r y r o u t i n ge f f e c t i v e l ya c c o r d i n gt ot h ed i v e r s i t ya n d t h ep o s i t i v ef e e d b a c kp r i n c i p l eo ft h ea n t p h e r o m o n e i nt h ew a y t h ep e e rr e d u c e dt h eb l i n ds e a r c h s i m u l a t i o nr e s u l t ss h o w 也a tt h e n e w a l g o r i t h mr e d u c e st h en e t w o r kt r a f f i ca n db l i n d n e s sg r e a t l ya n di m p r o v e st h es e a r c h i n g s u c c e s sr a t i o k e yw o r d s :p 2 p ;j x t a ;p e e r s ;a n tc o l o n yo p t i m i z a t i o na l g o r i t h m s ;f i l es h a r i n g 匿华大学硕士学位论文 目录 摘要1 a b s t r a c t i i 1 绪论l 1 1 课题背景1 1 2 本课题研究的目的及意义- 3 1 3 国内外研究现状4 1 3 1 集中式对等网络4 1 3 2 分布式对等网络一6 1 3 3 混合式对等网络7 1 4 本文的研究内容和组织结构8 2p 2 p 相关技术与理论。9 2 1 p 2 p 的概念9 2 2p 2 p 模式与c s 模式的比较9 2 3p 2 p 的分类。1 2 2 4p 2 p 特性1 3 2 5p 2 p 技术的应用1 6 2 5 1 文件共享1 6 2 5 2 对等计算1 7 2 5 3 协同工作1 8 2 5 4 搜索引擎18 2 5 5 即时通信1 9 2 5 6 广域网络存储系统1 9 2 6p 2 p 带来的问题1 9 3 t a 平台。2 2 3 1 三层体系结构2 2 3 2 t a 中的关键概念2 3 3 3 核心协议2 6 4 关键技术研究。2 8 4 1 常见的非结构化搜索算法与缺点2 8 4 2 基于蚁群改进的搜索算法2 9 4 3 仿真与实验3 2 l 一 p 2 p 局域网文件共享系统的研究与实现 5 系统设计3 4 5 1良好p 2 p 系统的设计要求3 4 5 2p 2 p 文件共享系统功能模块的设计3 5 5 3p 2 p 文件共享系统流程设计3 5 5 3 1 文件搜索流程3 5 5 3 2 文件共享流程3 6 5 3 3 文件下载流程3 7 5 4p 2 p 安全和j x t a 下的实现3 8 5 4 1p 2 p 安全3 8 5 4 2j x t a 的p 2 p 安全实现。3 8 6p 2 p 局域网文件系统的实现4 0 6 1 基于p i p e 的编程4 0 6 1 1p i p e 的类型4 0 6 1 2j x t ap i p ea p i 简介4 l 6 1 3p i p e 通信的过程一4 l 6 2 程序开发包p 2 p s o c k c t 的实现4 3 6 2 1p 2 p s o c k e t 开发包的简介4 3 6 2 2p 2 p s o c k c t 的a p i 。4 4 6 3 利用p 2 p s o c k c t 实现的文件共享系统4 5 6 3 1 利用p 2 p s o c k c t 实现即时消息一4 5 6 3 2 利用p 2 p s o c k c t 实现文件操作4 7 6 4 系统功能测试结果5 3 结论5 5 参考文献5 6 攻读硕士学位期间发表学术论文情况5 9 致谢:6 0 i v 西华大学硕士学位论文 1绪论 1 1课题背景 随着网络技术的不断完善,人们已越发的体会到网络给生活带来的快捷与方便,继 传统的媒体之后,互联网已逐渐成为人们获取信息的又一重要来源。近年来,在政府的 大力引导和推动下,电子政务和各企事业单位的信息化建设取得了长足进步,各单位内 部的计算机网络相继建成;伴随着近几年房地产业的繁荣,各个住宅小区的小区宽带建 设也如火如荼的展开。随着网络技术以及i n t e m e t 的发展,越来越多的企事业单位、家 庭都开始使用计算机,并将其融入到工作与生活当中,因而,计算机之间的资源共享日 益频繁。特别值得一提的是,多媒体技术与数字娱乐的发展,极大地推动了人们对资源 共享的需求。 当前网络中占主导地位的客户机服务器模式,由于数据集中存储在各种服务器上, 用户通过连接服务器获取所需的数据,服务器端传输到客户端的数据量很大,而反向的 数据量却非常小,这造成了服务器端不堪重负,成为整个系统的瓶颈。一旦用户数量增 加,整个系统的性能将明显下降:而且一旦服务器发生故障,整个系统将陷于瘫痪。为 此人们提出了一种计算模式一基于目录的分布式模式( d i r e c t o r y - b a s e dd i s t r i b u t e d m o d e l ) 。该模式中,网络资源是分布的,客户机向目录服务器提出服务请求,目录服 务器决定哪个网络资源提供服务,然后客户机独立地与网络资源提供者联系,获取其想 要的服务,系统通过目录服务器均衡客户机流量,让多个网络资源提供者分担客户机的 请求。相对于传统的客户机j r 务器模式和浏览器服务器模式而言,该计算模式中,服 务器性能和带宽瓶颈问题得到了缓和,但是目录服务器仍然是系统访问的热点。 与此同时,计算机硬件以类摩尔定律的速度发展,i n t e r n e t 端系统计算及存储能力得 到了迅速的增强;并且这些端系统的上载带宽、计算资源和存储资源很多时间都处于低 负荷甚至闲置状态,造成了资源的浪费。于是,人们开始考虑利用这些原先被忽视的上 载带宽、计算资源和存储资源,基于端的无中心模式( p c 艘- - b a s e dd e c e n t r a l i z e dm o d e l ) 也就应运而生,该模式也称为对等计算模式( p e c r - t o p e e rm o d e l ) ,即p 2 p 计算模式。 在p 2 p 计算模式中所有节点是对等的,这些节点既是客户机同时又是服务器,称为对等 机( s e r v e r c l i e n t ,s e r v e n t ) ,节点之间通过协作互利的原则共享彼此的资源,其 中的每一个节点( p e e r ) 大都同时具有信息消费者、信息提供者和信息通讯等三方面的 功能。随着各类数字终端、服务器资源、网络带宽等资源持续保持类摩尔定律式的高速 增长,通过更直接的共享方式来提高沟通效率、减少资源浪费并保障信息服务安全将为 p 2 p 局域网文件共享系统的研究与实现 信息社会带来新一轮的发展高潮。而p 2 p 技术恰好能为服务共享、分布式计算和信息交 流提供更灵活高效的模式,也为信息安全带来新的安全保障手段。上述三种计算模式 如图1 1 、图1 2 、图1 3 所示。 客户机 客户机客户机客户机 图1 1 客户机服务器模式 f i g 1 1 c l i e n t s e r v e rm o d e l 客户机 服务器 客户讥 图1 2 基于目录的分布式模式 f i g 1 2d i r e c t o r y - b a s e dd i s t r i b u t e dm o d e l 2 西华大学硕士学位论文 对等机对等机 图1 3 点对点模式 f i g 1 3 p e e r - t o - p e e rm o d e l 随着企业的不断发展,企业文件系统变得越来越庞大。这样,使用p 2 p 技术为企业 办公应用提供便利的文件获取和使用支持就成为本文最主要的目的。 1 2 本课题研究的目的及意义 随着网络技术的发展和网络应用的普及,许多单位都建成了自己内部的局域网,内 部局域网通过一个公共的网关出口连接到i n t e r a c t 上,内网用户共享网络带宽。从整个 互联网范围来看,这种类型的局域网数量巨大。这种i n t e m e t 接入方式,典型的例子包 括企业内部网、校园网、小区宽带接入:这种方式,节约了整个单位的上网费用,并且 便于内部管理;但是,由于所有用户共享网络带宽,在网络通信高峰期,比如说晚上1 9 : 0 0 - - 2 2 :0 0 之间,用户可能会感觉到网速变慢。调查表明,用户经常使用的网络服务 功能中,文件上传或下载服务的使用比例超过3 7 4 ,下载的文件类型包括各种应用软 件、音频、视频文件、游戏等等【2 1 。其实,在局域网内部各用户的p c 机上,这些种类 的资源就非常丰富了,但是目前还没有很好的机制来解决局域网内部资源共享的问题, 传统的文件共享方式,应用于局域网的时候,有诸多不便和缺陷。本文试图设计一种基 于p 2 p 的局域网文件共享系统,在不增加整个系统硬件资源的情况下,通过软件的方式 在现有的局域网系统上实现资源共享,有效地发布各种共享资源,提供给用户方便的资 源查询方式和目录视图。 p 2 p 局域网文件共享系统的研究与实现 h t t p 下载和卸共享方式,都是基于c s 模式的,资源集中存放在服务器上,需要额 外配置一台专门的服务器。当前,i n t e r n o t 上提供资源下载的各大网站基本上都采用这 两种方式。但是,这两种文件共享方式应用于局域网的时候,存在以下几大缺陷: ( 1 ) 当共享资源的数据量特别大的时候,这台服务器需要配置很大的磁盘空间才能 满足要求,而现在大量共享的影音文件所占的磁盘空间是巨大的,如果采用集中式服务 器来实现资源共享,增加了系统的硬件成本; ( 2 ) 资源发布不方便,如某个用户想发布一些共享资源,他得先把文件。上传到服 务器上,如果采用h t t p 方式发布,还需要修改相应的文件发布的w e b 页面。 在局域网内,特别是当网络规模达到一定程度的时候,局域网内部的数据资源是非 常丰富的。但是由于没有一个统一的共享平台,无法把这些资源统一组织起来提供给网 内用户使用。本文试图设计这样一个共享平台,不增加整个系统的硬件成本,有效实现 局域网内各用户资源的共享。这样,当用户需要某个资源的时候,他先在局域网内的共 享平台上搜索,如果找到了,则不必到i n t e r n e t 上去搜索了。局域网内的共享,可以大 大节省用户的查找时间和下载时间,极大地提高用户的效率。当局域网内的资源丰富到 一定程度的时候,用户的资源需求很大一部分可以在网内得到满足,这样,可以极大地 减少整个单位的i n t o n e t 数据流量,节约单位的上网费用,减轻对共享带宽的争夺,改 善网络传输速度。事实上,局域网内各用户的p c 机上,存放有大量的应用软件、音频、 视频文件,以及其他数据资源:如能把这些资源整合起来,提供给网内用户使用,将能 满足很多用户的资源需求。 1 3 国内外研究现状 自从1 9 9 9 年最早的p 2 p 系统n a p s t e r 出现以来,p 2 p 计算模式得到了蓬勃发展。按 照节点集中程度( 节点集中程度是指节点之间相互通信时是否需要中央服务器,对服务 器的依赖程度如何) 可划分为三种类型t 集中式对等网络、分布式对等网络、混合式对 等网络。 1 3 1 集中式对等网络 集中式p 2 p 模式由一个中心服务器来负责记录共享信息以及反馈对这些信息的查 询;每一个对等实体要对它所需共享的信息以及进行的通信负责,根据需要下载它所需 要的其他对等实体上的信息。这种形式具有中心化的特点,但是它不同于传统意义上的 c l i e n t s e r v e r 模式。因为传统意义上的c l i e n t s e r v e r 模式采用的是一种垄断的手段,所 有资料都存放在服务器上,客户机只能被动地从服务器上读取信息,并且客户机之间不 具有交互能力;而集中式p 2 p 模式则是所有网上提供的资料都存放在提供该资料的客户 4 西华大学硕士学位论文 机上,服务器上只保留索引信息,此外服务器与对等实体以及对等实体之间都具有交互 能力。集中式对等网络典型代表有n a p s t e r l 4 j 。 n a p i e r 通过一个中央服务器保存所有n a p s t e r 用户上传的音乐文件索引和存放位置 的信息。当某个用户需要某个音乐文件时,首先连接到n a p i e r 服务器,在服务器进行 检索,并由服务器返回存有该文件的用户信息;再由请求者直接连到文件的所有者传输 文件。 n a p i e r 首先实现了文件查询与文件传输的分离,有效地节省了中央服务器的带宽 消耗,减少了系统的文件传输延时。这种方式最大的隐患在中央服务器上,如果该服务 器失效,整个系统都会瘫痪。当用户增加到一定数量时,n a p s t e r 的系统性能会大大下 降。另一个问题在于安全性上,n a p s t e r 并没有提供有效的安全机制。 在n a p s t e r 模型中,一群高性能的中央服务器保存着网络中所有活动对等计算机共 享资源的目录信息。当需要查询某个文件时,对等机会向一台中央服务器发出文件查询 请求。中央服务器进行相应的检索和查询后,会返回符合查询要求的对等机地址信息列 表。查询发起对等机接收到应答后,会根据网络流量和延迟等信息进行选择,和合适的 对等机建立连接,并开始文件传输。n a p s t e r 的工作原理如图1 4 所示。 对等管l肘等宅f l 图1 4n a p s t e r 系统结构图 f i g 1 4n a p s t e rs y s t e ms t r u c t u r e 5 p 2 p 局域网文件共享系统的研究与实现 1 3 2 分布式对等网络 在分布式p 2 p 中,对等机通过与相邻对等机之间的连接遍历整个网络体系。每个对 等机在功能上都是相似的,并没有专门的服务器,而对等机必须依靠它们所在的分布网 络来查找文件和定位其他对等机。分布式对等网络典型代表有g n u t e l l a 【5 j 【6 j 。 g n u t e l l a 是一个p 2 p 文件共享系统,它和n a p s t e r 最大的区别在于g n u t e l l a 是纯粹 的p 2 p 系统,没有索引服务器,它采用基于完全随机图的洪泛( f l o o d i n g ) 发现和随机 转发( r a n d o mw a l k e r ) 机制。为了控制搜索消息的传输,通过t t l ( t i m et ol i v e ) 的减 值来实现。 在g n u t e l l a 分布式对等网络模型中,每一个联网计算机在功能上都是对等的,既是 客户机同时又是服务器,所以被称为对等机( s e r v e n t ,s e r v e r + c l i e n t 的组合) 。 随着联网节点的不断增多,网络规模不断扩大,通过这种洪泛方式定位对等点的方 法将造成网络流量急剧增加,从而导致网络中部分低带宽节点因网络资源过载而失效。 所以在初期的g n u t e l l a 网络中,存在比较严重的分区,断链现象。也就是说,一个查询 访问只能在网络的很小一部分进行,因此网络的可扩展性不好。所以,解决g n u t e l l a 网 络的可扩展性对该网络的进一步发展至关重要。g n u t e l l a 的工作原理如图1 5 所示。 图1 5g - n u t e l l a 的工作原理图 f i g 1 5 c _ m u t e l l as y s t e ms t r u c t u r e 6 西华大学硕士学位论文 1 3 3 混合式对等网络 集中式p 2 p 有利于网络资源的快速检索,并且只要服务器能力足够强大就可以无限 扩展,但是其中心化的模式容易遭到直接的攻击;分布式p 2 p 解决了抗攻击问题,但是 又缺乏快速搜索和可扩展性。混合式p 2 p 结合了集中式和分布式p 2 p 的优点,在设计思 想和处理能力上都得到了进一步的优化。它在分布式模式的基础上,将用户节点按能力 进行分类,使某些节点担任特殊的任务。这些节点共分为3 种: ( 1 ) 用户节点:普通节点,它不具有任何特殊的功能。 ( 2 ) 搜索节点:处理搜索请求,从它们的“孩子 节点中搜索文件列表,这些节 点必须有1 2 8k b i t s 的网络连接速度,应使用高性能的处理器。 ( 3 ) 索引节点:连接速度快、内存充足的节点可以作为索引节点。索引节点用于 保存可以利用的搜索节点信息,并搜集状态信息,维护网络结构信息。 一个节点可以既是搜索节点又是索引节点。用户节点可以选择3 个搜索节点作为它 的“父”节点,如果“父”节点接受该用户节点作为它的“孩子”节点的话,那么该用 户节点就可以提交其所要共享的列表给它的“父”节点。在缺省的情况下,搜索节点可 以最多维护5 0 0 个“孩子”节点。在第三代p 2 p 的软件体系结构中,采用了混合式p 2 p 。 这种模式的关键之一是引入了索引节点,索引节点不会直接连接到有版权的资料上,它 就像搜索引擎一样,只是搜索和所需资料相关的地址,至于用户到底连接下载了什么内 容则和它无关。这种模式的关键之二是引入搜索节点,搜索节点管理着所属用户的文件 列表。用户节点通过索引节点获得搜索节点信息,之后用户节点就与获得的搜索节点相 连,每一次查询都通过该搜索节点进行。当用户发出搜索请求后,如果和用户节点直接 相连的搜索节点查询结果达到1 0 0 个( 这里的1 0 0 个搜索结果,可以由用户自己来设定) 就停止;如果不足1 0 0 个,就向相邻的搜索节点发出请求,如果查询结果还不够,就继 续向外快速发散,直到所有的搜索节点都被搜索到为止。若所有的搜索节点都被访问过, 就意味着整个网络上的节点都被搜索到了,其速度要比纯p 2 p 模式快得多。混合式对等 网络典型代表有b i t t o r r e n t l 7 。 b i t t o r r e n t 将中心目录服务器的稳定性同优化的分布式文件管理结合起来,从而在 效率上远远超出了e - d o n k e y 这类产品。它要求提供一个或多个统一的w e b 发布服务器, 以供发布和搜寻资料。在客户端,它通过一个i e 插件提供下载、上传管理。b t 把一份 大文件切割成碎片,为每一个碎片标上特殊标识,用户无需到一个固定地点( 例如传统 网络的中心服务器) 上下载完整的文件,系统会自动寻找、随机下载具有相同标识的文 件碎片,将其加以整合成为完整的文件 3 1 。b i t t o r r e n t 的工作原理如图1 6 所示。 魏 p 2 p 局域网文件共享系统的研究与实现 客,- 杉l客,杉l 图1 6b i t t o r r e n t 的工作原理图 f i g 1 6 b i t t o r r e n ts y s t e ms t r u c t u r e 1 4 本文的研究内容和组织结构 本文对p 2 p 文件共享技术展开研究,致力于研究和实现一个p 2 p 局域网文件共享系 统,能实现文件共享以及通信等功能。论文的具体组织安排如下: 第一章介绍本课题的研究背景、研究目的及意义和国内外研究现状。 第二章较为全面地介绍了p 2 p 技术的概念、p 2 p 模式与c s 模式的比较、p 2 p 的分 类、p 2 p 特性以及p 2 p 技术的应用和p 2 p 带来的问题。 第三章介绍j x t a 平台的体系结构、关键概念和核心协议以及各协议之间的关系。 第四章介绍资源的发现机制,分析了现有常见非结构化搜索算法与缺点,在此基础 上提出了基于蚁群改进的搜索算法,仿真的结果表明该算法有效地减少了查 询带来的网络流量和盲目性,提高了查找的成功率。 第五章介绍了良好p 2 p 系统设计要求,给出文件共享系统的功能模块设计和流程 设计。最后,讨论了p 2 p 安全以及在j x t a 的p 2 p 安全实现。 第六章实现一个p 2 p 局域网文件共享系统,并对其功能进行分析,给出了即时消 息、文件操作的实现代码和系统功能测试结果。 最后在结论部分总结了本文所做工作,并展望未来工作和该研究方向的前景。 8 西华大学硕士学位论文 2p 2 p 相关技术与理论 2 1p 2 p 的概念 p 2 p 是p e e r - t o p e e r 的缩写,p e e r 在英语中的解释是“伙伴 的意思,p 2 p 可以理解 为“伙伴对伙伴”的意思,或称为对等联网。p 2 p 最初的起源是联网通信方式,是一种 比较古老的技术,如产生于1 9 7 9 年的u s e n e t 1 9 8 4 年的f i d o n e t 都是基于p 2 p 技术的, 但是目前p 2 p 己被赋予了新的含义,是旧有技术的新的应用模式。 p 2 p 的原意是一种通信模式,在这种通信模式中,每一个部分具有相同的功能,任 意一个部分都可以开始一次通信。现在对p 2 p 概念进行了扩展,如i b m 公司认为:p 2 p 系统由若干互联协作的计算机构成,且至少具有如下特征之一:系统依存于边缘化( 非 中央式服务器) 设备的主动协作,每个成员直接从其他成员而不是从服务器的参与中受 益;系统中成员同时扮演服务器与客户端的角色;系统应用的用户能够意识到彼此的存 在,构成一个虚拟或实际的群体。 :, , 对等网络尚无统一的标准。2 0 0 0 年8 月成立了p 2 p 工作组,成员包括i n t e l 、i b m 和h p 公司等。发展对等网络的其他主要障碍还有版权问题、网络带宽问题、管理问题 和安全问题等。如何连接电话、手机和家电、工业设备等,也是对等网络需要解决的问 题。 2 2p 2 p 模式与c s 模式的比较 目前最流行的计算模式是c s 模式,图2 1 是一个典型的c s 模式的体系结构。c s 结构具有如下特点【8 】。 ( 1 ) 集中计算方式,信息和数据都保存在服务器端。只有服务器具有控制能力,客 户端基本上只是一个高性能的i o 设备。 ( 2 ) 服务器及网络的带宽决定了网络的性能。每台服务器所能提供的信息数量受到 自身存储空间的限制,而任意时刻它所能支持的客户端访问数量则受到自身处理能力以 及网络吞吐能力的限制。 ( 3 ) u r l 用来表示信息资源的地址,但是u r l 很少能直接体现所定位信息的内容, 甚至不能直接连接到具体的内容上。 ( 4 ) 被发布信息的分布与生存期十分稳定。服务器只发布机器所有者想公之于众的 信息,这些信息将会在该服务器上稳定的保存一段时间,并且该服务器也不间断地运行 在网络上。 9 p 2 p 局域网文件共享系统的研究与实现 ( 5 ) 被发布信息的存储与管理比较集中,互联网上所有可以公开访问的信息基本上 都保存在服务器上,服务器根据适当的算法和规则管理本地信息,应答客户端的访问请 求或进行计算。 p 2 p 模式是非中心结构,如图2 2 ,它与c s 模式有明显的差别。 ( 1 ) 每个对等点具有相同的地位,既可以请求服务也可以提供服务,同时扮演着c s 模式中的服务器和客户端两个角色,还可以具有路由器和高速缓冲存储器的功能,从而 弱化了服务器的功能,甚至取消了服务器。 ( 2 ) p 2 p 技术可以使得非互联网的用户很容易的加入到系统中。在p 2 p 的计算环境 中任何设备,从大型机到移动电话,甚至传呼机均可以在任何地点方便的加入进来。p 2 p 技术不仅可以应用于有线网络,还可以应用于无线计算技术。 ( 3 ) p 2 p 模式的网络中,每一个对等体可以充分利用网络上其他对等体的信息资 源,如处理器周期、高速缓存和磁盘空间等。 ( 4 ) p 2 p 技术是基于内容寻址的方式,这里的内容不仅包括信息的内容,还包括空 闲机时、存储空间等。p 2 p 网络中,用户直接输入要索取的信息的内容,而不是信息的 地址。p 2 p 软件将会把用户的请求翻译成包含此信息的节点的实际地址,而这个地址对 用户来说是透明的。 ( 5 ) p 2 p 中的每一个对等体通常没有固定的d 地址,且可常常从网络上断开。 ( 6 ) 信息的存储及发布具有随意性,缺乏集中管理。 图2 1c s 模式网络结构 f i g 2 1 c l i e n t s e r v e rm o d e l 凰k 画 西华大学硕士学位论文 图2 2p 2 p 模式网络结构 f i g 2 2 p e e r - t o - p e e rm o d e l 通过上面的比较,可以看出p 2 p 模式相对于c s 模式的一些主要优点。 ( 1 ) p 2 p 模式最主要的优点就是资源的高利用率。在p 2 p 网络上,闲散资源有机 会得到利用,所有节点的资源总和构成了整个网络的资源,整个网络可以被用作具 有海量存储能力和巨大计算处理能力的超级计算机。c s 模式下,即使客户端有大量 的闲散资源,也无法被利用。 ( 2 ) 随着节点的增加,c s 模式下服务器的负载就越来越重,形成了系统的瓶颈, 一旦服务器崩溃,整个网络也随之瘫痪。而在p 2 p 网络中,每个对等体都是一个活 动的参与者,每个对等体都向网络贡献一些资源,如存储空间、c p u 周期等。所以 对等点越多,网络性能越好,网络随着规模的增大而越稳固。 ( 3 ) 基于内容的寻址方式处于一个更高的语义层次,因为用户在信息搜索时只需 指定具有实际意义的信息标识而不是物理地址。这将创造一个更加精炼的信息仓库 和一个更加统一的信息标识方法。 ( 4 ) 信息在网络设备节点间直接流动,高速及时,降低中转服务成本。 ( 5 ) c s 模式下的互联网完全依赖于中心点服务器。没有服务器网络就没 有意义。而在p 2 p 网络中,节点所有者可以随意的将信息发布到网络上。 但是p 2 p 也有不足。首先,p 2 p 不易管理,而对c s 网络,只需在中心点进行 管理。其次,p 2 p 网络中数据的安全性难以保障,因此在安全策略、备份策略等方 面,p 2 p 的实现要复杂一些。另外,对等点可以随意的加入或退出,会造成网络带 宽和信息存在的不稳定。表2 1 给出了p 2 p 与c s 主要特性的比较。 画工 l p 2 p 局域网文件共享系统的研究与实现 表2 ip 2 p 与c s 的比较 t a b 2 1p 2 pc o m p a r ew i t hc s 2 3 p 2 p 的分类 一种从p 2 p 的观点对分布式系统的分类方法如表2 2 所示。分布式系统一般可以被 分为c l i e n t s e r v e r 模式和p 2 p 二种模式。c l i e n t s e r v e r 模式可以是扁平的结构,里面所 有的c l i e n t 仅仅与单一的一个s e r v e r 通信( 有可能被备份以增加可靠性) ;也可以是有层 次的结构,以获得更好的可扩展性。 表2 2p 2 p 的分类 t a b 2 2t h ec l a s s i f i c a t i o no fp 2 p 分布式系统 c l i e n t s e r v e rp e e r - t o p e e r 扁平结构i 层次结构 集中式l 结构化 l 非结构化l 混合式 在一个层次型的模型中,同一层次的s e r v e r 相对于更高层的s e r v e r 来说,就像是 c l i e n t 一样。扁平的模型的例子包括传统的利用中间件的解决方案。层次的模型的例子 包括d n s 服务器以及安装的文件系统。 p 2 p 模型从结构上可以分为四类:集中式,结构化,非结构化和混合式。集中式的 典型代表是n a p s t e r ,它的名字虽然叫做集中式,但这里集中的只是索引。结构化的p 2 p 有c h o r d 9 1 ,p a s t r y i l 们,t a p e s t r y l l l l ,c a n 1 2 】等,它们主要是对资源和节点采取一定的方 式进行处理,使节点和资源变得有序可寻,通过服务器来进行搜索资源。非结构化的 p 2 p 主要代表是g n u t e l l a ,它是p 2 p 最能体现p 2 p 特点的一种结构,网络上没有服务器, 网络拓扑是一个分散的状态。通过基于对等网的客户端软件搜索网络中存在的对等节点 ( p e e r ) 。混合式的p 2 p 网络选择了一些性能比较高的节点作为超级节点( s u p e r n o d e ) ,这 1 2 西华大学硕士学位论文 些超级节点存储了其他一些节点( p e e r ) 的信息。由超级节点作为小的服务器来处理属于 自己那部分节点的信息,同时超级节点之间也协同处理一部分信息。 从应用程序角度来说,主要有三种类型的p 2 p 应用程序。 ( 1 ) 并行的。并行的p 2 p 程序把一个大的任务分解成一些可以并行的运行于许多独 立的p e e r 节点上的子任务。大多数使用这类模型的应用程序都是计算集中的程序。隐藏 在这些程序背后的思想是,连接在i n t e r n e t 节点上的任何一台计算机的空闲周期都可以 被利用,用来解决那些需要大量计算的困难问题。通常来说,相同的任务会在不同的p e e r 上使用不同的参数来运行。这一类的例子包括搜索外星生命、破解密码、市场和债务的 价值计算和人口统计分析。 ( 2 ) 内容和文件管理。内容和文件管理的p 2 p 程序主要用来向网络中不同的p e e r 上 存储信息,以及从这些p e e r

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论