




已阅读5页,还剩53页未读, 继续免费阅读
(计算机应用技术专业论文)基于JXTA的P2P资源搜索策略的研究与实现.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
大连理工大学硕士学位论文 摘要 随着对等网络规模和用户数量的增加,p 2 p 环境下的信息量也随之飞速增长,给用 户在搜索、定位和获取信息资源上都带来了巨大的困难。对等网络信息搜索技术是解决 这一问题的重要手段。较好的信息搜索技术不但能够提高搜索命中率,减轻节点负担, 降低网络开销,还能够根据用户的兴趣提高搜索性能,主动学习,为用户的搜索节省时 间,提高工作效率。 本文深入研究了现有j x t a 平台下的资源搜索机制,并分析其优缺点。j x t a 网络 是采用了结构化思想的二维混合网络。上层集合点节点采用松散一致的d h t 算法,有 限范围内集合点步行查找,下层边缘节点采用广播方式查找。j x t a 与传统非结构化一 维平面网络相比,一个重大改进是广告查询不再传播到边缘节点,只有集合点才会在广 告查询传播中涉及到。查询只是在找到匹配的索引时才转发到边缘节点。但是,j x t a 网络中的资源搜索仍然是一种缺乏全局观的局部有效搜索算法。 结合j x t a 平台中资源搜索机制的局限性,本文提出了一种改进的基于j x t a 平台 的资源搜索策略。在j x t a 网络中,下层路由机制不变,对上层网络中的每个集合点分 配一个主题( s u b j e c t ) ,同时将路由过程中用到的集合点视图( r p v ) 拆分为两部分 目标节点表( t a r ) 和主题节点表( s u b ) 。这两部分记录的都是资源关键字和对应的节点 i d ,而且关键字都是围绕在主题周围的关键字集合。这样,在搜索过程中,路由过程不 再是简单的从r p v 表中随机的选取一个集合点进行下一跳,而是根据主题有目标的选 取下一个集合点,从而有效提高搜索成功率,并缩短搜索时间,达到优化搜索过程的目 的。另外,将原来r p v 表分为两部分对维护网络中r p v 的一致性也起到了积极的作用。 最后,在充分研究分析的基础上,本文实现了改进的搜索策略,并将其应用到一个 简单的协同办公系统中,目前本系统主要实现了即时通讯、文件共享和电子白板功能。 关键词:对等网络;j x t a ;资源搜索;主题;集合点视图 大连理工大学硕士学位论文 r e s e a r c ha n di m p l e m e n t a t i o no fp 2 pr e s o u r c es e a r c hs t r a t e g y b a s e do nj x t a a b s tr a c t a st h ei n f o r m a t i o na m o u n tr i s e sr a p i d l yw i t ht h ei n t e n s ei n c r e m e n to fb o t hu s e r s q u a n t i t ya n dn e t w o r k ss c a l e ,p e e r - t o p e e r ( p 2 p ) i sr e g u l a r l yc o m i n gi n t op e o p l e sl i v e sa n d i n d u s t r y t h i sk i n do fi n c r e m e n th a sc a u s e das e r i o u sp r o b l e m ,d i f f i c u l t yi ns e a r c h i n g , l o c a t i n ga n dr e t r i e v i n gr e s o u r c e t oc o n q u e rt h i sp r o b l e m ,i n f o r m a t i o nr e t r i e v a li np 2 p n e t w o r ki sap i v o t a lt e c h n i q u e ag o o ds t r a t e g yn o to n l yi n c r e a s e sh i tr a t i o ,b u ta l s os e r v e s u s e r si ns t u d y i n gr e l e v a n ti n f o r m a t i o nt oi m p r o v et h ep e r f o r m a n c ei nl a t e rs e a r c hp r o c e s s t h e a b i l i t yt od e c r e a s en o d el o a da n dn e t w o r kc o s ti sa n o t h e rg o a lf o rag o o ds e a r c ha l g o r i t h m i nt h i sp a p e r ,w es t u d yt h ea v a i l a b l ej x t ar e s o u r c es e a r c hm e c h a n i s ma n dt h e na n a l y z e i t sa d v a n t a g e sa n dl i m i t a t i o n s j x t ai sat w o - d i m e n s i o nn e t w o r k t h eu p p e r l a y e ra s s e m b l y p e e r su s el o o s e l yc o n s i s t e n td h ta l g o r i t h m ,w i t h i nal i m i t e ds e tp o i n tw a l k i n gv i e w t h e l o w e rn o d e su s eb r o a d c a s t i n gm e a n s c o m p a r e dw i t ht r a d i t i o n a lu n s t r u c t u r e do n e - d i m e n s i o n p l a n a rn e t w o r k ,o n ei m p o r t a n ti m p r o v e m e n ti sa na d v e r t i s e m e n ti n q u i r yn ol o n g e rs p r e a d i n g t ot h ee d g en o d e s o n l ya s s e m b l yp o i n t si na d v e r t i s i n gi n q u i r i e sa r ei n v o l v e di nt h e t r a n s m i s s i o n h o w e v e r ,i ti ss t i l lap a r t i a lv i e wo ft h eo v e r a l ll a c ko fe f f e c t i v es e a r c h a l g o r i t h m c o m b i n i n g 谢t 1 1t h el i m i t a t i o n so fr e s o u r c es e a r c hm e c h a n i s mi nj x t an e t w o r k ,w ep u t f o r w a r da ni m p r o v e dr e s o u r c es e a r c hs t r a t e g yb a s e do nj x t a l e a v i n gl o w e rr o u t i n g m e c h a n i s mu n c h a n g e d ,e v e r yr e n d e z v o u sp e e ri nt h eu p p e rl a y e rh a sas u b j e c t ,a n dt h e r e n d e z v o u sp e e rv i e w ( r p v ) u s e di nt h ep r o c e s si ss p l i ti n t ot w op a r t s ,t a r g e tt a b l e ( t a r ) a n ds u b j e c tt a b l e ( s u b ) t h ec o n t e n t so ft h et w ot a b l e sa r et h ek e yo ft h er e s o u r c e sa n dt h e r e l e v a n tp e e r l d ,a n da l lo ft h ek e y sa r ec e n t e r e do nt h es u b je c to w n e db yt h er e n d e z v o u sp e e r s o ,i nt h ep r o c e s so fs e a r c h i n g ,e v e r yr e n d e z v o u sp e e rc a nc h o o s et h en e x th o pp u r p o s e f u l l y r a t h e rt h a nr a n d o m l ys oa st oo p t i m i z et h es e a r c hp r o c e s s b e s i d e s ,t h es p l i t t i n go ft h er p v c a l lh e l pm a i n t a i nc o n s i s t e n c yo ft h ew h o l en e t w o r k f i n a l l y ,w ei m p l e m e n tas i m p l ec o o p e r a t i o no f f i c es y s t e mu s i n gt h ei m p r o v e dr e s o u r c e s e a r c hs t r a t e g yb a s e do nj x t a ,w h i c hi s m a i n l yc o m p o s e do ft h r e em o d u l e s ,i n s t a n t c o m m u n i c a t i o n ,f i l e s h a r i n ga n de l e c t r o n i cw h i t eb o a r d k e yw o r d s :p 2 p ;j x t a ;r e s o u r c es e a r c h ;s u b j e c t ;r p v i i i 大连理工大学学位论文独创性声明 作者郑重声明:所呈交的学位论文,是本人在导师的指导下进行研究 工作所取得的成果。尽我所知,除文中已经注明引用内容和致谢的地方外, 本论文不包含其他个人或集体已经发表的研究成果,也不包含其他已申请 学位或其他用途使用过的成果。与我一同工作的同志对本研究所做的贡献 均已在论文中做了明确的说明并表示了谢意。 学位论文题目:邀重卫进匝巳2 盗i 厘茎绫暴! 签墨纽鏖复墓鲵 作者签名:习乒逢虿一 日期:立业年之月毋日 大连理工大学硕+ 研究生学位论文 大连理工大学学位论文版权使用授权书 本人完全了解学校有关学位论文知识产权的规定,在校攻读学位期间 论文工作的知识产权属于大连理工大学,允许论文被查阅和借阅。学校有 权保留论文并向国家有关部门或机构送交论文的复印件和电子版,可以将 本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、 缩印、或扫描等复制手段保存和汇编本学位论文。 学位论文题 作者签名: 导师签名: 大连理工大学硕士学位论文 1绪论 1 1课题的研究背景 随着网络技术的飞速发展和网络规模的不断扩大,接入网络的主机增加,可用资源 丰富,然而目前的互联网仍然是以服务器为中心的网络为主,尤其是w e b 技术的发展 使得许多w e b 服务器成为信息的主要提供源,使得整个i n t e m e t 系统依附于这些少量的 服务器节点。这种网络模型存在着很多问题:服务器必须有强大的计算能力和完善的配 套设施,并要保持长时间在线状态;服务器中必须保存海量资源信息,以供大量用户使 用;服务器维护工作极其庞大;服务器的负载是一定量的,随着访问服务器的用户的不 断增加,网络会比较慢甚至有可能形成网络单点瓶颈。网络中对服务器节点的依赖使大 量的个人主机中的资源成了信息孤岛,无法得到充分利用,能否发挥这些闲散资源的使 用效率( 或者作用) 构成了人们关注p 2 p 的理由。 p 2 p 是p e e r t o p e e r 的缩写,是指通过使用分布资源,借助于分布计算技术来完成 关键任务的系统和应用的总称。其关键任务包括分布计算、数据( 或内容) 共享、通信与 协作,或者是平台服务等。p 2 p 技术的主要特征是弱化服务器作用,甚至取消服务器, 使分布式系统中的各个节点逻辑对等,这种技术出现的目的就是希望能够充分利用网络 中所蕴含的潜在资源。与c s 模型不同,p 2 p 模型中每个节点既可以是服务( 或者资源) 的提供者,也可以是使用者,充其量就是提供的服务( 或资源) 的类型不同。 与传统的模型相比,对等网络技术在有效利用网络中大量信息资源、存储空间、处 理器周期等资源,避免服务器带来的高成本等方面具有较大的优势。因此,p 2 p 技术目 前受到了极大的重视。同时,为了提高p 2 p 技术在网络中的高效性,很多研究者进行了 深入研究,提出了很多方案,从而使得p 2 p 网络中的资源搜索策略备受关注。 1 2 国内外研究现状 正因为对等网络具有非集中控制、自组织、自适应和良好的可扩展性等优点,使得 很多研究机构和商业公司开始关注对等网络的研究,其中包括m i c r o s o f t ,i n t e l ,s u n 和 h p 等一些极具影响力的大公司,并由i n t e l 发起成立了对等网络工作组,以推动对等网 络进一步发展。b e r k e l e y ,m i t 等国外著名科研机构也成立了各自的研究小组进行相关 研究,并取得了初步成果。国内许多高校、科研院所也大多于本世纪初开始积极投入相 关研究,但尚未有重要突破性的成果报道。 目前,基于对等网络的资源搜索研究己经取得了一些成果,其代表n a p s t e r l l 2 的成 功,就展现出了对等网络在资源共享领域中的巨大潜力。但是,从严格意义上讲,n a p s t e r 基于j x t a 的p 2 p 资源搜索策略的研究与实现 作为第一个成形的商业应用,并取得成功( 当然指的是技术方面) 的p 2 p 产品,并不是真 正意义上的完全的p 2 p 。p 2 p 应该是一个没有中心,网络中的每个节点完全平等的网络。 n a p s t e r 显然不具备这一要求。 s u n 公司主导的j x t a 工程也是对等网络研究领域的一个重要组成部分。j x t a 平 台推出的主要目的是致力于从所有的p 2 p 系统中分离出这些系统通用的需求,从而建立 一整套泛型的p 2 p 基础协议,整合p 2 p 应用,标准化p 2 p 服务,为p 2 p 的网络应用发 展提供一个统一的平台 3 1 。与其他p 2 p 平台相比j x t a 有自己突出的三大优势。 互操作性:j x t a 能使提供各种p 2 p 服务的对等节点之间相互定位与交流【4 j 。许多 现存的p 2 p 系统是自治的、封闭的,其后果是既限制了用户的交流,又浪费了系统及人 力资源。而j x t a 为p 2 p 所做的,就好比浏览器为i n t e m e t 带来的影响一样。 平台无关性:采用就j x t a 技术创建的p 2 p 系统具有语言独立性、通信协议独立性 和平台无关性。现在许多p 2 p 系统通过在一定的系统平台和网络平台上发布一组a p i 来提供服务,由于在异种平台间没有互操作的可能,p 2 p 的开发者必须为在不同的p 2 p 平台上实现相同的服务进行二次开发。或在两个系统间架桥,而这是不切实际的。在这 一点上,j x t a 的平台无关性适应了开发者的需要。 广泛性:采用j x t a 技术可以使用户程序运行在任何具有数字芯片的设备上,包括 传感器、家用电器、p d a 、个人电脑、路由器、中心服务器和存储系统等。当前许多 p 2 p 系统基于利润考虑倾向使用w i n d o w s 平台,这种选择造成了对操作系统的依赖,而 基于任何特定硬件和软件之上的应用都是经不起考验的。j x t a 技术可以使p 2 p 应用程 序具有真正意义上的普遍性。 鉴于以上三点优势,目前国内外很多企业和研究单位都选择j x t a 作为p 2 p 协同办 公的开发平台。 1 3 本文工作及成果 p 2 p 网络按照资源组织与定位方法可以将其简单地分为非结构化p 2 p 网络和结构化 p 2 p 网络【5 1 。在非结构化p 2 p 系统中,查询采用泛洪【6 】搜索的方式。这种方法为了满足 需要将查询请求广播到一定数目的结点,因为实际中存在不能满足查询的情况,所以这 种方法是不能保证查询成功,而是试图达到最广泛的查询。而结构化查询是一种有保证 的查询方法。这种方法对于每个请求搜索的内容项可以能够通过一定的计算被定位。目 前主流的结构化路由算法包括c h o r d 7 1 、p a s t r y 引、c a n 9 1 、t a p e s t r y m 】和扩展环查找等 协议。 大连理- 丁大学硕士学位论文 j x t a 是一种混合式的p 2 p 网络,采用二维网络结构,上层采用松散一致的d h t 算法,有限范围内集合点步行查找,下层采用非结构化的广播方式查找。j x t a 与传统 的非结构化p 2 p 网络相比,减少了冗余信息的传播,但依然是一种局部有效的非确定性 查找。结构化p 2 p 网络适用于网络拓扑相对稳定的网络,非结构化p 2 p 网络适用于网络 规模相对较小的动态网络。 本文即是在j x t a 平台之上对资源搜索策略进行研究。对于p 2 p 网络系统,由于服 务提供者的边缘化,解决了服务器性能和带宽的瓶颈问题,影响系统性能的关键要素转 移到对资源索引的发布、搜索和获取也就是资源定位上面来。所谓的资源定位解决 的是p e e r 查询资源的时候应该向哪个节点发送查询请求的问题以及如何有效地获取查 询结果的问题。 本文的主要工作如下: 首先,总结大量文献以及国内外学者的研究工作,对近几年来在p 2 p 资源搜索领域 各种结构化搜索算法和非结构化搜索算法适用场景和优缺点以及研究成果进行研究和 分析。 然后,针对j x t a 开发平台,对其搜索策略作了深入细致的剖析。结合j x t a 自身 的路由机制与实际项目的需求和特点,提出了一种更适合于协同办公领域的资源搜索策 略,使得在资源搜索时,路由过程不再是简单的从原r p v 表中随机的选取一个集合点 进行下一跳,而是根据集合点主题有目标的选取下一个集合点,从而有效提高搜索成功 率,并缩短搜索时延,达到优化搜索过程的目的。 最后,根据改进的资源搜索策略,设计并实现了一个简单的p 2 p 协同办公系统中。 该系统实现了即时通讯、文件共享、电子白板等功能。 1 4 本文的组织结构 本文的组织结构如下: 第一章绪论。介绍了课题的研究背景、国内外研究现状、本文的工作及成果和本 文的组织结构。 第二章相关技术介绍。介绍了p 2 p 相关技术及本文用到的j x t a 的相关概念和核 心协议。 第三章j x t a 平台中资源搜索策略的分析与改进。针对j x t a 平台中现有的资源搜 索机制进行了深入的分析和研究,提出了改进的资源搜索策略,并对其进行了必要的仿 真试验和性能分析。 第四章改进的j x t a 资源搜索策略在协同办公系统中的实现。本章作为本文的重 基于j x t a 的p 2 p 资源搜索策略的研究与实现 点,将改进的j x t a 模型应用到一个简单的p 2 p 协同办公系统中,介绍了改进后的j x t a 网络模型在系统中的实现,并详细介绍了系统整体架构及上层各功能模块的设计与实 现。 最后,在结论中总结全文并展望未来工作。 大连理工大学硕士学位论文 2p 2 p 技术与j x t a 平台介绍 2 1 p 2 p 技术介绍 2 1 1 p 2 p 发展历史 p 2 p 即p e e r - t o p e e r ,称为对等连接或对等网络。p 2 p 起源于最初的联网通信方式, 其中建立在t c p i p 协议之上的通信模式构成了今日互联网的基础,所以从基础技术角 度看,p 2 p 不是新技术,而是新的应用技术模式。今天,p 2 p 技术再一次成为学术界的 热点,是因为p 2 p 技术能够很好的解决c s 和b s 所存在的问题,更有效的促进i n t e m e t 的发展。 p 2 p 网络中的p e e r ( 对等体) 是彼此直接通信的。这种通信无需依赖集中式服务器或 资源就可完成。在p 2 p 网络中,通过p e e r 之间的交互操作就可以完成工作,共享信息。 通过创建具有高可用性和容错能力的计算资源网络,p 2 p 体系结构使真正的分布式计算 成为可能。 p 2 p 网络的发展可分为以下三个阶段: 第一代的文件交换服务以n a p s t e r 和b t 独领风骚,其技术是建立一个大型的集中 化索引,对网络上所有的可用资源进行追踪。这种方法虽然相当有效率,让使用者可以 存取到庞大的资源,但同时发生了最著名的官司:美国唱片业协会( r t a a ) 代表环宇音乐、 索尼音乐、华纳音乐、百代唱片、b m g 等七大唱片公司以违反版权保护法为由把n a p s t e r 公司推上法庭,历时三年最终将n p a s t e r 告倒,法院最终判定n a p s t e r 侵权。 第二代分散式服务以国外的k a z a a 【1 l j 和国内迅速崛起的p o c o 为代表。它们改为在 电脑间发送搜索请求,一直到找到文件为止,然后再将信息传回搜索者的电脑。这种技 术一开始相当不方便,特别是数以百万计的搜索要求在网络上的每一台电脑间来回发送 时,在高峰时段往往造成网络大塞车。后来通过随机方式选出品质较优的用户来做为节 点服务器,用户可从节点服务器上获得p e e r l i s t ,下载方法也越来越进步。但与第一代 p 2 p 软件命运截然不同的是,美国法院最后宣判,这种分散式的p 2 p 应用是合法的,这 种软件的散播者并未直接控制网络上所出现的行为。 第三代的p 2 p 网络则是以e d o n k e y 、e m u l e 、m o r p h e u s 为代表,比以前更为分散化。 它采用“分散式杂凑表”的方法,基本上是对网络上某一特定时刻的文件进行快照 ( s n a p s h o t ) ,然后将这些信息分散到整个网络里。为了找到特定的文件,搜索的要求先到 达网络上的任何一台电脑,然后这台电脑就会再将它转到另一台有更多文件信息的电 脑,第三台电脑可能就拥有文件本身,或者也可能再继续转到其他有正确信息的电脑。 基于j x t a 的p 2 p 资源搜索策略的研究与实现 整个过程有点像依照线索循序问路而找到正确方向,而不是路上随便抓人问路。每个网 络相关信息,会随电脑及文件的加入而持续更新。s t r e a m c a s t 2 0 0 4 年向哈佛学生 b e n w i l k i n 及f r a n c i s c r i e k 买下这项技术。这两位前哈佛学生表示,他们的技术只要跳 三至四次就可以在几百万台电脑的网络里找到任何文件,不管这个文件多么稀有。这种 技术也让一些应用有了新的前景,例如网络电话。n e o n e t 与e d o n k e y 专注的都是文件交 换,但s k y p e 专注于网络电话。这种有效率的网络路由技术可用于快速连接网络电话, 但也给传统电信运营商带来了冲击。 212p 2 p 基本概念 p 2 p 作为一种网络拓扑结构,早在多年之前就已经出现了,最早的i n t c m e = t 就是一 个p 2 p 结构的大网络。经过几十年的发展,i n t e r a c t 上的资源逐渐丰富起来,并呈现爆 炸式增长的态势。而与此同时,资源的流向却区域集中化,大量公开的资源以 s e r v e r c l i e n t 的形式在i n t e r a c t 上提供,网络应用也多以集中化的方式提供服务,如w e b 、 f t p 等。p 2 p 技术不同于基于s e r v e r 的应用技术,它是一种非集中架构,在网络中没有 服务器或是客户机的概念( 如图21 所示) 。对于网络中的每一个实体,都会被认为是一 个对等点( p e e r ,在本文中有些地方也称其为节点n o d e ) ,它们拥有相同的地位,任何一 个实体都可以请求服务( c l i e n t 的特性) 和提供服务( s e r v e r 的特性) 。虽然所有的p e e r 在网 络中都具有相同的地位,但并不是所有的p e e r 都需要具有相同的性能。在p 2 p 网络当 中,可以有不同性能的多种节点,从移动设备到工作站。一个移动p e e r 由于其内在的限 制,即使网络允许,可能也并不能像服务器那样工作。 i b m 则为p 2 p 下了如下定义:p 2 p 系统由若干互联协作的计算机构成,且至少具有 如下特征之一:系统依存于边缘化( 非中央式服务器) 设备的主动协作,每个成员直接从 其他成员而不是从服务器的参与中受益;系统中成员同时扮演服务器与客户机的角色; 系统应用的用户能够意识到彼此的存在,构成一个虚拟或实际的群体。 21 3 p 2 p 网络模型的特点 与其它网络模型相比,p 2 p 网络模型具有以下特点【l 2 j : ( 1 ) 分散化 网络中的资源和服务分散在所有节点上,信息的传输和服务的实现都直接在节点之 间进行,可以无需中间环节和服务器的介入,避免了可能的瓶颈。即使是在混合p 2 p 中, 虽然在查找资源、定位服务或安全检验等环节需要集中式服务器的参与,但主要的信息 交换最终仍然在节点间直接完成。这就大大降低了对集中式服务器的资源和性能要求。 大连理工人学硕士学位论文 图21c s 模式和p 2 p 模式 f i g 2 1 c s m o d ea n d p 2 p m o d e ( 2 ) 可扩展性 在传统的c s 架构中,系统能够容纳的用户,数量和提供服务的能力主要受服务器的 资源限制。为支持互联网上的大量用户,需要在服务器端使用大量高性能的计算机,铺 设大带宽的网络。为此c l u s t e r 等技术纷纷上阵。在此结构下,集中式服务器之间的同步、 协同等处理产生了大量的开销,限制了系统规模的扩展。而在p 2 p 网络中,随着用户的 加入,不仅服务的需求增加了,系统整体的资源和服务能力也在同步地扩充,始终能较 容易地满足用户的需要。即使在诸如n a p s t e r 等混合型架构中,由于大部分处理直接在 节点之间进行,大大减少了对服务器的依赖,因而能够方便地扩展到数百万个以上的用 户。而对于纯p 2 p 来说,整个体系是全分布的,不存在瓶颈。理论上其可扩展性几乎可 以认为是无限的。 ( 3 ) 健壮性 在互联网上随时可能出现异常情况,网络中断、网络拥塞、节点失效等各种异常事 件都会给系统的稳定性和服务持续性带来影响。在传统的集中式服务模式中,集中式服 务器成为整个系统的要害所在,一旦发生异常就会影响到所有用户的使用。而p 2 p 架构 则天生具有耐攻击、高容错的优点。由于服务是分散在各个节点之间进行的,部分节点 或网络遭到破坏对其它部分的影响很小。而且p 2 p 模型一般在部分节点失效时能够自动 调整整体拓扑,保持其它节点的连通性。事实上,p 2 p 网络通常都是以自组织的方式建 立起来的,并允许节点自由地加入和离开。一些p 2 p 模型还能够根据网络带宽、节点数、 负载等变化不断地做自适应式的调整。 ( 4 ) 隐私性 随着互联网的普及和计算存储能力飞速增长,收集隐私信息正在变得越来越容易。 基于j x t a 的p 2 p 资源搜索策略的研究与实现 隐私的保护作为网络安全性的一个方面越来越被大家所关注。目前的i n t e m e t 通用协议 不支持隐藏通信端地址的功能。攻击者可以监控用户的流量特征,获得p 地址。甚至 可以使用一些跟踪软件直接从i p 地址追踪到个人用户。在p 2 p 网络中,由于信息的传 输分散在各节点之间进行而无需经过某个集中环节,用户的隐私信息被窃听和泄漏的可 能性大大缩小。此外,目前解决i n t e r n e t 隐私问题主要采用中继转发的技术方法,从而 将通信的参与者隐藏在众多的网络实体之中。在传统的一些匿名通信系统中,实现这一 机制依赖于某些中继服务器节点。而在p 2 p 中,所有参与者都可以提供中继转发的功能, 因而大大提高了匿名通讯的灵活性和可靠性,能够为用户提供更好的隐私保护。 ( 5 ) 高性能 性能优势是p 2 p 被广泛关注的一个重要原因。随着硬件技术的发展,个人计算机的 计算和存储能力以及网络带宽等性能高速增长。而在目前的互联网上,这些普通用户拥 有的节点只是以客户机的方式连接到网络中,仅仅作为信息和服务的消费者,游离于互 联网的边缘。对于这些边际节点的能力来说,存在极大的浪费。采用p 2 p 架构可以有效 地利用互联网中散布的大量普通节点,将计算任务或存储资料分布到所有节点上。利用 其中闲置的计算能力或存储空间,达到高性能计算和海量存储的目的。这与当前高性能 计算机中普遍采用的分布式计算的思想是一致的。但通过利用网络中的大量空闲资源, 可以用更低的成本提供更高的计算和存储能力。 2 1 4p 2 p 网络模型分类 常见的p 2 p 网络模型主要有:集中目录式结构、纯p 2 p 网络模型、混合式p 2 p 网 络、结构化p 2 p 网络。 集中目录式p 2 p 结构是最早出现的p 2 p 应用模式,因为仍然具有中心化的特点也被 称为非纯粹的p 2 p 结构。用于共享m p 3 音乐文件的n a p s t e r 是其中最典型的代表,其用 户注册与文件检索过程类似于传统的c s 模式,区别在于所有资料并非存储在服务器上, 而是存贮在各个节点中。查询节点根据网络流量和延迟等信息选择合适的节点建立直接 连接,而不必经过中央服务器进行。集中目录式p 2 p 可提供中心服务器目录检索、管理 服务和标准的点到点通信,具有高效的检索和低效的交换服务的特点。同时集中目录式 p 2 p 模型也存在很多问题:中央服务器的瘫痪容易导致整个网络的崩溃,可靠性和安全 性较低;随着网络规模的扩大,中央目录服务器维护和更新的费用将急剧增加,所需成 本过高;中央服务器的存在引起共享资源在版权问题上的纠纷;缺乏有效的强制共享机 制,资源可用性差。集中目录式p 2 p 结构如图2 2 所示。 一8 一 大连理工大学硕十学位论文 图22 集中目录式p 2 p 模式 f 培2 2 t h em o d eo f c o n c e n t r a t e di n d e xp 2 p 纯p 2 p 模式也被称作广播式的p 2 p 模型。它取消了集中的中央服务器,每个用户随 机接入网络,并与自己相邻的一组邻居节点通过端到端连接构成一个逻辑覆盖的网络。 对等节点之间的内容查询和内容共享都是直接通过相邻节点广播接力传递,同时每个节 点还会记录搜索轨迹,以防止搜索环路的产生。c - n u t e l l a 【l ”模型是现在应用最广泛的纯 p 2 p 非结构化拓扑结构,它解决了网络结构中心化的问题,扩展性和容错性较好,但是 g n u t e l l a 网络中的搜索算法以泛洪的方式进行【,控制信息的泛滥消耗了大量带宽并很 快造成网络拥塞甚至网络的不稳定。同时,局部性能较差的节点可能会导致g n u t e l l a 网 络被分片,从而导致整个网络的可用性较差,另外这类系统更容易受到垃圾信息,甚至 是病毒的恶意攻击。纯p 2 p 模式如图23 所示。 p 2 p 混合模式的典型代表是k a z a a 模型,它在纯p 2 p 分布式模型基础上引入了超级 节点的概念,综合了集中式p 2 p 快速查找和纯p 2 p 去中心化的优势。k a z a a 模型将节点 按能力不同区分为普通节点和搜索节点两类。其中搜索节点与其临近的若干普通节点之 间构成一个自治的簇,簇内采用基于集中目录式的p 2 p 模式,而整个p 2 p 网络中各个不 同的簇之间再通过纯p 2 p 的模式将搜索节点相连起来,甚至也可以在各个搜索节点之间 再次选取性能摄优的节点,或者另外引入一新的性能最优的节点作为索引节点来保存整 个网络中可以利用的搜索节点信息,并且负责维护整个网络的结构。基于超级节点的混 基于j x t a 的p 2 p 资源搜索策略的研究与实现 p e e rp e e r 图2 3 纯p 2 p 模式 f i g 2 3 t h em o d eo fp u r ep 2 p 合式p 2 p 网络结构比以往有较大程度的改进。然而,由于超级节点本身的脆弱性也可能 导致其簇内的结点处于孤立状态,因此这种局部索引的方法仍然存在一定的局限性。p 2 p 混合模式如图2 4 所示。 结构化p 2 p 模式是一种采用纯分布式的消息传递机制和根据关键字进行查找的定 位服务,目前的主流方法是采用分布式哈希表( d h t ) 技术,这也是目前扩展性最好的p 2 p 路由方式之一。由于d h t 各节点并不需要维护整个网络的信息,只在节点中存储其临 近的后继节点信息,因此较少的路由信息就可以有效地实现到达目标节点,同时又取消 了泛洪算法。最经典的案例是c h o r d 刀、p a s t r y 引、c a n 9 1 和t a p e s t r y 1 0 1 。 2 2 j x t a 平台综述 2 2 1 j x t a 简介 j x t a 是由s u n 公司推出的一组开放的通用p 2 p 协议,它允许任何接入网络的设 备作为对等点进行通信和协同工作,如移动电话、p d a 、p c 、服务器等。j x t a 并不依 赖与某种编程语言,我们可以利用任何一种平台来实现j x t a 协议【”】。 j x t a 是j u x t a p o s e 的缩写,意思是“并列,并置 。它给开发p 2 p 应用程序提供了 一整套开放协议和开源实现。同时,j x t a 对p 2 p 节点的共同行为做了标准化,包括节 点发现、自组织、发现和通告网络服务、相互通信以及监视其他节点等。因为协议的独 大连理工大学硕十学位论文 图2 4p 2 p 混合模式 f i g 2 4 t h em o d eo fm i x e dp 2 p 立性,异构网络的设备可以使用不同的协议栈相互通信。 2 2 。2 j x t a 基本概念 构成j x t a 系统的核心组件主要有:对等体、对等组、管道、消息、广告和服务等。 下面本文将对这些组件一一进行介绍,以了解它们在j x t a 平台中的作用1 1 6 。 ( 1 ) 对等点( p e e r ) 对等点是j x t a 网络中的基础实体,既是服务的消费者,又是服务的提供者。对等 点之间进行消息通信时候,并不需要每个节点之间直接连接,通常可以利用中间节点来 进行消息转发。 ( 2 ) 对等组( p e e r g r o u p ) 对等组是一个由多个对等点共同参与的集合,在一个组中所有的对等点支持共同的 服务。它能够组织各个对等点,并发布只对组成员可用的服务。一个对等点可以自由的 创建一个组或者加入一个组,也可以选择从组中离开。每一个对等组用一个唯一的p e e r g r o u pi d 标识符标识。 ( 3 ) 消息( m e s s a g e ) 在j x t a 协议中,对等点之间传送的数据被称为消息。网络中所有通信都是通过发 送和接收消息来实现的,消息的传输介质是管道。 在j x t a 中定义了两种消息格式。第一种是x m l 格式,该消息是包含了按照x m l 基于j x t a 的p 2 p 资源搜索策略的研究与实现 标准格式化的数据的有效载荷的分组。x m l 消息主要应用于文本传输机制中,是发送 消息的一般格式。第二种是二进制格式,二进制消息是用于发送尽可能紧密的数据流信 息的紧凑分组。采用二进制格式是为了减少网络负荷,在网络负载过重而消息传递频繁 的情况下,一般采用二迸制消息。 ( 4 ) 管道( p i p e ) 在j x t a 中,对等点之间用管道来传输消息,它是一种异步,非直接的消息传输机 制。利用管道对等点之间可以传输任意类型的消息,如二进制代码、字符串数据、文件 等对象。 管道是发送接受消息的虚拟通道【l7 1 ,可以连接一个或多个对等点。管道是j x t a 中 一个重要的组件,它允许对等点在大多数网络条件下进行通信,不管是否存在防火墙或 其他屏障。即使不知道某个点在何处,都可以通过管道与它进行通信。 当前在j x t a 平台中实现了三种不同类型的管道寻址方案: 点对点管道:点对点的管道采用单向异步通道来连接两个不同管道,发送消息的输 出管道把消息直接发送给等待接收消息的输入管道。 传播管道:将一个输出管道连接到多个输入管道,消息被传输到所有监听的输入管 道中,这将创建多个消息的副本。 安全可靠单播管道:所有发送的消息都将接收到返回的确认消息,数据被加密。 ( 5 ) 服务( s e r v i c e ) 对等点之间能够进行一系列的活动都是通过服务而进行的。网络中的每个实体,如 果想要提供服务给对方首先必须发布自己的服务广告,告诉其他实体能提供何种服务。 同时,其他的实体通过这个服务通告来发现这个实体所提供的服务。 通常的核心服务有路由服务、发现服务、访问服务和点验证服务等等。核心服务并 不一定是全部要实现的,可以根据具体情况,选择要实现的服务。只有通过这些服务, 才能将对等网络中所有实体连接起来,从而形成真正的网络。 ( 6 ) 广告( a d v e r t i s e m e n t ) 广告是j x t a 的语言,一个广告就是一个x m l 文档。有关对等点、对等组、服务 和其他j x t a 结构的实体的信息都在广告中定义。每个广告在发布时都设有一个生命周 期( l i f e t i m e ) ,利用生命周期可以对广告进行控制。 j x t a 协议给出了下面主要7 种广告类型:对等点广告( p e e ra d v e r t i s e m e n t ,p a ) ,对 等组广告( p e e rg r o u pa d v e r t i s e m e n t ,p g a ) ,管道广告( p i p ea d v e r t i s e m e n t ) ,模块类广告 ( m o d u l ec l a s sa d v e r t i s e m e n t ,m c a ) ,模块规范广告( m o d u l es p e c i f i c a t i o na d v e r t i s e m e n t , 大连理工大学硕士学位论文 m s a ) ,模块实现广告( m o d u l ei m p l e m e n t a t i o na d v e r t i s e m e n t ,m i a ) 和集合点广告 ( r e n d e z v o u sa d v e r t i s e m e n t ,r a ) 。 ( 7 ) 端点( e n d p o i n t ) 在j x t a 应用中,端点是最基本的通信方法。一个端点就是实现了特定通信协议的 p e e r 的地址。一个p e e r 可以有多个端点,这样可以通过不同的协议来与其他p e e r 通信。 j x t a 在流的基础之上又放置了一层管道,这样把一个管道连接到端点上。使用抽象出 来的端点和管道,可以为创建p 2 p 应用提供强大的功能并降低复杂性。由于管道使用通 信协议来连接,端点描述了协议和连接的所需要的信息。因此端点可以描述h t t p ,t c p , b e e p 以及其他可以支持的通信协议。通过使用多种协议,p e e r 可以提供更有效率的方 法。 2 2 3j x t a 核心协议 j x t a 通过定义一系列协议来进行对等点之间的交流通信,对等点应用这些协议可 以发布自己的通告来广播自己的资源,还可以在对等网络中发现其他的点,并且发现网 络资源,以及路由消息等。j x t a 系统利用这些协议,构成了可以适用于各种应用目的 和计算环境的基础平台。 i x t a 协议基于x m l 消息,每个消息都是一个x m l 文档。x m l 文档定义了通信 组成部分和通信数据。这些x m l 消息在对等点之间传递,或者作为带有查询和响应较 长通信过程中的一部分被交换。x m l 消息的排列和发送规则构成了j x t a 协议。下面 详细介绍t a 的六种协议【1 8 j 。 ( 1 ) 对等点发现协议( p e e rd i s c o v e r yp r o t o c o l ,p d p ) 该协议允许一个p e e r 能发现广告,并使用这些广告发现其他节点或组。该协议通过 指定种公告类型( 如p e e r 、p e e r g r o u p ) 、一个可扩展标记语言( e x t e n s i b l em a r k u p l a n g u a g e ,x m l ) 标签名、个匹配这个x m l 标签所表示数据的字符串来定义查询。这 是t a 所有组的缺省发现协议。 ( 2 ) 对等点解析协议( p e e rr e s o l v e rp r o t o c o l ,p r p ) 该协议使一个p e e r 可以通过发送和接收查询来查找节点、组、管道和一些与服务相 关的信息。允许p e e r 发送更一般的请求,并可以接收到该请求的回应,同时可以将请求 分发到组内的一个或者多个匹配的处理器。要使用这个协议,需要提供一个查询的p e e r
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年黄山市徽城投资集团有限公司招聘10人考前自测高频考点模拟试题含答案详解
- 2025年上海越剧院公开招聘考前自测高频考点模拟试题及答案详解1套
- 2025黑龙江富裕县龙安桥镇人民政府招聘公益性岗位人员1人考前自测高频考点模拟试题及答案详解(名师系列)
- 2025北京中国热带农业科学院香料饮料研究所第一批工作人员招聘(第2号)考前自测高频考点模拟试题附答案详解(黄金题型)
- 2025年5月广东深圳市光明区应急管理局选聘一般特聘专干1人模拟试卷附答案详解
- 2025年甘肃省天水市第四人民医院招聘编外人员模拟试卷及1套完整答案详解
- 2025年河北雄安新区财政局(国资委)公开选聘兼职外部董事人才库人选模拟试卷及答案详解(典优)
- 2025贵州铜仁开放大学引进专业技术人才考前自测高频考点模拟试题完整参考答案详解
- 2025广东广州市越秀区建设街招聘辅助人员1人考前自测高频考点模拟试题及参考答案详解一套
- 2025河北雄安新区新建片区学校选聘校长及骨干教师13名模拟试卷含答案详解
- 跨境电商股权分配协议范文
- 2025年深圳中考化学试卷真题(含答案)
- 三甲医院影像科管理制度
- T/CCAS 015-2020水泥助磨剂应用技术规范
- 江苏省南京市2024-2025学年高二物理上学期10月月考试题
- TSG D2002-2006燃气用聚乙烯管道焊接技术规则
- GB/T 320-2025工业用合成盐酸
- 2024年公路水运工程助理试验检测师《水运结构与地基》考前必刷必练题库500题(含真题、必会题)
- 2025年社工招聘考试试题及答案
- 病理检查报告审核制度
- 2024秋季新教材人教版体育与健康一年级上册课件:1我们爱运动
评论
0/150
提交评论