(通信与信息系统专业论文)instlink系统的p2p技术研究.pdf_第1页
(通信与信息系统专业论文)instlink系统的p2p技术研究.pdf_第2页
(通信与信息系统专业论文)instlink系统的p2p技术研究.pdf_第3页
(通信与信息系统专业论文)instlink系统的p2p技术研究.pdf_第4页
(通信与信息系统专业论文)instlink系统的p2p技术研究.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(通信与信息系统专业论文)instlink系统的p2p技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 基于c s 架构的i n s t l i n k 系统服务器因担负巨大的处理负荷而极有可能成为系 统的瓶颈,解决该问题的最佳方法是采用p 2 p 技术,即引入负载均衡的p 2 p 网络 架构和媒体数据的p 2 p 传输,核心技术在于系统架构设计和媒体数据p 2 p 信道的 建立。 本文广泛讨论了p 2 p 原理特性,深入分析了x m p p 核心协议,d h t 技术原理 和c h o r d 协议,在系统研究了i n s t l i n k 系统结构的基础上,设计了一种基于c h o r d 协议的p 2 p x m p p 网络架构,旨在解决服务器性能瓶颈和单点失效问题,同时通 过实现防火墙穿越技术的i c e 规范,将p 2 p 模式应用于i n s t l i n k 系统的媒体数据 传输,另外p 2 p x m p p 系统也易于支持文件共享新业务。 关键字:p 2 p x m p p c h o r d 防火墙n a ti c e a b s t r a c t t h es e r v e ri ni n s t l i n ks y s t e mb a s e do nc l i e n t s e r v e rm o d em o s t l yb e c o m e st h e b i g g e s tb o t t l e n e c kw i t ht o oh e a v yl o a d ,t h eb e s ts o l u t i o nt ot h ep r o b l e mi sa d o p t i n gp 2 p t e c h n o l o g y ,t h ek e yi st od e s i g nt h es y s t e ma r c h i t e c t u r ea n di m p l e m e n tm e d i ad a t a t r a n s p o r t a t i o nb yt h ep e e rt op e e rm o d e t h i sp a p e rd i s c u s s e dt h ep 2 p t e c h n o l o g yw i d e l ya n da n a l y s e dx m p p c o r ep r o t o c o l , d h t , c h o r dp r o t o c o li nd e p t h an e ws y s t e ma r c h i t e c t u r en a m e dp 2 p x m p pb a s e do n c h o r dh a sb e e np r o p o s e dt os o l v ef l a w si nt r a d i t i o n a lx m p po n ed o m a i ns y s t e mb a s e d o nr e s e a r c h i n gi nt h ei n s t l i n ks y s t e ma r c h i t e c t u r ea n dp 2 pn e t w o r ka r c h i t e c t u r e t e c h n o l o g y , t h ep 2 p - x m p ps y s t e mc a ni m p l e m e n tl o a db a l a n c ei ns e r v e r sa n ds o l v et h e p r o b l e mo ft h eo n ep o i n tf a i l u r e b a s e do nt h ea n a l y s i so ft h ec u r r e n tt e c h n o l o g i e so f t r a v e r s i n gt h ef i r e w a l l n a t , w ei m p l e m e n t e dt h ei c e m o d u l ei ni n s t l i n ks y s t e m ,w h i c h c a nt r a v e r s em o s to ff i r e w a l l s n a t st om a k em e d i ad a t at r a n s f e ri na p o i n tt op o i n t c h a n n e l a n dt h ep 2 p x m p pa r c h i t e c t u r ec a l ls u p p o r tan e w a p p l i c a t i o ns u c ha sf i l e s h a r i n gv e r yw e l l k e y w o r d s :p 2 px m p pc h o r d f i r e w a l l n a ti c e 创新性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或 其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做 的任何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:乏堡! 日期:,夕罗i t 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。 学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文 在解密后遵守此规定) 本学位论文属于保密在年解密后适用本授权书。 本人签名:王伍仆 靳繇娅 日 朗: 护乒;, 日期: 扩夕尹多i i 第一章绪论 第一章绪论 近年来,基于分组交换的网络电话( v o i p ,v o i c eo v e ri n t e r n e tp r o t o c 0 1 ) 得到 了迅速发展,与传统基于电路交换的公共交换电话网络( p s t n ,p u b l i cs w i t c h e d t e l e p h o n e n e t w o r k ) 相比,基于i p 架构的网络电话有着费用低廉,部署方便,易 于扩展,更加安全等优势1 ,而正是费用低廉这一核心优势促使了v o l p 得到长足 发展,而由于语音网关的出现,语音的传输也不仅仅是因特网上的两台计算机( p c , p e r s o n a lc o m p u t e r ) 之问p c t o p c 模式,还可以是p c t o p h o n e ( p s t n 网络中的一 个终端) ,p h o n e t o p c 和p h o n e t o p h o n e 1 。 v o l p 系统的关键技术有媒体编码技术,因特网话音分组交换技术,控制信令 技术,防火墙n a t ( n e t w o r ka d d r e s st r a n s l a t o r ,网络地址转换设备) 穿越技术, 负载均衡技术,文件传送技术,白板技术,视频技术,语音网关技术,以及网络 安全技术等p 。其控制信令核心在于呼叫控制协议,到目前为止,主要的呼叫控 制信令协议有s i p 一1 ,h 3 2 3 ,m g c p ,h 2 4 8 m e g a c o ,l a x ,i a x 2 ,x m p p p l 等。 另外目前非常流行的网络电话拓展是基于p 2 p 架构的网络电话,s k y p e p l 即是采用 了这种模型,但该种模式的v o l p 还没有形成标准。p 2 p 组网利用了位于因特网边 缘上功能强大的个人计算机处理能力,甚至可以完成音频视频会议的任务。对于 许多类型的应用来说,现代p c 可以同时充当客户端和服务器端,微软和s k y p e 是 在p 2 p 网络上测试部署v o i p 的两个主要厂商1 。 1 1 研究的背景和意义 p 2 p 是p e e r - t o p e e r 的缩写,而p e e r 在英文罩是“同等者 ,“对等者”,“同事 及“伙伴”的意思,p 2 p 也就可以理解为“伙伴对伙伴”,或对等网络。p 2 p 技术 被财富杂志评为将改变因特网未来的四大技术之一,甚至是无线宽带因特网 的未来技术。p 2 p 技术允许一个用户直接连接到另一个用户的计算机,并进行文件 共享和交换,一改以往通过服务器浏览和下载的方式,信息需求者同时是信息提 供者,同一信息的需求越多,速度就越快,这大大提高了信息传输的速度和效率p 1 。 从技术的角度来看,p 2 p 并不是一种全新技术,在2 0 世纪7 0 年代就已出现, 其典型代表是u s e n e t 和f i d o n e t 这两个分散,分布的信息交换系统。真正的p 2 p 技术的大规模应用起源于2 0 世纪9 0 年代的n a p s t e r 。第一代p 2 p 网络采用中心控 制网络体系结构,早期的n a p s t e r 采用的也是这种结构,它采用快速搜索算法,排 队响应时间短,使用简单的协议能够提高性能和弹性,但缺点是容易中断服务。 第二代p 2 p 网络采用分散分布网络体系结构,不再使用中心服务器,系统不会因 为一个网络节点的失效而全部瘫痪,系统健壮性能好,缺点是每次搜索在全网上 i n s t l i n k 系统的p 2 p 技术研究 进行泛洪,搜索速度慢,排队响应时间长。这种模式具有自组织性,故易于扩展, 特别适合自组织网上的应用,如即时通信等。第三代p 2 p 混合体系结构,用分布 的超级节点取代中心检索服务器,采用分层次的快速搜索改进搜索性能,缩短了 排队响应时间,数据内容存储在分布的存储器和客户终端中,通过快速检索系统 可以快速发现内容分布存储的位置。目前常用的p 2 p 软件如b t ,g n u t e l l a 都属于 这种结构。第四代p 2 p 技术目前正在发展中,主要发展的技术有动态端口选择和 双向下载,核心的技术是使用动态选择传输端口来替代传统固定传输端口,( 端口 一般选择1 0 2 4 - 4 0 0 0 之间的端口号,有些甚至允许使用h t t p 的8 0 端口) 以及多 路并行下载同时上传文件,取代以前只能下载完全后才能上传的模式来达到加快 文件分发速度的目的,以上四代p 2 p 系统都属于无组织的p 2 p 网络,目前学术界 在研究的是有组织的p 2 p 网络,使用的p 2 p 协议包括c h o r d p , b a m b o o p l , p a s t r ) r m 1 ,t a p e s t r y 1 ,和c a n 坦1 等。正在研究的新一代p 2 p 应用包括多播和网 络存储等【3 1 。 p 2 p 技术的主要应用领域有:文件下载,视频直播,网络电话( v o i p ) ,网络 游戏,网络相册和协同计算等领域,其应用的物理环境涉及到各种有线和无线, 固定和移动等网络环境,可以说我们j 下进入一个e v e r y t h i n go v e rp 2 p 的时代。 p 2 p 技术在v o l p 系统中应用取得成功最为典型的是s k y p e 软件。s k y p e 的成 功与其采用了p 2 p 技术有关,同时s k y p e 也推进了p 2 p 技术的发展,使得p 2 p 具 有更广泛的意义,即p 2 p 是指网络中的所有节点都动态地参与到路由,信息处理 和带宽增强等工作中,而不是单纯依靠服务器来完成这些工作,实现了利用分散 的网络资源,使得语音呼叫接通率和话音质量在很大程度上甚至超过了传统的电 话网络。在技术上s k y p e 的优势集中体现在采用端到端的加密方式保证了传输信 息的安全;几乎可以穿越所有类型的防火墙;使用简单;功能强大,除了提供语 音通话功能外还支持即时消息,搜索,文件传送等服务;自动协商最佳编码方案 占用带宽低;跨多种平台;为每个加密呼叫智能地搜索最佳传输路径并及时动态 更新等。 1 2 研究现状 p 2 p 技术在v o l p 领域的应用,目前的研究主要集中在将p 2 p 与s i p 相结合的 p 2 p s i p ( p e e r t o p e e rs e s s i o ni n i t i a t i o np r o t o c 0 1 ) 刘领域,通过引入分布式哈希表 ( d h t ,d i s t r i b u t e dh a s h t a b l e ) 技术,增强了系统的的扩展性和健壮性,目l j 的 p 2 p s i p 主要是通过两种方式来捆绑p 2 p 技术和s i p 协议,p 2 p o v e r - s i p 和 s i p u s i n g p 2 p ,前一种方式使用s i p 消息来建立和维持p 2 po v e r l a y 网络( o v e r l a y , p 2 p 网络在物理连接的基础上构建的逻辑网络) 。这种方法的优点是s i p 协议能够 第一章绪论 很好地使用防火墙穿越技术如i c e ,缺陷是p 2 po v e r l a y 层的维持和控制操作都被 封装成s i p 消息格式,致使s i p 消息包含了过多的状态切换。后一种方式是p 2 p o v e r l a y 为s i p 请求提供目的地址定位功能,使用c h o r d ,b a m b o o ,p a s t r y ,t a p e s t r y 等d h t 协议的p 2 po v e r l a y 层提供定位功能,而不是由传统集中式的s i p 服务器来 提供,这样的方式能减少s i p 部署成本,另外p 2 po v e r l a y 的维护是由p 2 p 消息而 不是s i p 消息提供的,避免了因p 2 p 层维护使用s i p 消息时包含不必要的的头部 信息造成的协议效率下降问题,但该种模式也有缺陷,比如s i p 呼叫目的端定位 困难等。 目前p 2 p s i p 相关项目和协议研究主要有美国威廉玛丽学院的p 2 p s i p 项目 ( s o s i m p l e ) ,美国哥伦比亚大学的p 2 p s i p 项目,以及德国汉堡大学关于p 2 p s i p 安全相关的研究项目,另外i e t f 组织正在积极接收和制定p 2 p s i p 相关协议草稿, 这些草案主要来自m i t ,哥伦比亚大学等高校和思科,华为等商业组织。 x m p p 协议( r f c 3 9 2 0 ) 是一种基于x m l 标记语言的可扩展即时消息出席协议 规范,它有着特别的优势,主要体现在扩展性,灵活性,开放性,安全性,分布 式和多样性等。基于x m p p 的扩展j i n g l e 协议就是针对语音应用提出的。相对于 s i p 协议,x m p p 在可扩展性,开放性以及安全性等方面都有很大的优势。目前为 止,基于x m p p 的扩展协议仍然在进行中,提出了大量的诸如消息订阅,文件共 享等多种网络应用的扩展协议。 v o i p 的技术难点在于音视频编码,防火墙n a t 的穿越,负载均衡和互联互通 问题,引入p 2 p 技术的x m p p 系统能够很好地解决除音视频编码技术之外的所有 挑战。防火墙n a t 穿越目前主要有应用层网关技术,m i d c o m 中间盒技术,s b c 技术,u p n p 技术,t u n n e l 技术以及s t u n ,t u r n ,i c e 相关协议的解决方案等, 其中i c e 协议是目前研究和应用最广泛的方案。 1 3 论文的主要工作 论文源于西安电子科技大学通信软件课题组p 2 p 多媒体群组通信i n s t l i n k 系 统,该系统基于x m p p 及其扩展协议,目前支持即时消息,语音和语音会议,视 频和视频会议,群组通信,消息订阅以及文件传输等多种网络应用。 本文通过对基于x m p p 扩展的j i n g l e 协议和p 2 p 相关协议( c h o r d 协议) 的 分析,提出了一种p 2 p x m p p 模型,对于提高系统的容量,健壮性以及网络服务 实时性等方面都有着显著得改善,并在实际的系统中实现了防火墙n a t 穿越的 i c e 模块,将p 2 p 模式应用于i n s t l i n k 系统,支持了j i n g l e 协议规范关于媒体数据 端到端传输的要求。 4 i n s t l i n k 系统的p 2 p 技术研究 1 4 论文的内容安排 本文主要研究i n s t l i n k 系统中的p 2 p 技术和防火墙n a t 穿越原理以及相关协 议,并设计出一种基于c h o r d 协议的p 2 p x m p p 网络模型,同时在实际的i n s t l i n k 系统中实现了穿越防火墙n a t 功能的i c e 模块,具体章节安排如下: 第一章绪论;阐述论文的主要工作和相关理论的研究现状。 第二章x m p p 系统分析与p 2 p 技术原理;分析了基于x m p p 核心协议及其系 统架构以及多媒体会话扩展协议j i n g l e ,同时概要介绍了p 2 p 相关协议,详细分析 了c h o r d 协议,突出p 2 p 协议在增强v o l p 系统的扩展性,健壮性,以及提高资源 定位效率方面的突出作用。 第三章防火墙n a t 穿越技术原理;本章首先分析当前主要的防火墙n a t 穿 越解决方案,然后着重分析了n a t 设备的分类和各自的特点,并介绍了u d p 打 洞技术原理。 第四章p 2 p x m p p 系统模型设计;设计一种基于c h o r d 的p 2 p x m p p 网络模 型,分析了该系统的工作方式,指出在提高系统容量和健壮性,克服单点失效与 性能瓶颈方面的技术优势。 第五章i n s t l i n k 系统的i c e 模块实现;该章描述了i n s t l i n k 系统端到端媒体信 道建立i c e 模块的实现细节; 第六章总结与展望;对全文进行总结,并对未来的工作进行展望。 第二二章x m p p 系统分析与p 2 p 技术原理 第二章x m p p 系统分析与p 2 p 技术原理 p 2 p 技术在v o i p 领域中的应用体现在两个层面,其中之一是关于组织管理网 络元素的系统架构问题,另一层是解决由防火墙n a t 设备引起的对等端建立直连 信道问题。 本章集中介绍前一个问题的背景知识,由于i n s t l i n k 系统是基于x m p p 框架 结构的单域系统,所以本章首先分析了x m p p 核心协议,x m p p 系统的框架结构 以及基于x m p p 的多媒体会话扩展协议j i n g l e ,通过对x m p p 框架单域i i n s t l i n k 系统的分析,可以得出该系统接结构存在单点失效和性能瓶颈缺陷,然后分析p 2 p 技术原理,重点介绍p 2 p 网络分类,基于d h t 技术的结构化p 2 p 网络以及c h o r d 协议。通过p 2 p 技术的介绍可以发现,p 2 p 技术在解决单点失效和性能瓶颈缺陷 方面具有特别的优势。 2 1x m p p 核心协议与协作架构 2 1 1x m p p 协议由来与特点 j a b b e r 作为即时消息系统的一种技术,是由j e r e m i r em i l l e r 等人1 9 9 8 年首次 开发,随后i e t f 将其制定为标准协议,并更名为x m p p ( e x t e n s i b l em e s s a g i n ga n d p r e s e n c ep r o t o c o l ,扩展即时消息与出席协议) ,相关协议规范为r f c 3 9 2 0 和 r f c 3 9 21 ,j a b b e r 标准化组织( j a b b e rs t a n d a r d sf o u n d a t i o n ,j s f ) 还制订了更多的 扩展协议( x m p pe x t e n s i b l ep r o t o c o l ,x e p ) ,j i n g l e 协议( x e p 0 16 6 叫) 即是其 中之一。x m p p 系列协议是针对i p 网络即时消息,出席,多方聊天,话音与视频 通信,协作,轻量级中间件,内容聚合,以及x m l 数据路由等一系列应用提出的 技术规范集合。x m p p 在技术上拥有特别的优势,主要体现在开放,标准,稳定, 去中心化,安全,极强的扩展性,灵活性,多样性等方面,尤其以很强的扩展性, 信息安全性和开放互联的特性著称。 2 i 2x m p p 核心协议 i n s t l i n k 系统应用层使用的是x m p p 核心及其扩展协议,x m p p 实质上是建立 在扩展标记语言x m l 之上的即时消息系统技术,x m l 的最大特点是能够结构化 组织数据,标记数据的属性和值域。x m l 流定义为两个x m p p 实体之间通过网络 交换的x m l 元素集合,由打开标签 和关闭标签 作为开始和结束 的标记符号。x m l 节定义为会话一端向另一端发送具有语义的结构化数据单元, 它直接位于 的子层,x m p p 定义了三种x m l 节: , 6 i n s t l i n k 系统的p 2 p 技术研究 和 - - - - 种类型, t - _ - - - - - _ _ r 一;二妄- n 磊;一一一 l 叫p 陀恕胁 i 妯e g e t o 一 ,了一 i _ 一一 1 1 e 二二兰繁兰二二二_ 仁二三篓爱兰二 二二二圣墨贬二二二3 图2 4j i n g l e 核心流程 其中资源定位是指被叫用户可能有多个代理终端,主叫用户需要确定和哪一 个用户代理进行通信,实现该功能主要靠资源发现扩展协议和实体能力扩展协议 获得相关信息。 另外在协商传输地址过程中,媒体数据的传输j i n g l e 协议要求使用端到端的传 输模式,x e p 0 1 7 6 是关于x m p p 系统建立p 2 p 通信的扩展协议,也即是i c e 协议 在x m p p 框架下的映射。端到端媒体信道建立的难点在于网络中防火墙n a t 设备 的存在,私有网络主机发送和接收的数据包在经过n a t 时网络地址将被更改,同 时防火墙n a t 出于安全考虑往往拒绝接收来自外部网络的连接请求,这都给端到 端通信网络地址的确定带来困难,本文的另一项工作即是解决防火墙n a t 穿越问 题。 1 0 i n s t l l n k 系统的p 2 p 技术研究 2 3p 2 p 技术原理 i n s t l i n k 系统存在单点失效和性能瓶颈问题的原因在于只有一台服务器,在实 际的应用中某个域名内可能存在大量用户,一台服务器将因负荷过重很容易出现 无法及时响应用户请求的情况,而通过将一台服务器扩展为多台服务器又不能简 单地通过多配置几台相同服务器来解决,因为这样将需要维护服务器之间的一致 性而增加配置的复杂性,增大性能损耗,服务器性能提升十分有限,而如果恰当 引入p 2 p 技术来分散处理负荷,将有效的解决性能瓶颈问题,如果客户端检测到 负责自己的某台服务器出现网络故障,将向其他在线服务器发起注册请求,这就 能解决一台服务器出现故障所有客户端都无法使用系统服务的单点失效问题。引 入p 2 p 扩展的难点在于如何将大量用户分散到不同服务器而又不需要进行同步的 操作,并能够在服务器之间快速定位到用户,本节通过对p 2 p 网络的演变过程以 及目前主流技术的介绍详细分析p 2 p 相关技术原理。 p 2 p 网络是一种具有较高扩展性的分布式系统结构,其对等概念是指网络中的 物理节点在逻辑上具有相同的地位,而并非处理能力的对等。以n a p s t e r 软件为代 表的p 2 p 技术,其实质在于将因特网的集中管理模式引向分散管理模式,将内容 从中心单一节点引向网络的边缘,从而充分利用因特网中众多终端节点所蕴含的 处理能力和潜在资源。相对于传统的集中式客户服务器( c s ) 模型,p 2 p 弱化了 服务器的概念,系统中各个节点既可请求服务也可提供服务,节点之间可以直接 交换资源和服务而不必通过服务器。p 2 p 技术最大特点是用户之间共享数据,其核 心技术在于分布式对象的定位机制,这也是提高网络可扩展性和网络带宽问题的 关键所在。 2 3 1p 2 p 网络分类 p 2 p 网络可分为混合p 2 p 网络和纯p 2 p 网络,二者的区别在于是否包含中心 服务器,混合p 2 p 网络又称集中目录式p 2 p 结构,它仍然具有中心化的特点,其 用户注册和资源检索过程类似于传统的c s 结构,区别在于所有资料并非存在服 务器上,而是存储在各个节点中,查询节点根据网络流量和延迟等信息选择合适 的节点建立直接连接,而不必经过中心服务器。纯p 2 p 网络完全取消了中心服务 器,根据路由算法不同纯p 2 p 网络可进一步细分为非结构化的纯p 2 p 网络和结构 化的纯p 2 p 网络,前者的路由算法核心是泛洪,后者路由算法主要是d h t ( d i s t r i b u t e dh a s ht a b l e ,分布式哈希表) 技术。在v o i p 领域中因为需要集中控管 完全取消服务器的功能是不合理的,目前较好的解决方法是将网络节点分为两种, 一种本质上行使服务器功能的超级节点,另一种是普通节点,超级节点之间通过 p 2 p 机制互联,为普通节点提供注册服务。 第二章x m p p 系统分析与p 2 p 技术原理 下面介绍p 2 p 互联技术的演变过程,纯p 2 p 网络取消了中心服务器,在非结 构化的纯p 2 p 网络中,每个用户随机接入网络,并与自己相邻的一组节点通过端 到端连接,从而构成逻辑覆盖的网络,对等节点之间的内容查找和内容共享都是 直接通过相邻节点广播接力传递的,对于v o l p 系统而言内容的含义可以是某个被 呼叫端的网络位置,同时每个节点还会记录搜索轨迹,以防止搜索坏路的产生。 每个对等节点的定位请求被直接广播到与它直接相邻的对等节点,各对等节点又 以同样的方式广播到各自相邻连接的对等节点,直到收到应答或达到最大泛洪步 数,从而发起原始查询的终端即可直接向对等节点获取内容。因为这种非结构化 的纯p 2 p 网络在定位算法上效率低下,且极易造成网络拥塞,占用大量网络带宽, 从而导致整个网络的可用性变差,目前大量的研究工作都集中在如何构建高度结 构化的纯p 2 p 系统来解决高效查找问题上,最新的研究成果都是基于d h t 的分布 式发现和路由算法,这些算法避免了使用中心服务器,也没有采用基于广播的资 源定位算法,而是通过分布式散列函数,将输入的关键字唯一映射到某个节点上, 然后通过一定的路由算法与该节点建立连接,从而获取存储目标资源的网络地址 信息。 2 3 2d h t 技术 p 2 p 网络的核心技术在于分布式对象的定位机制,该问题的定义是动态网络中 某一节点发布一个共享资源,而网络上的另外一个节点如何获取到该资源的存储 位置问题,在v o i p 领域这个问题则演变为主叫方如何在动态网络中快速定位被叫 方的网络地址问题。 混合p 2 p 网络的定位机制是通过中心服务器协作完成的,服务器上存储发布 者的网络地址和资源的映射关系,查询者只需要向服务器请求即可获得所需资源 的存储地址,如图2 5 所示。 图2 5 混合p 2 p 网络资源发现原理 非结构化的纯p 2 p 网络定位机制是通过广播泛洪的方式向相邻节点发送查询 消息完成的,每个对等节点的定位请求被直接广播到与它直接相邻的对等节点, 1 2 i n s t l i n k 系统的p 2 p 技术研究 各对等节点又以同样的方式广播到与它直接相邻的节点,直到收到应答或达到最 大泛洪步数,从而发起原始查询的终端即可直接向对等节点获取内容,如图2 6 所 不。 图2 6 非结构化纯p 2 p 网络的资源发现原理 而结构化的纯p 2 p 网络采用分布式哈希表d h t 技术定位资源信息如图2 7 所 示。d h t 技术有多种实现算法,图2 7 是基于c h o r d 算法的实现,该网络被分为 两类节点,发布者将资源名称和存储位置上交给c h o r d 环上负责维护该资源的节 点,资源请求者首先向负责自己的c h o r d 环节点请求资源位置,随后在c h o r d 环 内部通过类似于折半查找的算法快速定位到负责维护资源的节点,从而完成快速 定位任务,下面分析d h t 技术原理。 k u p ( t i t l e ) c l i e n t 图2 6 结构化纯p 2 p 网络的资源发现原理 哈希表结构使用一个关键字代表一个资源信息,然后对关键字进行哈希运算, 比如运算结果为2 ,表示应该由哈希表中序号为2 的哈希桶来存储该关键字对应的 数据资源,哈希桶是用来存储资源数据索引记录的。以c h o r d 算法为例,一个哈 希桶即代表c h o r d 环上一个网络节点。 每个网络节点都维护一张k e y v a l u e 表,记录k e y 对应资源的存储地址, 且每个节点只维护整个分布式哈希表很小一部分内容,即将资源定位用的索引( 其 结构通常表示为二元组: ) 分散存储 在整个p 2 p 网络中,这样哈希表的存储和查找操作就会涉及p 2 p 网络中的多个节 第二章x m p p 系统分析与p 2 p 技术原理 点。 分布式哈希表实质上只支持两种操作:资源数据( v a l u e ) 的插a ( i n s e r t ) 和查询 ( 1 0 0 k u p ) 动作,数学表示为h a s h t a b l e i n s e r t ( k e y ,v a l u e ) 和h a s h t a b l e 1 0 0 k u p ( k e y ) :这 里的数据资源( v a l u e ) l 为容可以是数据对象,文件或者i p 地址等任何信息。关键字 ( k e y ) 必须全局唯一,对字符串或i p 地址进行s h a 1 哈希运算获得k e y 值,即 k e y = s h a 1 ( s t r i n g i p ) ;其插入过程是首先将需要发布的资源名称k e y 进行哈希运 算获取结果,然后依据运算结构决定由哪一个网络节点来维护该资源的索引信息, 然后将该资源的索引项交由负责节点进行维护,其查找过程也需要首先将资源名 称进行哈希运算,获得哈希运算结果以后,在d h t 网络中依照特定的路由算法快 速定位到负责维护该资源的网络节点,然后获取资源的存储位置信息,d h t 并不 存储实际的资源数据。 在v o i p 领域中,超级节点需要维护普通节点的注册信息,超级节点之间通过 p 2 p 机制互联,只有超级节点需要维护索引表,大量的普通节点将根据普通节点对 应的用户名经过哈希函数映射到全局地址空间,再将映射空问进行划分,每个超 级节点只负责存储属于自己空间的索引项。 下面分析不同的网络类型定位算法的效率,基于混合p 2 p 的网络资源定位算 法的空间复杂度为o ( n ) ,其中n 为网络中节点总数,时问复杂度为o ( i ) ,但该种 类型网络的缺陷在于网络容错性能较差,中心服务器负载较大且中心服务器如果 出现故障将导致整个网络瘫痪。基于非结构化纯p 2 p 网络的资源定位算法具有较 强的容错性能,但不宜扩展,最差情况下发现算法时间复杂度为o ( n ) ,该算法复 杂度依赖于网络拓扑结构,它的存储资源数据的空问复杂度为o ( 1 ) 。基于d h t 技 术的结构化纯p 2 p 网络的资源定位算法具有较高的扩展性,定位算法的时间复杂 度为o ( 1 0 9 n ) ,存储资源数据的空间复杂度为o ( 1 0 9 n ) 。表2 1 给出了混合p 2 p 网 络,非结构化纯p 2 p 网络和结构化的p 2 p 网络三种网络类型的性能比较,由图可 以看出结构化的p 2 p 在扩展性和容错性能方面明显优于另外两种网络类型。 表2 i 不同p 2 p 网络性能比较 性能抽象性易用性扩展性负载均衡容错性白组织易于管理 结构化p 2 p商高高支持高支持低 混合p 2 p中等中等低不支持高支持中等 非结构化p 2 p中等局低4 i 支持说情况定支持低 以d h t 技术进行路由模型设计时,首先需要确定通过哈希函数进行虚拟地址 空间映射的规则,虚拟地址空间的设计有多种方式,目前主要有c h o r d ,c a n ,p a s t r y 和t a p e s t r y 。c h o r d 采用的虚拟地址空间为m 位的循环地址空间节点之间构成环形 结构,c a n 系统采用的是多维地址空间,p a s t r y 也是使用循环地址空间,t a p e s t r y 是在p a s t r y 基础上开发的,它采用的是超立方地址空间。四种不同的路由算法复 1 4 i n s t l i n k 系统的p 2 p 技术研究 杂度的比较如表2 2 ,目前主要使用的是c h o r d 路由模式。 表2 2 四种d h t 路由算法性能比较 名称 i n s e r t 时问复杂度存储窄问复杂度 l o o k u p 时间复杂度 c h o r d o ( n l o g n )o ( i o g n ) o ( i o gn ) l , c a

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论