




已阅读5页,还剩72页未读, 继续免费阅读
(信息与通信工程专业论文)对等网分析平台中若干关键技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着对等计算( p 2 p ) 的广泛应用,p 2 p 网络的研究成为热点。然而,p 2 p 网 络动态性强、节点数量规模大、协议种类繁多,因此对p 2 p 网络研究工具提出了 新的要求。本文提出的对等网络分析平台( p 2 p p a :t h ep l a t f o l i nf o r a n a l y z i n gp 2 p ) 为p 2 p 网络的研究提供了两种方式:仿真p 2 p 协议和采集真实对等网信息。对等 网分析平台提供的对等网仿真很好地模拟了对等网的动态性并能监视网络运行状 态;而对等网信息采集实现了大规模、低成本地采集对等网运行相关信息。 本文首先全面深入地综述了对等网分析技术的相关研究工作,介绍了对等网 分析系统概念和拟解决的关键技术。在此基础上,提出了动态仿真网络构建技术、 快速计算网络直径算法和跨界兼容技术。 动态仿真网络构建技术是系统提供多种方式改变网络中节点状态和边属性的 技术。对于节点的状态改变,动态仿真网络构建技术提供的系统触发状态迁移技 术使节点状态迁移发生的时间和对象准确;而用户触发状念迁移技术,通过用户 可视化的操作,在仿真运行中及时的改变节点状态,提供了灵活的节点状态改变 方式。动态仿真网络构建技术还提过多种分布函数,设置边上时延和带宽的分布; 并提供接口使时延和带宽在系统运行时自动调整。 本文提出的快速计算大规模p 2 p 网络直径算法是结合图压缩的相关知识和弗 洛伊德( f l o y d ) 算法。本文通过大量的实验,研究分析了采用该算法对服从随机 分布和幂率分布的网络拓扑的计算效果。通过对以节点扫描次数为基准的时间复 杂度的实验分析,以及与其他划算算法的比较分析,验证了该算法的性能、效率 以及可行性等。 为了能低成本、大规模的采集真实对等网信息,p 2 p p a 采用跨界兼容技术, 使平台虚拟出的大量节点连续的、独立的和真实对等网实体进行信息交互,从而 采集真实对等网信息。 最后,本文展示了使用p 2 p p a 采集到的b t 网络i p 地址分布和对p 2 p p a 性 能进行了测试,证明各个模块运作正常,到达了低成本、大规模、能模拟p 2 p 网 络动态性的设计目标。 关键字:p 2 p 分析技术,p 2 p 仿真技术,p 2 p 信息采集技术,网络直径算法 a b s t r a c t a b s t r a c t a c c o r d i n gt ot h es t a t i s t i cc o l l e c t e di nr e c e n ty e a r s ,p 2 p ( p e e r - t o p e e r ) ,w h i c hi st h e m o s tp r e d o m i n a n ta p p l i c a t i o no fi n t e r n e tf a m i l y , c a r r i e so v e r6 0 i n t e r n e tt r a f f i c s o p 2 ph a sb e c o m eo n eo ft h eh o t t e s ti s s u e si ni n f o r m a t i o nt e c h n o l o g yd o m a i nr e c e n t l y h o w e v e r , t h ef e a t u r e so fp 2 pn e t w o r k ,s t r o n gd y n a m i c ,l a r g e s c a l ea n dp l e n t yo fp 2 p p r o t o c o l s ,r e q u i r en o v e lt o o l st or e s e a r c hi t t h ep l a t f o r mf o ra n a l y z i n gp e r f o r m a n c eo f p 2 p ( p 2 p p a ) p r o p o s e db yt h i sp a p e rp r o v i d e st w ow a y st oa n a l y z et h ep e r f o r m a n c eo f p 2 p :s i m u l a t i n ga n dc o l l e c t i n gt h ei n f o r m a t i o nf o r mr e a lp 2 pn e t w o r k o no n es i d e , p 2 p p a pc a l ls i m u l a t et h ep 2 pn e t w o r kd y n a m i ca n ds u r v e i l l et h es t a t e so fp 2 p s i m u l a t i o n o nt h eo t h e rs i d e ,i tr e a l i z e sl o wc o s t ,l a r g e - s c a l et oc o l l e c tt h ei n f o r m a t i o n f o r mr e a lp 2 pn e t w o r k a tf i r s t ,t h i sp a p e rs u r v e y st h er e l a t e dt e c h n o l o g yo fa n a l y z i n gp 2 p , d e s c r i b e st h e r e l a t e dc o n c e p to fa n a l y z i n gp 2 p s y s t e ma n dt h ek e yt e c h n i q u e st or e s o l v e b a s e do nt h e a b o v ew o r k ,t h em a i nc o n t r i b u t i o no ft h i s p a p e ri sp r o p o s i n gt h et e c h n o l o g yo f c o n s t r u c t i n gd y n a m i cs i m u l a t i o nn e t w o r k , t h ea l g o r i t h mf o rf a s tc o m p u t e rn e t w o r k d i a m e t e ra n dt h et e c h n o l o g yo fc o m p a t i b i l i t y 、析mr e a lp 2 pn e t w o r k t h et e c h n o l o g yo fc o n s t r u c t i n gd y n a m i cs i m u l a t i o nn e t w o r k , p r o v i d e sd i v e r s i t y w a y st oc h a n g et h es t a t e so fn o d e sa n dt h ev a l u eo fe d g e s a t t r i b u t e f o rc h a n g i n g s t a t e so fn o d e s ,t h et e c h n o l o g yo f c h a n g i n gn o d e ss t a t e st r i g g e r e db ys y s t e mc a nc h a n g e w e l la n dt r u l y ;, t h et e c h n o l o g yo f c h a n g i n gn o d e ss t a t e st r i g g e r e db yu s e rc a nc h a n g e f l e x i b l y t h et e c h n o l o g yo fc o n s t r u c t i n gd y n a m i cs i m u l a t i o nn e t w o r k , a l s op r o v i d e s m a n yf u n c t i o n sf o rs e tt h ev a l u e so fb a n d w i d t ha n dd e l a yo fe d g e sa n dp r o v i d e st h e i n t e r f a c et oc h a n g et h e ma u t o m a t i c a l l y f u r t h e r m o r e ,b e c a u s eo ft h es t r o n gd y n a m i co fp 2 pn e t w o r ka n dt h el o n gt i m ef o r s i m u l a t i n gt h el a r g es c a l ep 2 pn e t w o r k ,o b s e r v a t i o no fp 2 ps i m u l a t i o nr u n n i n gi n s t a n c e i n r e a lt i m ei s r e q u i r e d a na l g o r i t h m ,q u i c k l yc o m p u t i n gt h en e t w o r kd i a m e t e r , i s p r o p o s e dw h i c hc a ng e tt h el a r g es c a l ep 2 pn e t w o r kd i a m e t e ri nr e a lt i m e ,o n eo ft h e m o s ti m p o r t a n tn e t w o r kp a r a m e t e r t h ea l g o r i t h m ,f a s tc o m p u t i n gn e t w o r kd i a m e t e r , c o m b i n e sk n o w l e d g eo fg r a p hc o m p r e s s i n ga n df l o y da l g o r i t h m t h i sp a p e rr e s e a r c h e s i l a b s t r a c t a n da n a l y z e st h ea l g o r i t h mb yv a r i o u se x p e r i m e n t so fr a n d o mn e t w o r kt o p o l o g y c o m p r e s s i n ga n dp o w e r - l a wn e t w o r kt e p o l o g yc o m p r e s s i n g , a n dv e r i f i e st h ec a p a b i l i t y , e f f i c i e n c ya n df e a s i b i l i t yo fi tw i t ht h ea n a l y s i so ft i m ec o m p l e x i t y , w h i l ec o m p a r e sw i t h o t h e rc o m p r e s s i n ga l g o r i t h m s m o r e o v e r , t h i sp a p e rp r o p o s e st h et e c h n o l o g yo fc o m p a t i b i l i t yw i t hr e a lp 2 p n e t w o r k ,w h i c hc a nm a k et h ep l e n t yv i r t u a ln o d e sc o n n e c tt h ee n t i t i e so nt h er e a lp 2 p n e t w o r kc o n t i n u o u s l ya n di n d e p e n d e n t l y u s i n gt h et e c h n o l o g y , p 2 p - p ac a nc o l l e c tt h e i n f o r m a t i o no fr e a lp 2 pn e t w o r kl o w - c o s t l ya n dl a r g e s c a l e l y a tl a s t ,t h ee x h i b i t i o no fi pd i s t r i b u t i n go nb tn e t w o r kc o l l e c t e db yp 2 p - p aa n d t h et e s to fp 2 p - p ap e r f o r m a n c ei sd e s i c r i b e ,w h i c hc a np r o v ep 2 p p aw o r k sw e l la n d a c h i e v et h ep u r p o s e s ,m e t h o do fl o w - c o s tt oc o l l e c tt h ei n f o r m a t i o no fl a r g e - s c a l ep 2 p n e t w o r ka n dt os i m u l a t ed y n a m i cp 2 pn e t w o r k k e y w o r d s :t e c h n o l o g yo fa n a l y z i n gp 2 pn e t w o r k ,p 2 ps i m u l a t i o n ,t e c h n o l o g yo f c o l l e c t i n f o r m a t i o no fp 2 p , a l g o r i t h mf o rn e t w o r kd i a m e t e r i i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作 及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为 获得电子科技大学或其它教育机构的学位或证书而使用过的材料。与 我一同工作的同志对本研究所做的任何贡献均己在论文中作了明确的 说明并表示谢意。 签名:塑墅日期:少于年f 月d 日 关于论文使用授权的说明 本学位论文作者完全了解电子科技大学有关保留、使用学位论文 的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘, 允许论文被查阅和借阅。本人授权电子科技大学可以将学位论文的全 部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描 等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后应遵守此规定) 签名:扬耆 导师签 日期:五够年f 月嗲日 第一章引言 1 1研究背景 1 1 1对等计算相关介绍 第一章引言 对等计算( p 2 p :p e e r - t o p e e r ) 模型是继客户机h t 务器( c s :c l i e n t s e r v e r ) 模型之后的新一代互联网计算模型,其产生的主要原因在于个人电脑计算能力的 提高以及满足用户之间资源共享的需求。o r a m 等【1 】给出了对等计算一个基本定义, 它在参考文献【2 j 中得到进一步细化: ( 一个对等端到对等端( p 2 p ) 系统是) 等同的、自治的实体( 对等端) 构成 的一个自组织的系统,( 它的) 目的是在一个联网的环境中共享分布式的资源,避 免中心化的服务。 简单来说,在对等计算模型中,其核心思想是所有参与系统的节点处于完全 对等的地位,没有客户机和服务器之分,也可以说每个节点既是客户机也是服务 器,既向别人提供服务,也享受来自别人的服务【3 】。 第一个对等计算重要的是实例是,n a p s t e r 在1 9 9 9 年推出后的迅速普及。此后, 越来越多的对等计算软件开始发布并流行,如g n u t e l l a 、f r e e n e t 、b i t t o r r e n t 、k a z a a 、 s k y p e 、p p l i v e 等。这些对等计算应用地迅速普及,说明该技术人们完全能接受对 等计算思想。根据具体应用的不同,可以把对等计算网络分为以下几种类型【4 j : ( 1 ) 提供内容共享的对等计算网络,如n a p s t e r 、g n u t e l l a 、b i t t o r r e n t 等; ( 2 ) 提供对等计算和存储共享的对等计算网络,如s e t i h o m e 、a v a k i 、p o p u l a r p o w e r 等; ( 3 ) 提供协同处理和服务共享的对等计算网络,如j x t a 、m a g i 等; ( 4 ) 提供即时通讯的对等计算网络,如s k y p e 等; ( 5 ) 提供流媒体播放的对等计算网络,如p p l i v e 、p e e r c a s t 、p p s t r e a m 等。 由于对等计算中的节点功能大致相当,没有传统上客户端和服务器的明显分 割界限。也就是说,在对等计算中,允许客户端为其他客户端传送数据,从而减 , b l l 务器端的压力。因此,对等网的规模相对于传统的c s 模型很容易扩展。现 实证明,随着对等计算网络规模的扩大和应用的增长,对等计算系统的流量在网 电子科技大学硕十学位论文 络总流量中所占的比例也急剧增长。 根据威斯康星大学的统计,对等计算应用所占的网络流量在2 0 0 1 年就达到总 流量的3 0 ,而w e b 的流量只占总流量的1 9 【5 1 。南加州大学在2 0 0 2 年统计发现 对等计算应用流量所占带宽为3 3 6 【5 1 。根据互联网数据分析合作协会( c a i d a : c o o p e r a t i v e a s s o c i a t i o nf o ri n t e r n e td a t a a n a l y s i s ) 的统计,2 0 0 2 年各种对等计算系 统占用的总流量已超过美国城市骨干网的4 0 【6 】。c a i d a 还分别在2 0 0 1 年1 0 月 和2 0 0 2 年9 月对都市媒体光纤网络进行测量并统计各类应用程序所占带宽的百分 比,结果发现对等计算应用程序流量占总出入流量的百分比前一年增长了6 倍【6 】。 此后,虽然随着各种对等计算系统软件的不断增加和端口号的可变性给对等计算 系统流量的测量带来了一定的困难,但2 0 0 5 年仍有报告表明对等计算系统的流量 还在不断增长,并没有下降的趋势【7 】【8 1 。在2 0 0 7 年6 月5 同召开的“2 0 0 7 年宽带 世界论坛亚洲会议 上,中国工程院副院长邬贺铨指出,根据中国运营商的统计, 中国的对等计算流量白天占网络总流量的3 0 到6 0 ,晚上则占网络总流量的5 0 到9 0 ,已经是美国的三到四倍【9 】。 1 1 2 对等网研究面临的困难 对等计算的迅速发展,对等网的研究成为工业界和学术界的热点问题。其主 要面临着以下一些困难: ( 1 ) 网络结构复杂 对等计算网络是基于互联网而发展起来的,属于应用层网络。执行不同的对 等计算协议而构建的对等计算网络,无论是从网络拓扑结构、网络直径、网络度 分布,还是从网络时延、网络带宽等各方面而言都是不一样的。根据资源的分布 情况、对等计算节点位置关系以及对等计算网络拓扑集中化程度对对等计算网络 进行分类【lo 】,可以将对等计算网络分为结构化对等计算网络和非结构化对等计 算网络。而非结构化对等计算网络又可以分为集中式对等计算网络、分布式对等 计算网络和混合式对等计算网络【1 2 】。 分布式结构化对等计算网络( d e c e n t r a l i z e da n ds t r u c t u r e dp 2 pn e t w o r k ) 将每 个资源精确放置到确定的节点上,提供了资源标识i d 到资源所在位置的映射关系, 从而确保在有限跳数内定位到资源。这一类对等计算网络基于分布式哈希表 ( d h t :d i s t r i b u t e dh a s ht a b l e ) ,以c h o r d 、t a p e s t r y 、p a s t r y 、c a n 为典型代表。 集中式非结构化对等计算网络( c e n t r a l i z e da n du n s t r u c t u r e dp 2 pn e t w o r k ) 是 2 第一章引言 指一个或多个服务器存放所有对等计算节点共享资源的信息,对等计算节点通过 查询集中服务器,找到存放所需资源的对等计算节点位置信息,再直接到该节点 上去获取。n a p s t e r 就是该类对等计算网络的典型代表。 分布式非结构化对等计算网络( d e c e n t r a l i z e da n du n s t r u c t u r e dp 2 pn e t w o r k ) 没有集中的服务器存放全局的共享资源信息。网络中的每个对等计算节点地位相 等,通过约定的资源定位处理方式相互协作而找到所需的资源。该类对等计算网 络容错性好、鲁棒性强、具有良好的可扩展性,但存在定位效率低的问题。g n u t e l l a 为该类对等计算网络的典型代表。 混合式非结构化对等计算网络( h y b r i dd e c e n t r a l i z e da n du n s t r u c t u r e dp 2 p n e t w o r k ) 在分布式非结构化对等计算网络和集中式非结构化对等计算网络之间做 出了较好的权衡,它选择少数对等计算节点作为局部的集中式服务器保存部分对 等计算节点的共享资源信息,该类节点称为超级节点( s u p e rp e e r ) 。k a z a a 为该 类对等计算网络的典型代表。 由于对等计算网络结构复杂,每一种对等计算网络都有各自的网络特性。因 此,在进行对等计算研究时,只能对每一种对等计算协议和对等计算网络进行单 独研究和分析。 ( 2 ) 网络规模巨大 在对等计算网络中,节点的数量十分巨大。1 9 9 9 年开发的n a p s t e r 系统,在顶 峰时期达到过6 , 0 0 0 ,0 0 0 用户。l i m e w i r e 系统2 0 0 5 年统计的每天同时在线用户高 达1 0 5 万【1 3 】。根据b i g c h a m p a g n e 统计,全球范围内对等网用户数量在2 0 0 6 年1 月相对于2 0 0 5 年1 2 月就增加了1 1 6 ,0 0 0 名,同时在线人数达到了9 6 7 万多人,其 中b t 同时在线用户早已超过了百万【1 4 】。对等计算视频播放系统p p l i v e ,用户数 量已达到8 5 0 0 万,同时在线用户也于2 0 0 6 年突破了1 0 0 万【1 5 】。2 0 0 7 年,对等计 算语音通讯软件s k y p e 同时在线用户超过了1 0 0 0 万。并且,根据欧洲研究机构 e v a l u e s e r v e 估计,s k y p e 用户数量在2 0 0 8 年将达到1 4 亿至2 4 5 亿【l 6 1 。 ( 3 ) 网络动态性强 对等网络不同于一般的互联网,如互联网中的骨干网。因为对等网中节点的 状态很大程度受用户行为影响。比如,在s k y p e 网络中,用户只在通话时间加入 对等网络,通话结束则退出对等网。网络中节点的数量也随用户习惯有很大不同。 在办公或当地白天时间的s k y p e 用户数量明显多于下班或夜晚的用户数量。而b t 文件下载的用户数量与文件敏感度相关。 因此,对等网中节点状态在随时、频繁地改变,这种改变由于对等网中节点 电子科技人学硕士学位论文 数量规模巨大,使得研究人员难以真正把握对等计算网络运行的规律和特性。 1 2 研究目的与意义 由于对等计算网络具有结构复杂、规模大、动态性强等特性,使得在真实的 对等计算网络环境中进行相关研究不仅难以控制而且实现成本较高。为研究对等 计算网络,一方面可以借助于具有一定仿真规模的对等网络仿真系统;另一方面 可以借助大规模、低成本的真实对等网信息捕获系统。 研究设计一个对等网分析平台进行对等网研究,实际上是通过计算机硬件和 软件构建一套模拟真实对等网的系统。在该系统上,可以全部或部分的模拟真实 对等网网络的各种功能,从而模拟其运行过程和系统行为特征并大规模、低成本 地采集真实对等网信息,为对等网的各项研究提供相应的数据。 利用对等网分析平台对对等网进行仿真和信息采集,其意义包括: ( 1 ) 分析现有对等计算网络( 如f r e e n e t ,g n u t e l l a ,b i t t o r r e n t ,s k y p e ,p p l i v e 等) 的固有特性( 如网络拓扑度分布、网络直径等) ,为对等计算的行为 特征分析、流量检测、流量控制、有害内容提取与识别等提供直接的依据; ( 2 ) 对现有对等计算网络进行系统分析,明确现有对等计算网络在网络拓扑性 质、路由协议与算法、安全机制等方面的不足,从而为设计和部署新的对 等计算网络提供参考依据; ( 3 ) 利用对等网分析平台,分析对等计算系统对互联网的影响,从而为提升互 联网的服务质量和安全性提供参考依据; ( 4 ) 利用对等网分析平台,可以分析对等计算蠕虫、对等计算网络中的d d o s 攻击、对等计算网络的安全信任模型等,从而为构建一个安全、高效的对 等计算网络提供依据; ( 5 ) 利用对等网分析平台,仿真实验只需在可重复使用的模型上进行,信息采 集只需使用数量相对较少的计算机就能虚拟大量对等网节点,所花费的成 本低,节省大量的研究经费。 1 3 论文主要工作 本文的理论研究和应用开发工作是在国家2 4 2 信息安全计划一- - p 2 p 网络仿 真( 课题编号:2 0 0 6 8 1 9 ) 的资助下完成。在项目研究和开发过程中,作者对现有 4 第一章引言 对等网技术进行了深入研究和比较分析,并且基于分布式仿真思想,开展了大规 模p 2 p 仿真技术的研究工作。这些研究工作主要包括: ( 1 ) 提出了动态仿真网络构建技术。针对对等网节点状态多,迁移频繁且条件 复杂;对等网络异构,动态仿真网络构建技术使对等网络分析平台支持各 种对等网络节点状态,并使用系统触发状态迁移技术和用户触发状态迁移 技术保证节点状态迁移的准确性和灵活性。动态仿真网络构建技术还提供 多种时延、带宽分布,以满足各种网络异构情况。 ( 2 ) 提出了快速计算网络直径算法。本文针对即时监视对等网仿真的运行状态 而需要实时计算对等网网络直径,提出了一种基于图压缩的网络直径算 法一一c g 算法。并且通过大量的实验,研究分析了采用该算法对服从随 机分布和幂率分布的网络拓扑的划分效果。通过对以节点扫描次数为基准 的时间复杂度的实验分析,以及与其他算法的比较分析,验证了该算法的 性能、效率以及可行性等。 ( 3 ) 提出了跨界兼容技术。对等网分析平台不仅可以支持各种对等网协议仿 真,也能低成本地、大规模地捕获真实对等网信息。跨界兼容技术使对等 网分析平台虚拟出的众多节点,与真实对等网实体保持独立的、连续的消 息交互。同时,记录对等网实体的相关信息。 1 4 论文章节安排 论文一共分为六章。 第一章,引言。介绍对等计算的发展与应用,阐述对等计算研究面临的困难, 分析了仿真和信息采集对于对等计算研究的重要性,简述论文的主要工作。 第二章,对等网分析技术相关研究。介绍对等网分析技术、对等网仿真和对等 网信息采集技术的相关概念,并且对现有对等网仿真系统和信息采集技术进行简 单介绍和比较,分析现有对等网仿真系统和信息采集系统存在的不足,为论文的 研究指明方向,提出了对等网分析平台拟解决的关键技术。 第三章,动态仿真网络构建技术研究。介绍动态仿真网络构建技术定义及其设 计目标,对网络中的节点和边分别提出节点状态迁移技术和异构网络构建技术, 最后分别对他们的运行情况进行测试。 第四章,快速计算网络直径算法研究。针对需要实时计算大规模p 2 p 网络直径, 提出一种基于图压缩的计算网络直径算法,并对服从随机分布和幂率分布的网络 电子科技人学硕七学位论文 拓扑进行计算网络直径实验。 第五章,跨界兼容技术研究。介绍跨界兼容技术设计目标。基于该技术设计目 标,提出节点与端口映射技术;消息格式转化技术和信息接收同步技术。最后, 展示对等网分析平台捕获的b t 网络节点i p 地址分布情况,并对平台进行了性能 测试。 第六章,结论。对本文的工作进行总结,并对下一步工作进行展望。 6 第二章对等网分析技术相关研究 第二章对等网分析技术相关研究 本章从对等网分析技术的基本概念入手,主要介绍对等网分析技术、对等网 仿真和对等网信息采集的相关概念,并且对现有对等网仿真系统和对等网信息采 集进行简单介绍和比较,分析现有对等网分析系统存在的不足,为论文的研究指 明方向。 本章的安排如下:第一节,对等网分析技术的相关概念;第二节,介绍对等 网分析系统的特点;第三节,对等网分析系统的现状;第四节,分析现有对等网 分析系统存在的不足;第五节,引出本文对等网分析平台中的关键技术;第六节, 对本章进行小结。 2 1 对等网分析技术简介 2 1 1对等网分析技术定义 在本文对等网分析技术定义:通过对对等网运行信息的分析,来研究对等网 性能。获得对等网运行信息,并对该信息进行分析的相关技术就是对等网分析技 术。根据获得对等网运行信息方式的不同,对等网分析技术可以分为:对等网仿 真技术和对等网信息采集技术。 由于对等网规模大、动态性强造成在真实对等网系统去还原对等网难度大、 成本高。所以,通过仿真技术,实现对等网节点的协议,尽量模拟真实网络环境, 使节点在该仿真网络环境中运行对等网协议。仿真是研究对等网的重要方法,但 是仿真存在失真的问题。 使用对等网信息采集技术直接收集真实对等网信息。该技术虽然保证对等网 信息的真实性,但是为了尽可能全面收集对等网信息,所花费的成本相当高。 2 1 2 对等网仿真技术 对等网仿真是一种专门针对对等网研究的网络仿真,它通过采用计算机硬件 和软件,以及相应的网络设备,构建一套模拟真实对等计算网络的仿真环境,并 在此基础上模拟某种对等网协议的各种功能( 如g n u t e l l a 、b t 、s k y p e 、p e e r c a s t 7 电子科技人学硕十学位论文 等) ,通过分析对等网仿真运行过程和系统行为特征,获取相应的性能数据,从而 为对等网研究提供数据支持。 通过对等网仿真,不仅能够分析现有对等网协议和对等网网络的固有特性, 为对等网的行为特征分析、流量检测、流量控制、内容识别提供直接依据,而且 能够对对等网应用技术开发成果进行验证,分析对等网应用技术的性能及效率, 为进一步改进提供参考依据。同时,对等网仿真还能够用于分析对等网系统对互 联网的影响、对等网安全防御等众多方面。 2 1 3 对等网信息采集技术 对等网信息采集技术不同于网络测量技术。网络测量技术主要是对网络的物 理信息进行采集,如链路的时延、带宽、丢包率,路由器的路由效率、时延、丢 包率,w 曲服务器的应答延迟、吞吐率、系统容量、最大稳定链接数掣1 。丌。由于 对等网是应用层上的网络覆盖,因此对等网所采集的信息,主要指应用层的对等 网信息。如,节点逻辑上的邻居关系,节点使用对等网协议的时间等。该信息与 等对网协议有密切关系。 对等网信息采集技术,可以分为主动方式和被动方式两种。主动方式既主动 在对等网查找其他对等网实体,并连接;而被动方式则是在对等网中部署大量探 测节点,等待其他等对网实体的连接。通过这两种方式可以收集到对等网的相关 信息。 2 2 对等网分析系统 对等网分析系统是一种使用计算机技术构建网络拓扑、实现网络协议仿真网 络行为并捕获真实对等网信息的的软件。它能够获取特定的网络特性参数,进而 可对网络性能进行研究和分析,达到改善网络运行状况的目的。对等网分析系统 提供了两种方式研究对等网:仿真和采集真实对等网信息。对等网分析平台应该 包括以下特点: ( 1 ) 大规模虚拟对等网节点能力 对等网网络属于大规模网络,并且对等网网络中节点的个体行为或少数节点 的行为不足以反映整个对等网网络的特征,因此,对等网分析系统虚拟的对等网 网络规模应达到现有对等网网络的规模。 ( 2 ) 节点动态性处理能力 第二章对等网分析技术相关研究 在对等网网络中,节点具有高度的自治性,每一个节点随时都有可能加入、 退出对等网系统或者在一定条件下进行相应状态地改变,对等网网络拓扑结构、 节点连接关系等随时都在发生变化。因此,对等网分析系统应支持各种具有不同 生命周期的节点,同时应支持节点的动态性加入和退出状态改变。 ( 3 ) 支持对等网协议多样化 现有大多数对等网协议主要解决资源分配、查找、定位和传输的问题,并且 每种协议实现的机制各有不同。同时,对等网应用已经涉及到资源查找、文件传 输、语音通讯、视频点播等多个领域。因此,对等网分析系统不仅应支持现有常 见对等网协议的仿真,而且应提供相应的接口,对现有对等网协议进行修改、扩 展,或设计新的对等网协议,对未来的对等网技术研究进行预测。 ( 4 ) 支持与真实对等网实体信息交互 对等网分析平台虚拟出的节点要与真实对等外实体进行消息的交互,就必须 完全遵守真实对等网消息格式,并且实现对等网协议。通过与真实对等网实体的 消息交互,进而获得对等网信息。 2 3 对等网分析系统现状 现有对等网仿真系统和对等网信息采集系统种类繁多,但是还没有很成熟的 系统把这两种功能融合到一体。 2 3 1 对等网仿真系统现状 表2 - 1 所示的是现有部分对等网仿真系统的特点及比较。 表2 1 现有部分对等网仿真系统特点及比较 9 电子科技人学硕十学位论文 3 l s l 2 1 1 j a v a 1 ,0 0 0 ,0 0 0 消息口,可实现不 同的p 2 p 协议 p 2 p s i m 2 4 c 抖 提出三层仿真体系 结构( 网络层、协议 层、用户接口层) ; 基于时间步长仿真。 提供结构化和非结 构化的覆盖网络仿 真;单线程基于离散 事件仿真。 开放式、基于组件仿 真体系结构;提供大 量仿真接口;支持结 构化和非结构化的 覆盖网络仿真;提供 基于循环和基于离 散事件仿真两种方 式;缺少对网络属性 的仿真。 冬了世l i n u x 环境下多线程 3 舢= 鬻萎享高敌;荐 t a p e s t r y 。 s i m p 2 1 2 5 】 c + + 消息 c m u t e l l a f r e e p a s t r y l 2 6 】消息p a s t r y m a p l e 2 7 j a v a数据包移动p 2 p 协议 p 2 p r e a l m 【2 8 】j a v a 多种p 2 p 资源 1 0 0 。0 0 0消息搜索算法,如 g - n u t e l l a 等 提供a d - h o cp 2 p 仿 真。 针对p a s t r y 协议仿 真:提供三种仿真方 式( d i r e c t 、r m i 、 、矾陀) 。 提供道路网络仿真 环境;支持移动p 2 p 仿真。 支持最优化神经网 络仿真;实现多种资 源搜索算法。 l o 第二章对等网分析技术相关研究 g p s e 2 9 l g n u s i m t 3 0 lc + +数据包 g n u t e l l a p l a n e t s i m 3 1 1 o v e r l a y w e a v e r t 3 2 l j a v a 消息 s 舯c h p h o r 。d n y c h o r d k a d e m l i a 4 , 0 0 0数据包p a s t r y t a p e s t r y k o o r d e d h t s i m t 3 3 1j a v a消息d h t 协议 p l p 2 p t 3 4 1c 什 中等数据包 n s 2 t 3 5 】 蒜 相补数据包g 1 1 u 眺 。心e i - 件【3 6 】三: l ,0 0 0 数据包 n e d 一 提供通用仿真体系 结构;基于离散事件 仿真;支持g t - i t m 生成网络拓扑。 支持g n u t e l l a 网络底 层数据仿真;支持非 结构化的覆盖网络 仿真。 基予离散事件仿真; 支持结构化和非结 构化的覆盖网络仿 真;提供g m l 和 p a j c k 格式网络拓扑 输出接口。 基丁离散事件仿真; 提供真实的 t c p u d p 协议仿真 接口;提供分布式仿 真能力。 针对结构化的覆盖 网络仿真;针对d h t 协议仿真。 支持传输层数据包 仿真;支持神经网络 仿真。 支持面向对象仿真; 基于离散事什仿真; 支持网络底层数据 仿真。 基于组件的结构;支 持面向对象、离散事 件仿真;支持网络底 层数据仿真。 电子科技大学硕十学位论文 s s f n e t 3 7 1 j a v a c + +3 3 。0 0 0数据包c h o r d d m l g n u t e l l a s i m t 3 8 1j a v a数据包g n u t e l l a 基于组件的仿真体 系结构;支持真实网 络协议仿真。 支持面向对象仿真; 支持网络底层数据 仿真。 2 3 2 对等网信息采集现状 人们对于对等网网络的大规模测量活动源于g n u t e l l a 网络,文献 3 9 4 0 利用 爬行方法测量了g n u t e l l a 网络的信令消息频率、搜索跳数、平均下载速度及拓扑 连接状况,并发现g n u t e l l a 网络拓扑结构不符合传统网络的幂率拓扑模型。类似 的现象同样出现于文献 4 l 】,该文献利用流量监测工具n e t f l o w 采集了某i s p 多个 骨干路由器的流量记录,并分析记录中f a s t t r a c k ,g n u t e l l a ,d i r e c t c o n n e c t 三类对 等网网络的流量特性、拓扑连接及在线时长等特性,该文献的数据表明对等网网 络节点的拓扑连接、在线时长、节点流量及平均带宽均具有重尾分布特征,但均 不服从幂率分布。 文献 4 2 】改进了爬行法监测g n u t e l l a 网络的软件,将爬行周期由小时量级降低 到分钟量级,使之可以精确扫描各对等点的在线时长,测量结果表明混合式对等 网网络的在线时长的分布可以拟合为双幂率分布曲线或二次对数分布曲线。此外 文献【4 3 表明,对等网网络中约有3 0 的主机用户( g n u t e l l a h o s t ) 处于n a t 网关 之后,需要通过代理进行连接并且内容贡献度极小。文献 4 4 】【4 5 】测量了采用多点 下载技术的e d o n k e y 网络对于i n t e m e t 骨干网汇聚流量的影响,测量结果的拟合模 型表明,由e d o n k e y 流量主宰的汇聚流量,其长相关性消失,此一发现直接质疑 了传统自相似流量模型的适用性。文献 4 6 】通过一个t r a c k e r 服务器的同志记录来 获取网络信息,对约5 0 0 个文件( 大小从4 0 0 m b 到1 1 g ) 下载任务进行了研究,发 现b t 网络在一个文件的下载过程中存在个2 阶段。第一个阶段是瞬念阶段,整个 系统的服务能力初始时较低,但会迅速呈指数增加至满足整个网络的下载需求, 该阶段明显受益于多源文件传输机制;第二个阶段是稳定状态阶段,整个网络的 服务能力增长缓慢,围绕着平均吞吐量上下波动,性能随着参加下载的节点个数 1 2 第二章对等网分析技术相关研究 的增加而改善。文献 4 7 】测量了b t 网络的系统普及度、资源有效性、节点的下载 速度、共享内容的生存时间、b t 网络的污染程度。文献 4 8 对b t 网络上1 7 7 g b 的l i n u xr e d h a t 文件的传播进行了5 个月的追踪,并研究了该文件b t 下载用户的 平均在线时间。 2 4 现有对等网分析系统存在的不足 由表2 1 可以看出,目前现有的对等网仿真系统都具有各自的特点和局限性, 最主要的不足在于仿真通用性和仿真真实度差。 虽然基于消息的对等网仿真系统消耗的成本较低,但是由于计算机的c p u 频 率和内存大小有限,所能仿真的网络规模还是受到一定的限制。此外,基于消息 的对等网仿真系统的仿真真实度也是一个较为严重的问题。例如,虽然基于消息 的对等网仿真系统p e e r s i m 可以在单机上仿真近百万节点的网络规模,但其仿真是 在应用层上进行,忽略了网络特性对于对等网仿真的影响,其仿真结果的真实度 大打折扣。 对于对等网的信息收集技术目前主要是:基于主动测量的爬行方法和基于被 动测量的骨干节点侦听法。爬行方法运用的前提条件是对等网消息格式中含有邻 居节点信息,监测点可以不断获取新节点的网络地址。爬行器在测量点以一个正 常节点的身份加入到这个网络中运行,利用对等网协议的交互消息主动探测网络 中已知对等点。目前的对等网信息采集系统基于爬行器的很大部分只是针对一种 对等网协议,通用性差;基于骨干节点侦听的又需要大量设备,运行成本高。 2 5 对等网分析平台拟解决的关键技术 为了提高对等网仿真真实度,及时查看网络运行状态,低成本、尽可能的收 集对等网信息,对等网分析平台的关键技术应该包括:动态仿真网络构建技术、 快速计算网络直径算法、跨界兼容技术。 ( 1 ) 动态仿真网络构建技术 针对对等网节点状态多,迁移频繁且条件复杂;对等网络异构。动态仿真网 络构建技术使对等网分析平台支持各种对等网络特有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025重庆市铜梁区人民政府巴川街道办事处公益性岗位(基层就业服务协管)招聘4人(第三批)笔试备考试题及答案解析
- 纺织品质量改进方案
- 种植蔬菜的园艺技巧探讨
- 商业地产市场调研规划
- 2025云南昭通昭阳区信访局公益性岗位招聘1人笔试备考试题及答案解析
- 2025云南民族大学附属小学教育集团聘用制教师招聘(39人)笔试含答案
- 考研英语阅读解题技巧
- 打造个性化的目标客户群体
- 2025通辽工会社会工作者招聘10人笔试备考试题及答案解析
- 2025年康体医学运动损伤急救处理演练答案及解析
- HP碗式中速磨煤机检修教程
- 办公室一族常见病预防
- 精神科诊疗常规及技术操作规范-
- 中医内科学表格
- 人教版小学六年级上册语文单元测试卷全册
- DB37T 3842-2019 铁矿绿色矿山建设规范
- 《农业园区规划与管理》课件第一部分 03
- T∕CGMA 033001-2018 压缩空气站能效分级指南
- 江苏常熟新材料产业园环境风险评估报告
- 建设法规工程建设执业资格法规
- 丰田安全管理(安全班组活动)(课堂PPT)
评论
0/150
提交评论