(计算机软件与理论专业论文)局域网流量分析及性能评价与优化.pdf_第1页
(计算机软件与理论专业论文)局域网流量分析及性能评价与优化.pdf_第2页
(计算机软件与理论专业论文)局域网流量分析及性能评价与优化.pdf_第3页
(计算机软件与理论专业论文)局域网流量分析及性能评价与优化.pdf_第4页
(计算机软件与理论专业论文)局域网流量分析及性能评价与优化.pdf_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

独创声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成 果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得( 注:如没有其他需要特别声 明的,本栏可空) 或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对 本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:丑霭舍 导师签字:zo 一月名0 学位论文版权使用授权书 本学位论文作者完全了解堂撞有关保留、使用学位论文的规定,有权保留并向 国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权堂 延可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印 或扫描等复制手段保存、汇编学位论文。( 保密的学位论文在解密后适用本授权书) 学位论文作者签名: 签字日期;2 0 0 j - - 年f 月 夏酒论 ,7 日 导师签字:彩p 呐皋 签字日期:2 0 0 3 - 年,月夕日 山东师范大学硕士学位论文 摘要 随着计算机网络在我国的日益普及,基于网络的应用日益丰富,网络管理工作也显 得越来越重要。网络管理的内容十分丰富,有故障管理、计费管理、配置管理、性能管 理、安全管理5 大部分。其中,网络性能管理是网络管理中的重要部分,也是目前实际 网络管理工作中最容易忽视的部分。 性能管理是指对被管理对象的行为和通信活动的效率进行评价所需要的功能。性能 管理评价被管对象行为和通信活动的有效性,通过收集统计数据来分析网络运行的趋 势,得到网络的长期评价,并将网络性能控制在一个可接受的水平上。 随着计算机网络的迅速发展,网络应用同益丰富,已经由传统的w w w 、f t p 、t e l n e t 等服务转向更加丰富的应用,如视频点播、网络视频游戏、i p 电话等实时应用。这些 新应用的出现,都对网络流量的构成和行为特征产生了新的影响,早期的网络流量分析 也应当进行新的研究。 通过对网络流量和性能的分析,可以发现网络当中影响网络性能的各种因素和存在 的瓶颈,通过合理的配置和必要的升级,在不进行大规模网络升级的前提下,大幅度提 高现有网络的性能,避免盲目网络升级造成的资金浪费。 本文第一部分首先介绍了选题背景及其目前国内外的研究成果,同时介绍了该方向 发展的趋势。第二部分介绍了网络测量的基本方法,主要包括测量法、模型方法和综合 分析法。第三部分介绍了计算机网络测量体系,主要包括指标体系和测量标准。第四部 分是本文的重点,通过实际采样,详细分析了网络当中流量的协议组成结构、大小分布、 时间分布等,并通过实际的计算分析了自相似程度、办议相关程度、网络稳定程度、离 差程度和流量矩阵分布特征等。结合采集的实际数据,通过使用n s 模拟器模拟不同队 列调度算法在区分服务前后的性能表现,从而为我们的网络配置提供直接的依据。第五 部分则提出了一个一般意义上的网络优化方案,第六部分是文章的结尾。 本文的在考虑实际网络流量的条件下,分析了网络的相关特征,模拟了不同队列调 度算法表现出的性能指标,希望对网络的分析和优化有一定的借鉴和推动作用。 关键词:网络、流量、网络分析、网络优化、n s 、区分服务、队列调度算法 分类号:t p 3 9 3 山东师范大学硕士学位论文 t h et r a f f i ca n a l y s i sa n dp e r f r o m a n c ee v a l u a t i o na n d a b s t r a c t o p t i m i z i n go fo n el a n t h en e t w o r k m a n a g e m e n t is b e c o m i n gm o r e a n dm o r e i m p o r t a n ta st h e a p p l i c a t i o no ft h en e t w o r kb e c o m em o r ec o m p l i c a t e d t h ef je l do fn e t w o r k m a n a g e m e n ti sv e r yw i d e ,i n c l u d i n gm a l f u n c t i o nm a n a g e m e n t ,f e em a n a g e m e n t , c o n f i g u r a t i o nm a n a g e m e n t ,p e r f o r m a n c em a n a g e m e n ta n ds e c u r i t ym a n a g e m e n t a n d a m o n go ft h e m ,t h ep e r f o r m a n c em a n a g e m e n tisv e r yi m p o r t a n ta n da l s oi st h em o s t n e g le c t e dp a r to ft h en e t w o r km a n a g e m e n t t h ep e r f o r m a n c em a n a g e m e n tisr e f e r r i n gt ot h ef u n c t i o nt h a ti sn e e d e db y e v a u a t i n gt h ea c t i o na n de f f i c i e n c yo fc o m m u n i c a t i o no ft h em a n a g e do b j e c t a n dg i r i n gt h el o n g t e r me v a u a t i o na n dt e n d e n c yo ft h en e t w o r kb yc o l l e c t i n g a n da n a l y z i n gt h es t a t is t i c sd a t a w h i l ec o n t r o lt h e p e r f o r m a n c ea tt h e a c c e p t e d1 e v e l t h ea p p l i c a t i o no ft h en e t w o r kisb e c o m i n gm o r ea n dm o r ec o m p l i c a t e d ,s u c h a sv o d ,v id e og a m e ,i pp h o n ee t c i n s t e a do fw w ,f t p ,t e l n e te r e t h en e w a p p i i c a t i o no ft h en e t w o r kw o u l db e g e tg r e a ti n f l u e n c ea b o u tt h ec o m p r i s i n go f n e t w o r kt r a f f i ca n dt h ef e a t u r eo fn e t w o r kb e h a v i o r t h r o u g ht h ea n a l y s i so fp e r f o r m a n c ea n dn e t w o r kt r a f f i c ,w ec a nf i n dt h e b e r t l e n e c ko ft h en e t w o r ka n dt h ef a c t o rt h a tc o u l da f f e c tt h ep e r f o r m a n c e t h r o u g ht h ep r o p e r l yc o n f i g u r a t i o na n dn e c e s s a r yu p d a t e ,w e c a ni m p r o v et h e p e r f o r m a n c eo ft h en e t w o r kg r e a t l yw i t h o u tu p d a t i n st h en e t w o r kw i d e l y ,s o a v o i d i n gt h ew a s t eo ft h eu n n e c e s s a r yu p d a t i n g , t h ef i r s tp a r to ft h i sa r t i c l eg i v et h eb a c k g r o u n da n dn e w e s ti n t e r n a t i o n a l r e s e a r c ha tt h es a m et i m ei n t r o d u c et h et e n d e n c y t h es e c o n dp a r tin t r o d u c et h e b a s i cm e t h o do fn e t w o r km e a s u r e m e n t ,i n c l u d i n gm e t h o d o l o g yo fm e a s u r e m e n t , m e t h o d o l o g yo fm o d e l i n ga n dm e t h o d o i o g yo fg e n e r a la n a l y s i s t h et h i r dp a r tg i v e t h es y s t e mo fm e a s u r e m e n t ,i n c l u d i n gi n d e xa n dc r i t e r i o no fm e a s u r e m e n t t h e f o r t hp a r tist h em o s tim p o r t a n 5p a r to ft h ea t t i c 1e ,a n dt h r o u g ha n a ly z in gt h e a c t u a ld a t a ,g i v i n gt h ep r o t o c o ld i s t r i b u t i o n ,p a c k e ts iz ed i s t r i b u t i o n ,t i m e 4 一一 些查堕垫查堂堡主堂垡堡塞 d i s t r i b u t i o re t c a n dg e tt h ed e g r e eo fs e l f s i m i l a r i t y ,d e g r e eo fp r o t o c 0 1 r e l e v a n c e ,d e g r e eo fn e t w o r ks t a b j1i t y ,d e g r e ed e v i a t i o na n dd is t r i b u t i o no f t r a f f i ca r r a y c o m b i n gw i t ht h ea c t u r a ld a t a ,w ec a nc o m p a r et h ep e r f o r m a n c e o fd i f f e r e n tq u e u es c h e f l u li n gb e t w e e nt h ed if f e r e n t i a ls e r v i c ea n dt h eg e n e r a l s e r v i c e a n dp r o v i d i n gt h ed i r e c tc o n f i g u r a t i o ng u i d a n c e t h ef if t hp a r tb r i n g f o r w a r dag e n e r a ln e t w o r ko p t i m i z i n gp r o j e c t ,a n dt h es i x t hp a r ti s t h ee n do f t h ea r t i c l e w eh o p et h i sa r t i c l ec a np r o m o t et h ea n a l y s i sa n do p t i a i z i n go ft h en e t w o r k k e yw o r d s : n e t w o r k ,t r a f f i c ,a n a l y s i so fn e t w o r k , o p t i m i z i n go fn e t w o r k n s ,d i f f e r e n t i a ls e r v i c e ,q u e u es h e d u l i n ga r i t h e t i c 5 山东师范大学硕士学位论文 第l 章绪论 1 1 论文的选题背景及其意义 随着计算机网络在我国的同益普及,基于网络的应用日益丰富,网络管理工作也显 得越来越重要。网络管理的内容十分丰富,基于开放系统互连( o s i ) 的网络管理体系建 立在7 层模型的基础上,o s i 定义的网络管理的关键功能有故障管理、计费管理、配置 管理、性能管理、安全管理5 大部分。其目的是建立并维持一个高效、稳定、安全、可 靠、互操作强、可预测、可控的网络。其中,网络性能管理是网络管理中的重要部分, 也是目前实际网络管理工作中最容易忽视的部分。 性能管理是指对被管理对象的行为和通信活动的效率进行评价所需要的功能。性能 管理评价被管对象行为和通信活动的有效性,通过收集统计数据来分析网络运行的趋 势,得到网络的长期评价,并将网络性能控制在一个可接受的水平上。网络性能管理的 功能包括运行上的业务量管理功能,管理上的网络、业务量管理功能和维护上的性能监 视功能。性能监视包括连续采集与网元性能的有关数据,基本功能是跟踪系统、网络或 业务情况,为判别性能而收集合适的数据,及时发现网络出现拥塞或性能恶化的情况。 性能控制包括指导或支持网络管理功能的信息管理,以及为帮助网络管理而应用或修正 业务量控制等。 随着计算机网络的迅速发展,网络应用目益丰富,已经由传统的w w w 、f t p 、t e l n e t 等服务转向更加丰富的应用,如视频点播、网络视频游戏、i p 电话等实时应用,这些 新应用的出现,都对网络流量的构成和行为特征产生了新的影响,早期的网络流量分析 也应当进行新的研究。而网络流量的组成特征和分布特征,对网络性能将产生很大的影 响,对网络流量的分析不仅是我们认识网络的必要手段,也是对网络进行优化的重要方 面。 通过对网络流量和性能的分析,可以发现网络当中影响网络性能的各种因素和存在 的瓶颈,通过合理的配置和必要的升级,在不进行大规模网络升级的前提下,大幅度提 高现有网络的性能,避免网络盲目升级造成的资金浪费。 1 2 本课题的研究现状 目前国内外对网络流量分析和性能评价方面已经有了很多研究成果,主要涉及到网 络测量技术、网络性能指标体系、网络流量特征行为和网络性能评价模型等方面。 在网络测量方面,文章 1 介绍了一个大规模高速网络流量的测量方法和测量技术 山东师范人学预十学位论文 等:文章 2 提出了f p 网络当中o o s 参数体系结构,详细给出了各参数的定义;文章 3 则给出了各参数之间的关系,提出了指标体系集的概念。文章 4 给出了目前国内外研 究机构的研究状况,其中i p p m 定义了网络性能的具体指标,i t u ts g l 3 也给出了作了 类似的工作,文章同时还给出了测试方法;文章 5 3 则详细的给出了方法、手段、工具 以及主要网络性能参数的计算方法等。 在流量特征行为分析方面,文章 6 根据小波理论分析了在以w w w 占主体的广域网 ( w a n ) 中流量的行为特征,文章【7 根据自相似理论给出了以太网流量的特征,文章 8 则是分析了不同时间粒度下的流量行为特征。国内从事这方面研究的代表人物是林闯, 在其专著计算机网络和计算机系统的性能评价中详细介绍了流量行为特征和性能评 价的相关数学模型,包括随机过程、排队模型、自相似模型、p e t r i 网等。文章 9 给 出了网络流量的非平稳正态特性。 在自相似分析方面,文章 1 0 则分析了i po v e ra t m 网络流量的自相似性,建立了 网络流量的自相似模型;文章 1 1 进行了校园网流量的自相似分析;文章 1 2 则进行了 自相似网络流量的长相关分析;文章 1 3 分析了t c p 流的自相似性的根源,文章 1 4 给出了自相似网络模型下的网络性能测试,并实际分析了一个网络的自相似性。 在性能分析与评价方面,目前研究相对较少,采用的评价方法主要是排队论和随机 p e t r i 网,文章 1 5 给出了一个基于分布式n :n 对等评价模型,文章 1 6 提出“路径 稳定系数的概念”,文章 1 7 提出了“以太网性能评价公式”,都具有一定的实际意义; 文章 1 8 给出了利用o p n e t 进行的网络测试与评价案例,具有一定的借鉴意义;文章 1 9 提出了网络流量的均值分析与离差分析,可以应用于网络突发流量的监测:文章 2 0 则分析了网络当中不同的协议对网络性能的影响,对网络的优化具有很好的指导意义。 在路由器队列调度管理方面,文章 2 1 介绍了路由器的队列调度与管理机制,但没 有进行性能的分析和比较;文章 2 2 给出了几种不同的队列管理算法的比较,但只是在 单一协议下的模拟,并没有考虑到真实的网络环境下丰富的应用协议:文章 2 3 同样给 出了不同的队列算法的比较,但知识比较的带宽分配一个方面,不够全面和具体:文章 2 4 1 介绍了分组交换网中队列调度算法。 1 3 本文研究范围及其组织 本文第一部分首先介绍了国内外该方向的研究现状及其本课题的实际意义。指出了 进行网络分析、评价和优化的必要性。作为网络分析和评价的基础知识,第二部分介绍 了网络测量的基本方法,并强调了综合测量法在实际网络测量中的应用。第三部分详绍 介绍了计算机网络测量系统,包括主动测量与被动测量、测量体系、指标体系以及测量 工具等,为我们下面的工作做好理论准备。 第四部分是本文的重点,以一个中等规模的局域网为例,在测量理论的指导下,通 7 山东师范大学坝上学位论文 过实际流量采集,详细分析网络的协议分布、大小分布、时间分布等特征。在自相似理 论的指导下,通过r s 图方法和方差一时间曲线的方法计算分析了网络的自相似程度。 由于网络稳定性是网络性能的主要参数之一,我们随后进行了稳定性测试,发现网络的 稳定性较差,存在较大的波动,有突发的网络流量。为此,我们引进了离差分析理论, 对网络当中流量进行分析。进一步通过流量矩阵分析,我们发现了网络当中视频点播服 务的存在导致大量h t t p 协议的出现,并且由于视频点播服务器放置的位置不合理导致 大量数据流量对路由器造成很大的影响。 由于网络当中路由器的性能对网络的影响很大,并且路由器当中采用何种队列调度 算法是影响路由器性能的重要因素。由于队列调度算法有很多种,并且考虑到不同的网 络环境,在一个实际的网络中直接比较各种不同队列算法的性能是比较困难。因此我们 使用n s 模拟器,结合前面实际采集的流量数据,模拟在实际网络流量下,不同队列调 度算法在实施区分服务前后的性能表现,并得到重要的结论。 根据前面的综合分析,结合一般局域网的普遍情况,我们在文章的第五部分提出了 一个局域网的优化方案,从网络拓扑结构、基础设施、网络设备、网络协议、流量矩阵 五个方面,结合前面的分析对网络进行优化。 本文的最大特点是根据理论的指导,通过实际分析一个典型的局域网络,发现网络 当中存在的诸多问题,并通过模拟试验模拟在实际环境中很难进行的诸多性能参数的比 较,并由此指导网络的具体优化工作,以期对网络的实际管理有所借鉴。 山东师范大学硕士学位论文 2 1 测量法 第2 章网络流量与性能分析的基本方法 同过一定的测量设备或一定的测量程序可以直接从计算机网络测得各项性能指标 或与之相关的度量,然后由它们经过一些运算求出相应的性能指标,这是最直接也是最 基本的方法,其他一些方法在一定程度上也要依赖它。这种方法适用于已经存在的系统, 其中测量方法和手段是关键。 测量方法的优点是准确性高,因为网络系统的实际情况比如响应时间、吞吐量等都 能从使用现场得到。这种方法对于评价和分析一个已经存在的网络是非常合适的,但不 能在网络建立之前预测网络的性能。 2 。2 模型方法 首先对要评价和分析的计算机网络建立一个适当的模型,然后求出模型的性能指 标,以便对系统进行评价。模型中一般包括很多参数,这些参数的确定往往依赖于对实 际系统的测量结果或对系统参数的估计。与测量方法相比,模型方法有两个优点:一是 它不仅可以应用于已有系统的性能评价,而且还可以用于尚未建立的系统的性能预测; 二是它的工作工作量一般比测量方法要小,费用较少。 模型方法又分为模拟方法和分析方法两种。模拟方法是用一个程序动态地模拟一个 系统及负载,一般首先是用个模拟语言来为系统建立模型,然后在模拟时,通过用负 载驱动系统模型从而得出模型的性能指标。模拟方法可以详细地刻画系统,得出较精确 的性能指标,但构造和使用模型时的费用较高。 分析方法则是应用数学理论与方法来研究和描述性能与系统、负载之间关系。为了 数学上描述与计算的方便,往往要对系统模型进行一些简化和假设,因而这种模型刻画 系统的详细程度较低,得出的性能指标精度也较低。但是这种方法理论基础强,可以明 显地刻画各种因素之间的关系,而且构造和使用模型的费用也较低。 2 3 综合分析法 随着计算机网络的不断发展,系统的庞大和复杂化使得系统性能评价和流量分析问 题变得越来越复杂,仅仅依靠单一的方法很难有效的解决问题。因此,在实际中一般综 合采用以上三种方法,通过提供有效的数学理论工具、直观的模型描述方法和有效的模 型分析方法以及使用的分析软件和测量工具,可以较好的解决流量分析和评价问题。 山东师范大学硕上学位论文 第3 章计算机网络测量系统 3 1 计算机网络系统测量概述 测量方法是最基本和最直接的方法,足通过一定的测量设备或测量程序直接从网络 中测得各项性能参数。这种方法结果准确,可靠性高,但需要专门的测量设备或程序。 网络测量作为分析网络行为、了解网络状况和定位网络故障的有效手段,需要服务于各 种不同目的的测量需求和不同用户,由此引出了各种不同的测量方式。 3 2 主动测量与被动测量的定义及比较 主动测量是同过向网络当中注入探测包,判断服务器或应用从网络所获得的服务能 力,主动测量可以查验端到端的i p 网络可用性、延迟和吞吐量等。因为一次主动测量 只是测量了瞬时的网络质量,围此有必要重复多次,用统计的方法获得更准确的数据。 主动测量的优点是能够根据不同的场景控制探测包,如流量特征、采样频率、调度方法、 包大小和类型、被监测的路径和函数等。主动测量可以让测量者按照自己的意图进行, 因此容易用于进行场景的模拟,检验网络是否满足q o s s l a ( 服务质量服务等级协议) 等。这种方法的缺点是会产生额外的探测流量,这有可能会影响到被监测网络的性能, 因此探测流量一定不要太大。 被动测量使用设备1 监视经过它的流量,这些设备可以使专用的( 如s n i f f e r ) ,也可 以是嵌入其它设备( 如路由器、防火墙、交换机或主机) 中的( 如r m o n 、s n m p 、n e t f l o w 等) 。测量软件或系统周期性的轮询被监测设备并采集信息,以判断网络性能和状态。 被动测量的优点是测量时并不增加网络上的流量,测量的是网络上的真正流量。但是它 需要用轮询的方法采集数据、陷阱和告警等信息,所有这些都会产生网络流量,因此实 际的测量流量可能会受到一定的影响。因为被动测量要查看网络上的所有包,因此要注 意保护所网络上数据的保密性和安全性。 在实际测量中,可以将这两种机制结合起来,共同验证和分析测量结果,获得有价 值的信息。 3 3 计算机网络性能测量体系 目前国际化组织如i e t f 和i t u - t 等都从事这方面的标准化研究工作,并且已经公 诮了一些标准或草案,如i e t f 已公布的r f c 有:r f c 2 3 3 0 ,r f c 2 6 7 8 ,r f c 2 6 7 9 ,r f c 2 6 8 9 等;i t u - t 公布的标准有y 1 5 4 0 和y 1 5 4 1 等。信息产业部也在补充和完善电信服务 山东师范大学硕上学位论文 质量标准中的有关i p 网络性能的要求与测试方法等。中国i p 标准研究组也正在加紧 这方面的研究和标准起草工作,已经公布了i p 网络技术要求一i p 网络服务质量参数 与指标,本文主要采用的参数来自r f c 2 3 3 0 以及y 1 5 4 0 y 1 5 4 1 等。 3 3 1 性能测量点 为了在网络中对i p 网络性能进行界定,需要定义网络的测量点( m p ) 。可以把测量 点定义为能够观察和测量性能参考事件的主机与相邻链路的边界。源主机( s r c ) 到宿 主机( 9 s t ) 之间传送i p 数据包的组c s 和n s 构成了端到端的i p 网络。 利用测量点可以界定一些基本段,它们可以是一个电路段,一个网络段,一个源或 是一个宿。 入口测量点:电路段和网络段进入i p 数据包的一组测量点。 出口测量点:电路段和网络段离开i p 数据包的一组测量点。 3 3 。2 测量策略 对i p 网络的性能进行监测时,存在多种不同的方法,用户可根据具体的场合或要 求选择使用,比如: 使用注入探测包的方法直接测量,这是一种主动监测的方法,例如测算一个包 的往返延迟。 从更低级别的测量中推测出一个综合的度量,例如已经测量了沿某条路径的每 跳延迟,就可以推导出该路径的端到端延迟。 从一组相关的不同时刻的度量中估计某时刻的特定度量,例如假定测量了过去 某时刻的吞吐量,根据流量动态变化的模型,可以估计当前某时刻的吞吐量。 3 3 3 标准测量包 网络测量当中,不同测量包的结构对网络的测量结果产生不同的影响。因此,除非 特别声明,否则所有与i p 包相关的度量定义中都必须包含一个隐性的假设,即该类型 的包必须都是标准格式的,一个标准形式的测量包必须满足r f c 2 3 3 0 。 在实际测量中,包的长短也会影响到大多数性能测量参数的结果。因为很多流的包 长短变化非常大,因此应当规定包长短的范围。当测量支持固定比特率的目标流时,用 相同长度的测量包可以简化评估,因此推荐这时使用固定长度的包。建议使用1 6 0 或 1 5 0 0 字节的包做性能评估,并必须报告测量包的长短。当进行更低层测量时( 如比特 出错率) ,推荐使用1 5 0 0 字节的包做性能评估。同时,在具体测量中,为了全面反映网 络的性能,也会采用各种不同长度的测试包,这由具体的测量要求来决定。 山东师范人学硕士学位论文 3 3 4 测量间隔 对度量的测量时间间隔不能太短,评估时间间隔所产生的是一个相关包流的子集。 在理想情况下,这些评估时间间隔是: 长到对流所期望的指定测量比例是足够的; 长到对用户的典型用法或评估周期是足够的; 短到可以保证与每个评估间隔内部的可接受的性能保持平衡( 这样才可以区别 出性能较差的时间间隔,否则会导致把性能较差的时间间隔隐藏在个非常长 的评估时间间隔中) : 短到可以处理测量中的实际问题。 3 3 5 测量中的安全性 对网络的测量可能会引起一些安全方面的问题,因此,在实际中一定要注意。对于 主动测量,需要将测量流注入网络,这种流量可能会影响到网络的拥塞情况:另外,要 避免主动测量技术被滥用,甚至进行伪造测试流量。对被动测量,要尽量避免对用户数 据载荷部分的分析,以更好的保护用户数据的安全性。 3 4 计算机网络性能指标体系 性能评价指标是测量开展的首要工作,i e t f 传输领域的i p 性能指标工作组i p p m 制 定了指标定义框架,它主要研究了性能评价指标制定和测量中的基本问题。全网测量系 统要求制定的性能评价指标集具有稳定性和普遍性,并且要尽量减少其数量。 实际测量需求关心的是网络层之上的数据传输性能,在计算机网络中,它包括网络 层、传输层和应用层三个层次,不同层次对性能指标的描述有所不同。实际应用中, t c p i p 协议集中常用的协议类型大约几十种,按层次主要包含以下几种。 3 4 1 网络层 主要有i p 协议,性能指标主要有带宽、传送时延、丢包率、路由、拓扑结构、连 通性等,具体定义如下: 带宽:主机a 到b 的路径带宽指这条路径所能传送数据的最大速率,它的值通 常由该路径上的传送速度最慢的链路所决定。 传送时延:有单程( o n e w a y ) 和往返( r o u n d t r i p ) 时延两种。 丢包率:数据传送中丢失数据包的比率。 山东师范大学顾十学位论文 路由:由主机a 到b 的路径上包含的所有中间节点组成。 拓扑结构:是指网络中网络设备、联网主机等网络元素互连的方式。 连通性:主机a 到b 有连通性指从a 出发的数据包可以传送到b ,网络连通性 主要受网络的物理因素影响,也跟路由失败有关。 3 4 2 传输层 传输层协议主要有面向连接的t c p 协议和无连接的u d p 协议,该层的性能指标主要 有吞吐量( 连接的、无连接的) 、最大连接数( t c p ) 、丢失率( 连接的、无连接的) ,具 体定义如下: 吞吐量:单位时间内传输的数据量。 最大连接数:在应用系统性能稳定的情况下,系统所能建立的连接数的最大数 量。 丢失率:数据传输中传输数据丢失的比率。 3 4 3 应用层 不同的应用系统其相关协议类型的差别在于应用协议的不同,应用层有多种协议类 型,如h t t p 、f t p 、t e l n e t 等,不同协议类型有其特定的性能指标。下面以h t t p 协议 为例,说明w e b 系统应用层性能指标的定义。 吞吐量:单位时间传输的数据量,按测量单位,分为位吞吐量和页面吞吐量。 应答延迟:一个请求从建立网络连接开始到拆除连接之间的时间。 平均应答延迟:大量请求( 通常指一个测试集中的所有请求) 的应答延迟的平 均值,用于评价w e b 系统的平均性能。 请求吞吐量:非空闲状态下,系统在单位时间内响应的请求个数。 丢失率:数据传输中传输页面丢失的比率。 系统请求容量:非空闲状态下,系统单位时间能够响应的最大请求数。 最大稳定连接数:在性能比较稳定、没有明显下降的前提下,系统能够支持的 最大同时连接数。 3 4 4 各性能参数之间的关系 在以太网当中,由于c s 姒c d 的存在,网络性能参数之间存在一定的关系: 吞吐量一输入负载之间的关系 在负载达到最大值之前,吞吐量随着负载的增加而增加,达到其最大值附近之后, 便在一段较大的范围内变得平坦起来。随着输入负载的进一步增加,吞吐量开始下 山东师范大学硕上学位论文 降。 延迟一吞吐量 延迟随吞吐量增加而增加,但变化较为平坦,只有较小增加。当吞吐量接近最大值 时,延迟急剧上升。 延迟一输入负载 在轻负载的条件下,以太网的延迟特性较好,虽然延迟会随着网络负载的增加而增 加,但基本上能够维持在较低的水平上,当系统逐渐饱和时,以太网传输延迟开始 急剧增加,并且可能增大到无法工作。 延迟数据包长度 吞吐量和所传输的信息报文长度成正比,在分组长度接近网络的最大传输单元 ( m t u ) 值时,吞吐量增加最快。当超过最大传输单元( m t u ) ,吞吐量开始增加的 缓慢。 3 5 测量工具 目前网络测量方面的测量工具和方法非常多,根据层次可以分为: 基础布线系统,经常采用的工具有专用的线缆测试仪,例如f 1 u k en e t t o o l , 可以方便的测量到线缆的长度、延迟、阻抗、衰减、近端串绕等。 对网络层的测量,可以采用专用的网络测量工具( 例如f l u k e0 n e t o u c h ) , 也可以采用网管软件( 例如c i s c ow o r k s 2 0 0 0 ) ,可以测量到网络带宽、利用率、 冲突、错误率、丢包率、流量分布曲线,流量矩阵、网络拓扑等。 对网络性能的测量,可以采用各类性能测试软件,如测量网络延迟、可达 性和丢包率的f p i n g 、g n u p l o i n g 、e c h o p i n g 等,网络吞吐量测量工具主要有t t c p 、 p a t h r a t e 、n e t p e r f 等,网络带宽测量工具主要有p a - 【h c h a r 、p e h a r 等。 网络流量的分析可以使用专门的分析软件例如s n i f f e r ,可以测得网络中各种协议 的组成极其比例、流量矩阵、数据报大小分布等。 对网络路由器或交换机性能的测试则可以通过其内置的在我们实际的测量中,我 们将根据测量需求,综合使用以上工具。 1 4 山东师范大学硕_ 上学位论文 第4 章对一中等局域网络的实际测量与分析 4 1 网络拓扑与应用 我们实际参考的网络为一中等规模的校园网,主干为1 0 0 0 m ,其中边界路由器为 c js c 0 3 6 4 0 ,缓冲区大小为5 1 2 k b ,与路由器相连的链路为1 0 0 0 m ,路由器与i n t e r n e t 相连的链路为1 0 0 m 。中心采用三层交换机c is c o4 5 0 6 ,缓冲区为2 m k b ,内部共划分了 2 0 个v l a n 。根据应用的不同和安全的考虑,v l a n 作了很多不同的限制,例如内部管理 v l a n 包括不能和外部任何机器通信的内部管理服务器和管理计算机、学生机器和教学 管理用机各自在不同的v l a n 内并且不能通信等。该网络目前拥有计算机终端1 0 0 0 余台, 服务器2 0 台,对外对内所提供的服务主要有:w w w 、f t p 、d n s 、e - m m l 、d h c p 、基于数 据库的内部管理系统、视频点播等,拓扑如图一所示。 4 2 测量数据分析 图一 我们通过在三层交换机出口处对进出整个校园网的所有流量进行连续1 0 天采样, 并对所采集的数据进行分析。 协议分布 图二 山东师范人学硕士学位论文 幽三 图二、图三显示的是所获取的应用层各种协议所占比例分布,按数据流量大小依次 为:d n s ( 5 9 9 9 ) 、h t t p ( 1 0 8 6 ) 、n e t b i o s ( s m b ) ( 5 2 7 ) 、b o o t p ( 4 3 7 ) ,其它 如s m t p 、f t p 、h t t p s 、n f s 、t e l n e t 等流量非常小,其他不可显示的数据流量包含在 o t h e r s ( 1 9 0 4 ) 中。 通过图二、图三的分析,我们可以得出以下结论: ( 1 ) 我们想象中的h t t p 流占主导地位的情况并未出现,实际上是大量出现的d n s 包占 据了主要流量,这是因为在网络中大量采用域名系统,在解析成t p 地址过程中必 然将产生大量的d n s 流量。 ( 2 ) 网络中出现了大量的n e t b i o s 数据包,这是因为我们的网络操作系统基本采用 w i n d o w s 系统,它的n e t b i o s 名称解析和计算机浏览服务( c o m p u t e rb r o w s e ) 就 表现为n e t b i o s 数据。 ( 3 ) 显示为o t h e r s 的经过分析为a r p 、s n a p 、s a p 、l l c 、没有上层协议的纯u d p 数据 包等。地址解析协议( a r p ) 负责将i p 地向m a c 地址转换,从而完成最终的数据 包封装,这是网络数据传输必需的过程。而s n a p 、l l c 等协议则是由局域网内部 各种网络设备由于管理的需要由相关管理协议产生的。其它网络协议( 如 p x s p x ) 也产生一些流量( 如s a p ) 。没有上层协议的u d p 等数据包经分析是目 前广泛流行的网络视频游戏。 ( 4 ) 网络当中的b o o t p 协议是由于在网络中部分计算机是通过d h c p 服务器动态获取 i p 地址的,在d h c p 服务器和客户机之间通信所采用的协议正是b o o t p 。 ( 5 ) 对于网络中常用的其它协议,如s m t p 、f t p 、t e l n e t 等,并没有表现出太大的流 量,表示出当前的局域网流量内容已经和以前的发生了很大变化。 ( 6 ) 网络中常见的视频点播流量经过分析是h t t p 加t c p 协议组成,其中的少许的t c p 协议主要用于反馈控制信息,以保证视频流传输的质量。 大小分布 图四所显示是传输层数据包,可以看到,网络中传输层的两种协议u d p :t c p 数据 包数量比率为3 :l ,总字节数量比率为6 :l ,u d p 包平均包大小i 4 6 字节,t c p 包平均 大小为6 7 字节。因为由于u d p 是非面向连接的,在资源占用方面比面向连接的t c p 更 具有优势,因此它的大量出现将对网络造成很大的影响。另外,经过分析,此段时间段 山东师范大学倾士学位论文 内的t c p 连结数为1 0 0 0 ,网络延迟的分布为o 一1 0m s 。 囤四 图五 图五中显示,6 5 1 2 7 s 的数据包占7 1 8 7 ,1 2 8 2 5 5 的数据包占1 8 8 0 ,6 4 s 的占 5 4 0 ,由于以太网数据帧大小为b 4 - 1 5 i 8 s ,所以可以判断网络主要由相对较小的数据 包组成。这说明 n t e r n e t 上用户数据包的平均包长会随着应用的变化而变化,当网络 的应用由以w w w 、f t p 、p o p s 为主转向各种实时应用时,用户数据包的统计平均包长会 越来越短。 到达时间 图六 图七 图六、图七分别是2 4 小时和2 4 0 小时流量图。经过分析可以看到,在一天中上网 高峰期分别为9 点一l l 点,1 4 点一2 2 点。其中,1 4 点一2 2 点的流量要高于9 点一l l 点, 一天中网络最繁忙的时间在1 6 :3 0 和2 0 :0 0 左右,0 点一8 点之间则基本没有流量。在连 续l o 天的流量统计中,可以明显地看到流量明显呈现规律性分布,并且每天流量没有 1 7 山东师范大学硕士学位论文 大的差异。 4 3 自相似分析 网络流量特征化是十分困难的,特别是不同的网络应用具有不同的流量特征。w e b 流的特点是连接时间短促,突发性强,主要由相对适中的数据包组成,只有像视频点播 之类的情况才会出现较大的数据流量。f t p 流的特点是连接时间长,数据包较大,而像 t e l n e t 虽然连接时间也较长,但数据流量非常小。w w w 、f t p 、v o d 、v o i p 等流量特征和 q o s 需求的差异以及不同比例流量迭加,使得网络行为的分析更加复杂。 网络流量行为首先是要直接对流量数据进行统计分析,寻找统计规律,这方面代表 性的工作是m c i 的t h o m p s o n 及l e l a n d 等人对以太网测量数据进行统计分析发现以太 网流量具有自相似性。 4 3 1 自相似的连续时间定义 一个随机过程z ( f ) 在统计上具有参数为h ( o 5 h o ,随机过程口一耐) 与x o ) 具有相同的统计特性a 此相互关系可有下面三个条 件表达: 均值 e b o ) 1 = e 仁( 诹) y a ” 方差 r 卜( f ) 】= v a ,b ( 删) l 优2 ” 自相关r ,e ,s ) = r ,白,) a 2 “ 参数h 称为h u r s t 参数,又称自相似参数,它是自相似程度的一个重要度量,是描述 自相似特性的唯一参数。h 的取值范围是 0 5 ,1 ,h = o 5 表示没有自相似,h 值越接近1 , 过程的自相似程度越高。 4 3 2 自相似的离散时间定义 离散随机过程x o ) 定义为汲。,t = 0 , 1 2 。对于一个平稳随机序列x ,定义m 重聚集 时问序列x = 留,k :0 ,1 2 ,它可以表达为:秽= o 埘) z 五( f = 概一一1 ) 翩) , 观察这个多重聚集时间序列的一种方法是将其看作压缩时间尺度的一种技术。可以认为 工1 是这个时间序列的最高放大率或最高分辨率,过程_ ) c ”是相同过程在分辨率上缩减m 山东师范大学硕士学位论文 倍,如果经过压缩以后过程的统计特征( 均值、方差、自相关等) 仍然保持不变,那么 该过程就是个自相似过程。 4 3 3 自相似程度估计 自相似分析方法是首先判断一个实际到达的时间序列是否具有自相似性,如果是自 相似的,再估价自相似参数h ,判断自相似的程度。对h 的计算有:方差一时间曲线、 r s 图、周期图、_ | | | f h i t t l e 最大似然估计和小波变换分析方法等,其中方差一时间曲线和 r s 图是最常用的两种方法。 r s 图方法 r s 通过改变所研究的时间尺度大小来研究其统计特性变化的规律。对于在 离散时刻取值的随机序列x o ) = k ,t = o , 1 2 一;x ( o 在时间段t 上的重整化范围定义为 l l 率r - :墨: ss 其中,4 ( r ) 是在时间段t 上的采样平均: 4 ( r ) = 专x , r 表示过程变换范围的度量,s 表示采样标准差。 当t 很大时,有i r r ”,o 5 h o o ,其二阶特征方差有: v a r ( x “掣) 垅 其中自相似参数日:1 一譬,从对数一对数图上可以看到

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论