(计算机应用技术专业论文)网络流量自相似特性的研究.pdf_第1页
(计算机应用技术专业论文)网络流量自相似特性的研究.pdf_第2页
(计算机应用技术专业论文)网络流量自相似特性的研究.pdf_第3页
(计算机应用技术专业论文)网络流量自相似特性的研究.pdf_第4页
(计算机应用技术专业论文)网络流量自相似特性的研究.pdf_第5页
已阅读5页,还剩49页未读 继续免费阅读

(计算机应用技术专业论文)网络流量自相似特性的研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 题名:网络流量自相似特性的研究 研究生:马书南 导师:乐红兵 专业:计算机应用 l e l a n d 和p a x s o n 等通过对局域网和广域网的流量进行测量和分析,均发现具有统 计上的自相似性。传统的网络流量模型在描述实际的网络业务时,忽视了这个重要特性。 与传统的流量模型相比,自相似模型更能精确描述流量的真实特性。自相似性对分组丢 弃率、延迟和吞吐量等系统性能有重要影响,因此对自相似性进行研究非常必要。 论文给出了自相似过程的定义及其特性,并对描述流量自相似程度的h u r s t 参数的 估计方法作了介绍。然后,概述了几种自相似流量的生成方法,并分析了它们的优缺点。 另外,对自相似现象的产生原因进行了讨论。 在研究自相似过程的合并与分解时,给出了几个相关定理的证明,并通过实例进行 验证。在自相似性对网络性能影响的研究中,利用n s 进行仿真,分析了自相似性对分 组丢弃率的影响,结果表明随着t c p 负载的增加,自相似程度增加时,分组丢弃率也 呈增长趋势。另外,在仿真实验中增加丢失模块,研究分组丢弃率对网络流量自相似性 的影响,仿真实验结果表明:当分组丢弃率不同时,自相似性的程度随分组丢弃率的提 高而相应增加。 上述仿真实验表明,自相似性降低了网络的性能,如;增加了分组丢弃率。当情况 严重时,可能会引发拥塞现象。因此,本文提出了一个拥塞预警系统,并与动态带宽分 配相结合,利用自相似流量在较大的时间尺度上存在相关性,对系统下一时段的流量进 行预测,当预测到流量将超过缓冲区所能处理负载的极限时,启动预警系统,实现增加 带宽的功能,提高了网络性能。仿真实验结果表明:该系统可以对即将发生的拥塞现象 进行预测:与固定带宽分配功能相比,系统所采用的动态带宽分配功能节省了带宽。 关键词:自相似性;长相关性;h u r s t 参数;网络性能;拥塞 a b s t r a c t s u b j e c t :r e s e a r c h0 ns e l f - s i m i l a r i t yo f n e t w o r kt r a f f i c p o s t g r a d u a t e :m as h u n a n s u p e r v i s o r :l eh o n g b i n g s p e c i a l i t y :c o m p u t e ra p p l i c a t i o n t h r o u g ht h em e a s u r e m e n ta n da n a l y s i so f l a n a n d 、) l ,a n l e l a n da n dp a x s o nf o u n dt h a t r e a lt r a f f i ch a ss t a t i s t i c a ls e l f - s i m i l a r i t y t r a d i t i o n a ln e t w o r kt r a f f i cm o d e l sn e g l e c tt h e i m p o r t a n tc h a r a c t e r i s t i c ,w h e nt 1 1 e yd e s c r i h et h ea c t u a lt r a f f i c c o m p a r e dw i t ht r a d i t i o n a l m o d e l s s e l f - s i m i l a rm o d e l sa r em o r es u i t a b l ef o rd e s c r i b i n gt h er e a lc h a r a c t e r i s t i c so ft r a f f i c s e l f - s i m i l a r i t yi sv e r yi m p o r t a n tt os y s t e mp e r f o r m a n c es u c ha sp a c k e tl o s sr a t e ,n e t w o r k d e l a y , t h r o u g h p u ta n ds oo n ,s or e s e a r c ho ns e l f - s i m i l a r i t yi sv e r yn e c e s s a r y i nt i f f sp a p e r , m a t h e m a t i c a ld e f i n i t i o na n dc h a r a c t e r i s t i c so fs e l f - s i m i l a r i t ya r e g i v e n , a n d t h ee s t i m a t i o nm e t h o d so fh u r s tp a r a m e t e ra r ei n t r o d u c e d t h e ns e v e r a ls e l f - s i m i l a rt r a f f i c g e n e r a t i o nm e t h o d sa r es u m m a r i z e d , a n dt h e i ra d v a n t a g e sa n dd e f e c t sa r ec o m p a r e d i n a d d i t i o n , t h ec a u s e so fs e l f - s i m i l a rt r a f f i ca r ed i s c u s s e d a g g r e g a t i o na n dd e c o m p o s i t i o no fs e l f - s i m i l f i rp r o c e s sf i r es t u d i e d ,c e r t i f i c a t i o no f s e v e r a lr e l a t e dt h e o r e m si sg i v e n , a n dt h et h e o r e m sa l ev e r i f i e dt h r o u g he x a m p l e s i nt h e r e s e a r c ho nt h ei m p a c to f s e l f - s i m i l a r i t yt on e t w o r kt r a f f i c ,e m u l a t i o nb a s e d0 nn s ,t h ei m p a c t o fs e l f - s i m i l a r i t yo np a c k e tl o s sr a t ei sa n a l y z e d n l er e s u l ts h o w st h a t 、i t l it h ei n c r e a s i n go f t c pl o a da n dt h ed e g r e eo fs e l f - s i m i l a r i t y , t h ep a c k e tl o s sr a t eg r o w so n m o r e o v e r , i nt h e e m u l a t i o ne x p e r i m e n t , a d d i n gal o s sm o d u l et os t u d yt h ei m p a c to fp a c k e tl o s sr a t eo n s e l f - s i m i l a r i t y t h er e s u l to f e m u l a t i o ne x p e r i m e n ts h o w st h a tw i t ht h ee n h a n c e m e n to f p a c k e t l o s sr a t e ,t h ed e g r e eo f s e l f - s i m i l a r i t yi si n c r e a s i n ga c c o r d i n g l y e m u l a t i o ne x p e r i m e n t sm e n t i o n e da b o v es h o wt h a ts e l f - s i m i l a r i t yc a l lc a u s ed e g r e s s i o n o fn e t w o r kp e r f o r m a n c e ,f o re x a m p l e ,t h ei n c r e m e n to fp a c k e tl o s sr a t e w h e ni ti ss e v e r e , c o n g e s t i o nw i l lb ec a u s e d s oac o n g e s t i o na l a r ms y s t e mi sp r o p o s e di nt h i sp a p e r , c o m b i n e d 埘t hd y n a m i cb a n d w i d t ha l l o c a t i o n t h es y s t e mu t i l i z e st h ec o r r e l a t i o no fs e l f - s i m i l a r 仃a 街c o v e rl o n gp e r i o do ft i m e ,p r e d i c t st h et r a f f i co v e rn e x tp e r i o do ft i m e w h e nt h eb u f f e rc a n t h a n d l et h ep r e d i c t e dt r a f f i cl o a d , t h es y s t e mw i l lb es t a r t - u p b a n d w i d t hi si n c r e a s e d , s o n e t w o r kp e r f o r m a n c ei si m p r o v e d 1 1 1 ee m u l a t i o ne x p e r i m e n t a lr e s u l ts h o w st h a tt h es y s t e m c a l lp r e d i c tf o r t h c o m i n gc o n g e s t i o n m o r e o v e r , c o m p a r e dw i t hf i x e db a n d w i d t ha l l o c a t i o n , i t c r ns a v eb a n d w i d t h k e yw o r d s :s e l f - s i m i l a r i t y ;l o n g - r a n g e d e p e n d e n c e ;h u r s tp a r a m e t e r ;n e t w o r kp e r f o r m a n c e ; c o n g e s t i o n i i 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工 作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地 方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含 本人为获得江南大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明 确的说明并表示谢意。 签名: 墨壶】盘日期:2 。7 年弓月形日 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规 定:江南大学有权保留并向国家有关部门或机构送交论文的复印件和 磁盘,允许论文被查阅和借阅,可以将学位论文的全部或部分内容编 入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、 汇编学位论文,并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 签名:墨壶! 壶导师签名:至! 三墨 日期:2 叼年;月,日 第1 章前言 1 1 自相似现象的提出 第1 章前言 自相似和分形是由数学家b e n o i tb m a n d e l b r o t 于1 9 6 8 年提出的【1 1 ,并作为 物体的一种性质进行描述,如:一个自然映象,一个时间序列等。他在研究海岸 线等曲线时,发现这类不光滑的曲线具有自相似性:将该图形的任一部分取出, 放大到原来的尺度后,所得图形与原图形非常相似。除了海岸线之外,这类具有 自相似性的图形广泛存在于自然界中。 分形现象起源于几何学。自相似性是与分形相关的特性。分形的一个较正式 的定义是;“分形是自然界中的物体表现出的内在不规则性和不完整性,如云、 山等”。如果一个对象是自相似或分形的,则它的局部放大后,与整体具有相似 的形状。 考虑集合论中的c a n t o r 集。二维c a n t o r 集a - 【o ,1 】【o ,l 】,是以闭区间【o ,1 1 开始,将区间长度的中间l ,3 部分取出,余下区间 o ,1 3 和 2 3 ,1 】。对剩余的每 个区间,重复以上过程,以至无穷,构造出的二维c a n t o r 集如图1 1 所示。由图 可见,它的任何一部分被放大后,其形状与整个图形的形状相似,即该集合是自 相似的。 l i 一路哥哥_ 一一 l :j i 哆” _ _ _;: :j 一一一 垃:j 图l l 二维c a n t o r 集 分形描述了自然界中广泛存在的一类物质的基本特性,包括局部与局部、局 部与整体在形态、功能、信息、时问与空间等方面具有某种意义上的自相似性, 自然界存在的许多结构都具有这种潜在的几何规律性,也称之为尺度不变性 ( s c a l ei n v a r i a n c e ) 。在现实世界中,大量存在的是统计自相似、渐进自相似和随机 自相似,它们的特点是自相似性在一定的尺度范围内存在。 对于时间序列,自相似性表示在不同的时间尺度下呈现出相同的统计特性。 因此,这样的时间序列在一个大的时间或长度范围内呈现突发性。 1 2 自相似流量的研究 网络流量自相似性的研究始于1 9 8 7 年,d v w i l s o n 等使用一种精密的网络 一;一一 江南大学硕学位论文 监测设备,对b e l l c o r em o m sr d 中心的若干个以太网中的业务进行了深入研究 2 , 3 , 4 1 。1 9 9 4 年,b e l l c o r e 的研究人员发现以太网的业务流量在很大的时间尺度上 存在突发性。也就是说以秒、分钟,甚至小时作为计量单位,得到的网络业务量 对应于时间的曲线都具有较强的波动。但传统网络分析中采用的泊松模型产生的 网络业务,随着时间轴的单位逐渐变大,会逐渐失去它的震荡性而趋近于平滑。 通过对大量实际业务数据的分析,他们发现网络业务所表现出的统计自相似性完 全不同于传统的业务模型。 研究表明,在不同的网络环境中,自相似性是普遍存在的现象。具有代表性 的有:l d 柚d 1 3 j 等对局域网流量的研究;p a x s o n j 等对广域网流量的研究: c r o v e l l a l 6 1 等对w w w 业务流的研究;w i l l i n g e r i h 等对v b rv i d e o 业务流的研究。 业务流在一定的时间尺度内是自相似的,即业务流在按一定时间尺度调整后的行 为,仍具有不可忽略的相关结构。该行为完全不同于传统的流量模型泊松过 程或马尔可夫过程。 实际网络环境中采集的流量与泊松分布产生的流量比较如图1 2 所示。 2 第l 章前言 图1 2 实际网络业务流与传统p o i s s o n 模型产生的业务流比较 图1 - 2 中,每个子图表示各单位时间内数据包的数量。左侧是实际网络环境 中采集的流量样本,最上端子图的时间单位为1 0 0 秒,记录了一天内每1 0 0 秒内 的数据包的数量;截取该子图中某一时间段的流量,扩大其时间解析度1 0 倍, 形成另一单位时间数据包数量图,如其下子图所示。右侧子图间截取时间段的关 系与左侧相同,其表示的流量由传统的泊松过程生成。在时间单位为0 0 1 秒时, 两者具有基本相似的突发性。而当时间轴的单位增大到o 1 秒时,泊松业务的突 江南大学硕上学位论文 发性逐渐减少;当时间轴单位为1 秒时,泊松业务基本趋于平滑。而b e l l c o r e 测 得e t h e r n e t 网络业务仍具有较强的突发性。观察左侧各子图可见,各图在统计分 布意义上都是相似的,表现出较强的突发性,长期的突发由短期内的突发形成。 由右侧子图可见,传统泊松模型表现为:业务量短期突发现象经大时间尺度聚合 后趋于平稳。实际网络业务中存在的这种突发性不随时间轴单位的变化而变化的 特性叫做自相似或者分形。 1 3 国内外研究现状及意义 l e l a n d i j 等通过对局域网的流量分析以及p a x s o n 5 i 等对广域网的测试分析, 均发现流量具有自相似性。流量到达过程呈现突发性和间歇性,分组流量描述为 到达间隔时间呈重尾衰减,方差以样本大小的分数幂衰减,功率谱离散接近原点, 相关性体现为长相关。这个结果引发了对流量到达过程新模型的大量研究,同时 也影响到传统观念的队列行为。文献【5 】指出在广域网流量中,泊松过程仅用于 对用户会话到达的建模,而对于其他到达过程的准确建模却不可以。使用泊松或 马尔可夫模型不能准确反映实际流量的长相关性,会导致分析时低估平均分组延 时或最大队列长度等因素。因此,在广域网流量中,分组到达过程应采用能够表 征长相关性的模型,自相似过程就是研究较为广泛的、简单的长相关模型。自相 似过程与传统的泊松或马尔可夫模型相比,有许多不同的统计特性,最重要的是 可以反映流量在任意时间范围内的长相关性,即当对流量进行较大范围时间尺度 的测量时,流量会产生相似的特性,而传统的流量模型只存在短相关性,在不同 的时间尺度上具有不同特性。 对流量自相似性的研究可以分为两类:一类是关于自相似流量的建模【6 ,3 1 : 另一类是自相似性对网络性能的影响 9 ,“。网络业务数据中的重尾分布为研究自 相似性提供了新的方法,同时对网络性能带来很大影响。第一类研究指出物理上 网络测量的流量路径通常用来识别规模恒定突发的存在,采用合成流量建模来匹 配其特性。这些研究显示长相关性是产生于局域网和广域网流量中的现象d l , 1 2 】。 另一类研究指出自相似流量对网络性能有不利的影响,最重要的结果是自相似流 量下队列长度分布的衰减比短相关业务源( 如泊松模型) 要缓慢。一些研究表明, 自相似性对小缓冲容量或短时间尺度稍有影响i l 引。另外,还有研究表明,流量的 自相似性会导致缓冲区溢出率增加,延时变长以及持续周期性拥塞,直接影响新 一代网络的设计、控制、分析和管理【5 l 。 1 4 本文的主要工作和基本结构 网络流量的自相似性和自相似流量的生成对网络设计和性能分析具有重要 4 第1 章前言 的意义。本文对网络流量的自相似特性、网络产生自相似性的原因以及自相似性 对网络性能的影响等问题进行了研究。本论文的主要工作包括: 第二章首先对传统的网络流量模型进行介绍,并指出了它们的不足之处。然 后,给出了自相似过程的定义和性质,对相关概念进行了总结。自相似性可以用 h u r s t 参数描述,介绍了几种h u m 参数的估计方法。 第三章首先介绍了几种自相似流量的生成方法,并指出了它们的优缺点。然 后,对自相似性的产生原因进行了分析。自相似现象不是单原因造成的,而是 多种原因共同作用的结果。 第四章对自相似过程的合并与分解进行了分析,并通过实例进行了验证。接 着,重点研究了自相似性对网络性能的影响,利用n s 进行仿真实验,分析了自 相似性对分组丢弃率的影响。另外,在仿真实验中增加丢失模块,研究了当分组 丢弃率不同时,对网络流量自相似性的影响。 在第五章中,针对自相似流量中当分组丢弃严重时可能引发的拥塞现象,从 自相似流量的时间相关性角度,构建了一个拥塞预警系统,并与动态带宽分配功 能相结合。应用自相似过程对流量进行模拟,从而实现对系统的下一时段流量的 预测。当预测到流量将超过缓冲区所能处理负载的极限时,触发预警系统,实现 增加带宽的功能,保证了网络畅通。并逶过仿真实验,对该系统的性能进行了分 析。 第六章对本文的工作进行了总结,并对未来的工作进行了展望。 江南大学硕士学位论文 第2 章自相似特性的定义及参数估计 在传统通信网业务中。通常假设业务到达过程服从泊松分布,到达间隔服从 负指数分布。并随着研究的深入,引入了各种推广的泊松模型和马尔可夫模型。 这些模型的共同特点是只存在短时相关性,即所表示的业务流在各个时间尺度下 具有不同的特性。而实际网络的业务流与这类模型存在较大偏差,在各个时间尺 度下表现出相似的突发特性,即自相似性。 自相似序列在统计特性上与传统的短相关( s h o r t r a n g ed e p e n d e n t ,s r d ) 序 列有很大的区别。本章首先对传统的流量模型作简要的回顾,然后重点介绍自相 似的定义、特性及相关概念,并介绍几种自相似参数的估计方法。 2 1 传统的网络流量模型 1 9 9 4 年,l e l a n d d i 等人通过对以太网上的数据进行分析,发现以太网流量具 有自相似性,并提出用自相似模型进行度量。此后,又有许多研究者对传统的网 络流量模型提出挑战,其中具有代表性的有:p a x s o n t 5 1 等对广域网流量的研究以 及c r o v e l l a f 6 1 等对w w w 业务流的研究。 传统的网络流量模型大多基于马尔可夫对流量到达过程和服务时间分布的 假设,分组和连接到达过程经常被看作是泊松过程,描述为到达间隔时间呈指数 衰减,方差以样本大小逆向衰减,功率谱收敛逐渐接近原点等。这些模型产生的 业务,通常在时域仅具有短相关性,随着时问分辨率的降低,即时间尺度变大, 网络流量将趋于一个恒定值,即流量的突发性得到缓和。传统的流量模型曾广泛 应用于通信网业务中。 2 1 1 马尔可夫模型 马尔可夫方法是利用某一变量的现在状态和动向,预测该变量未来的状态及 其动向的一种分析手段。这种方法无论在社会科学还是在自然科学领域,都有广 泛的应用。 马尔可夫链的定义:若随机过程 x ( t ) ,t e t ,满足条件: ( 1 ) 时间集合取非负整数t = o ,1 2 ,对应于每个时刻,状态空间是离散集, 记做i = ( o 12 ) 。即,时间x ( t ) 是离散状态的; ( 2 ) 在任一时刻n ,以及任意状态i o i l i 卜l , h ,j 下面的条件概率等式成立: p x ( n - 1 ) ji x ( n ) - - - i ,x ( n 1 ) :i n 1 ,x ( 1 ) = i t ,x ( o ) = i o = p z ( n + 1 ) - j z ( n ) = i 6 第2 章自相似特性的定义及参数估计 即x ( t ) 在时刻l l + 1 的状态x ( n + 1 ) = j 的概率分布只与时刻n 的状态x ( n ) = i 有关, 而与以前的状态x ( n - 1 ) = i ,卜,x ( o ) = i o 无关 则称x ( t ) ,t t 为一个马尔可夫键。记条件概率p x ( n + 1 ) i j1 x ( n ) - i = p u ( n ) 为在 时刻n 的一步转移概率。由状态i 出发,经过一步转移后,必然到达状态空间i 中的一个状态且只能到达一个状态,因此一步转移概率p i j ( n ) 应满足: ( 1 ) p i j ( n ) o i j i ; ( 2 ) 弓( 甩) = l i e h j e , 如果固定时刻n 6 t ,则由一步概率p i i ( n ) 为元素构成的矩阵: ( 状态空间i _ o ,l ,2 ) ,0 ) p l o ( n ) p o 白) p o 咖) r e ( n ) p l ( 而 称为在时刻n 的一步转移矩阵。 如果马尔可夫链的一步转移概率p i j ( n ) 与n 无关,即无论在任何时刻n ,从状态i 经一步转移到达状态j 的概率都相等,即p n - l ix ( n ) = i = p i j ,则称为齐次马 尔可夫链。 2 1 2 泊松模型 泊松模型广泛应用于电话网的设计中,其核心思想是网络事件是独立分布 的,并且它们只与个单一的速率参数有关。对于一个泊松过程n ( t ) ,例如 o ,t ) 这段时问内的到达的呼叫次数,具有以下性质: ( 1 ) 零初值性:n ( o ) = o 。 ( 2 ) 独立增量性:在任意两个不相重叠的时间间隔内,到达的呼叫次数相互独立a ( 3 ) 齐次性:在i s ,t ) 这段时间内到达的呼叫次数只与时间间隔长度t s 有关,而与 起点时间s 无关。 ( 4 ) 普遍性:在一个短时间间隔内,到达一次呼叫的概为旯t ,无呼叫的概率为 1 彳t ,到达两次或两次以上呼叫的概率趋于o 。即当t 充分小时,呼叫到达在 长为a t 的时间内以接近1 的概率最多出现一次。 如果 n ( t ) ,t 0 为满足上述四个条件的计数过程,则 n ( t ) ,t o 是强度为五的 泊松过程。 泊松过程的成立需要存在以下假设:到达的时间序列之间要保持独立分布: 时间到达的大小和时问分布要满足指数分布;交互线路传输等于每个方向的流量 7 江南大学硕士学位论文 总和。 传统的排队分析结果依赖泊松到达的假定,突发在短时间( 小时间尺度) 内 发生,当业务源数目增加时,突发性会被吸收,突发业务变得平滑,因此对缓冲 容量的需求不太高。然而。在现今的分组交换网络中,突发没有明确的长度,在 所有时间尺度上都有可能发生,不可能将它们平滑掉,所需的队列缓冲容量远远 大于泊松到达过程对缓冲容量的需求。 2 1 3 传统流量模型的缺点 传统模型产生的流量。通常在时域上仅具有短期相关性,所以在经过时间上 的平均以后,突发会趋向于平稳状态。时间域上的短期相关性对应于频率域上的 高频成分,因此这些模型产生的业务一般具有较多的高频成分而低频成分却比较 少,故不能准确地描述真实的网络流量。 传统网络流量分析模型存在很多不足之处【h j :如数据包到达不是严格服从 泊松分布:大部分连接到达也不是泊松到达;连接排列不是正态对数分布,也不 是指数分布;数据包到达是相关联的;连接到达也是相关的。传统的业务模型只 存在短时相关性,即在不同的时间尺度上有不同特性。在电话网设计中,假设呼 叫保持时间和呼叫间隔时间服从指数分布,网络业务服从泊松模型。随着对自相 似性研究的深入,研究人员发现自相似性反映业务在较大时间尺度具有突发性, 对缓存的占用比传统排队论的分析结果要大,这样会导致更大的延时。这说明泊 松模型不再适当前的网络流量建模,否则会降低网络的性能:比如,缓冲区的线 性增长,数据包的丢失并不是呈指数幂律减少这样导致网络的吞吐量降低;并 且缓冲区的增加使得数据包转发的等待时间变长,即延迟增大。在自相似性流量 条件下,传统的流量模型将使得网络性能下降。 2 2 自相似过程的定义及性质 2 2 1 自相似过程的定义 考察一个广义平稳的随机过程 ) ( f 1 ) 删,l ,2 ,设x n 是具有恒定均值旷e ( x i ) 和有限方差0 2 = e 【( x i 2 】,其自相关系数为5 i : 职) 2 e ( x i 一( x i + k - p ) 】,( k = o ,l 2 )( 2 1 ) 仅与k 有关,其中可理解为第k 个单位时间内到达的网络业务实体数目。 设x 的自相关系数有如下形式: “k 卜k - p l l ( k )( 2 2 ) 8 第2 章自相似特性的定义及参数估计 其中l l 皿) 是一个缓变函数,即l i m 乙厶= l ,对所有的x 0 成立;称满 f 足上述条件的过程为渐进自相似过程。 定义1 广义平稳的离散随机过程 x 。 删称为精确的二阶自相似过程, 且具有自相似参数h = i 一肌,0 8 l( 2 3 ) 具有自相似参数0 5 h = o 称为分形布朗运动 f b m ( f r a c t i o n a lb r o w n i a nm o t i o n ) 。 定义2 x 。( r n ) 唧,1 “称5 b x 。) 栅,l 2 的m 阶聚集过程,如果: x ) = x _ k m ( 2 4 ) i r 一1 ) m + l 它的自相关系数记作一“讯) 。 定义3 广义平稳的离散随机过程 k ) 。吨l ,2 称为渐近二阶自相似过程,且 具有自相似参数h = i 1 8 2 ,0 8 l( 2 5 ) 分数自回归整合滑动平均过程( f r a c t i o n a la u t o r e g r e s s i v ei n t e g r a t e dm o v i n g a v e r a g ep r o c e s s ) f a r i m a ( p ,d ,q ) ,0 d l 2 ,是一个渐近二阶自相似过型,自相 似参数h 叠d + 1 2 。 定义4 广义平稳的离散随机过程 x 。 。吨i , 2 称为强渐近二阶自相似过程, 且具有自相似参数h = i 1 3 2 ,o 8 = l 均满足: l i r ar ( k ) 肥” a o ,c 为常量 ( 2 6 ) 自相似参数h 又称为h u r s t 参数,是描述自相似特性的唯一参数。h 是长相 关( 1 0 n g r a n g ed e p e n d e n c e ) 程度的度量,0 h i 表示短相关;h = l 2 表示不存在相 关性;1 2 h l 表示长相关。网络流量是长相关的,因此h 的取值范围是( i 2 ,i ) 。 h 越大,自相似程度越高。 2 2 2 自相似过程的性质 ( 1 ) 长相关性 如果,( 七) 2 0 。,则称平稳过程x 具有长相关性,其中r ( k ) 是过程x 的自 i ; 9 江南大学硕士学位论文 相关函数,m a n d e l b r o t 将长相关性称为约瑟夫效应( j o s e p he f f e c t ) 。由自相似过程 的定义可知,由于o 8 1 ,r ( k ) - j i 一隆o o ,因此自相似过程是长相关的。 j ;- - 砷i i o 传统模型的自相关函数随间隔呈指数方式衰减,即r c k ) = p ,o p 1 ,故 r ( ) 。,因此是短相关的。 i = 由 严格来说,长相关性和自相似性不是完全等价的,前者指平稳序列的自相关 函数的衰减特性,而后者主要指离散或连续过程有限维分布的标度不变特性。 ( 2 ) 慢衰减方差 取样平均的方差随取样窗口m 的增大,其递减速率慢于取样窗口的倒数,即 v a r c 曩m ) c m 皿- ( 2 其中,0 f l l ,c 是与m 无关的正常数。方差随着过程聚集而缓慢衰减,表 明自相似过程的波动程度。 ( 3 ) 谱密度的幂指数特性 当在频域上考察自相似过程时,由于其持续性,低频处的谱密度非常大,表 现为在频率2 的零点附近谱密度函数f ( 兄) 服从幂指数函数,即: 坟五卜五i 当五 0( 2 8 ) 其中,o r l ,r = l - 1 3 ,o 0 5 时,由h u r s t 效应可 1 0 第2 章自相似特性的定义及参数估计 知,样本中极端值的持续时期会较长。对于网络业务流来说,可理解为网络业务 的突发性将持续较长时间,h 可用来描述业务突发性的强度。 2 3 重尾分布与自相似 2 3 1 重尾分布 网络流量具有自相似性,最早在文献 3 e e 有描述。传统o n o f f 模型的 o n 和o f f 持续时间以指数分布【r 丌,模型的自相关结构以指数衰减。若o n 或 o f f 持续时间为重尾分布,或两者都为重尾分布,则可以得到长相关结果。 定义【l8 】如果随机变量满足: l 1 一f ( x ) = p x x 卜 当x 呻。o 时, 口 o ( 2 1 1 ) 工一 则称随机变量x 服从重尾分布( h e a v y - t a i l e dd i s t r i b u t i o n ) 。 一种简单的重尾分布是具有参数k 和口( k 0 ,口 o ) 的p a r e t o 分布,它的密度 函数和分布函数为: 坟x 产f ( x ) = o , x s k 婶l 一4 , x k 口 o ( 2 1 2 ) e 【x 卜二t k , 口 l ( 2 1 3 ) 口一1 该随机变量可取的最小值由参数k 确定,而参数口则确定该随机变量的均值 和方差:当球q 时,该分布具有无穷大的方差;而当口s l 时,具有无穷大的均 值和方差。 与负指数分布、正态分布等常用的分布相比,重尾分布具有一些特殊的性质。 当口q 时,重尾分布具有无穷方差,m a n d e l b r o t 把称这种特性称为高可变性 ( h i g hv a r i a b i l i t y ) t “,即诺亚效应( n o a he f f e c t ) t 4 1 。 2 3 2 重尾分布与自相似性 多个相互独立同分布的o n o f f 信源的叠加可以生成自相似业务,其中每个 o n o f f 信源呈现出“诺亚效应”。每个o n 0 f f 信源的“诺亚效应”导致o n 周期和o f f 周期可能非常长,但有不能忽略的可能性;每个o n o f f 信源独特 的性质将呈现在一个很大的时间尺度范围内。诺亚效应就是所谓的无限方差集, 可以使用具有无限方差的重尾分布作为数学工具来建立这种现象的模型。o n 周 江南犬学硕 ? 学位论文 期和o f f 周

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论