(计算机应用技术专业论文)基于小波变换的网络流量分析和建模.pdf_第1页
(计算机应用技术专业论文)基于小波变换的网络流量分析和建模.pdf_第2页
(计算机应用技术专业论文)基于小波变换的网络流量分析和建模.pdf_第3页
(计算机应用技术专业论文)基于小波变换的网络流量分析和建模.pdf_第4页
(计算机应用技术专业论文)基于小波变换的网络流量分析和建模.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西南交通大学硕士研究生学位论文第1 页 摘要 大量研究结果表明实际网络流量具有骥显的尺度特性,在大尺度上表现 为自相似( 单分形) ,在小尺度上表现为多重分形。多重分形为刻画流量在小 尺度上的奇异性提供了良好的数学框架。而小波变换对具有长程依赖性的流量 起到了去相关的作用,因此有必要利用小波技术来研究多重分形。同时网络流 量的多尺度特性也需要研究人员利用新的方法柬探讨流量本质特征。 流量的多重分形特性对网络性能有着非常重要的影响,建立一个基于多 重分形特性的实际流量的业务模型很有必要。本文首先从实际网络流量的特征 入手,分析研究流量的全局尺度和局部尺度特性,确定流量的分形特性与产生 分形的时间,并且比较不同类型的流量在不同尺度下所表现出的性能,分析了 产生这种现象的原因。为了深入研究在多重分形条件下影响实际流量特性的因 素,以小波变换为基础,采取对实际流量分组的方法,分别进行组内打乱和组 闻打乱,发现均值和方差对多重分形有较大影响。 其次,利用小波变换能够去除实际流量相关性的特点,结合实际研究过 程中所发现的不同类型的流量具有不同的分形特性的结论,建立新的合成模 型,提高合成流量的精度,并且透过对合成后的流量进行尺度刻画和性能评价, 验证了新模型的正确性。 最后,对建立一个基于多重分形特性的可以同时预报长相关和短相关特性 的实际网络业务模型的必要性进行讨论,针对a r 、a r m a 等模型对短相关数据 能较好的预测丽对长楣关数据预测精度不高的特点,并结合小波变换能够去除 实际数据相关性的优势,建立新的预测模型,该预测模型对长相关数据同样具 有比较高的预测精度。同时,改进后的模型也克服了f a r i m a 模型计算量比较 大的缺点,保持了算法的简单性。 关键字:小波变换;多重分形;多尺度;相关性;业务模型 西南交通大学硕士研究生学位论文第珏页 a b s t r a c t a g r e a td e a lo fr e s e a r c hr e s u l t si n d i c a t e t h a ta c t u a ln e t w o r kt r a f f i cp r o c e s s e s e x h i b i tu b i q u i t o u sp r o p e r t i e so f m u l t i s c a l e s ,n a m e l ys e l f - s i m i l a r i t y ( m o n o f r a c t a l ) i nl a r g et i m es c a l ea n dm u l t i f r a c t a li ns m a l lt i m es c a l e m u l t i - f r a c t a lo f f e r sa g o o d m a t h e m a t i c a lf r a m e w o r kt od e s c r i b et h es i n g u l a r i t yo ft r a f f i ci ns m a l lt i m es c a l e i t i sn e c e s s a r yt ou s ew a v e l e tt r a n s f o r i l lt os t u d yt h em u l t i f r a c t a lb e c a u s eo ft h e d e c o r r e l a t i o nc h a r a c t e r i s t i co f 肠y e l e t 。t h em u l t i s c a l ec h a r a c t e r i s t i co fn e t w o r k t r a f f i ca l s on e e d st oi n t r o d u c en e wm e t h o d st os t u d yi t se s s e n t i a lc h a r a c t e r i s t i c 曩狩m u l t i f r a c t a lc h a r a c t e r i s t i co ft r a f f i ch a sg r e a te f f e c to nt h ep e r f o r m a n c eo f n e t w o r k 。i ti s n e c e s s a r yt o c o n s t r u c tt r a f f i cm o d e lb a s e do nm u l t i f r a c t a l c h a r a c t e r i s t i c f i r s t l y , w i t ht h ea n a l y s i so ft h ec h a r a c t e r i s t i c so fw h o l ea n dl o c a l s c a l eo fa c t u a ln e t w o r kt r a 衢c ,t h i sp a p e ra s c e r t a i n st h ef r a c t a lc h a r a c t e r i s t i ca n di t s i n i t i a lt i m eo ft r a f f i c ,a n dc o m p a r e st h ed i f f e r e n tp e r f o r m a n c eo ft r a f f i ci nd i f f e r e n t t i m es c a l e ,a n da n a l y z e st h er e a s o nf o rt h eo c c u r r e n c eo ft h i sp h e n o m e n a i no r d e r t od e e p l ys t u d yt h ef a c t o r sw h i c ha f f e c tt h ec h a r a c t e r i s t i co fa c t u a lt r a f f i cu n d e rt h e c o n d i t i o no fm u l t i f r a c t a l ,t h ea u t h o ru s i n gw a v e l e tt r a n s f o r mt oa n a l y z et h e d e p e n d e n c eo ft h e a c t u a lt r a f f i c ,h ed i v i d e st h et r a f f i ci n t ob l o c k sa n dt h e n i n t e r n a l l yo re x t e r n a l l ys h u f f l e st h e m t h et e s tr e s u l t ss h o wt h a tm e a na n dv a r i a n c e o ft h et r a f f i cb o t hh a v eg r e a ti m p a c to nm u l t i f r a c t a l s e c o n d l y , b a s e do nt h e m u l t i f r a c t a lc h a r a c t e r i s t i co ft h et r a f f i ca n dt h e p r o p e r t yo fd e c o r r e l a t i o no fw a v e l e tt r a n s f o r m ,an o v e ls y n t h e t i c m o i l e li s c o n s t r u c t e dt oi m p r o v et h es y n t h e t i ca c c u r a c y t h r o u g ht h es c a l ed e s c r i p t i o na n d p e r f o r m a n c ea s s e s s m e n t o f t h es y n t h e t i ct r a f f i c ,t h ev a l i d a t i o no ft h en o v e lm o d e li s v e r i f i e d 。 f i n a l l y , t h en e c e s s a r yo ft h ec o n s t r u c t i o no fn e t w o r kt r a f f i cm o d e lb a s e do n m u l t i f r a c t a lc h a r a c t e r i s t i ci sd i s c u s s e d ,n l em o d e lc a np r e d i c tl o n g - r a n g ea n d s h o r t - r a n g ed e p e n d e n c eo ft h ea c t u a lt r a f f i c b a s e do nt h ec h a r a c t e r i s t i ct h a ta r a n da r m am o d e l sc a nc o r r e c t l yp r e d i c ts h o r t - r a n g ed e p e n d e n c ew h i l eh a sl o w p r e d i c t i o na c c u r a c y t o l o n g r a n g ed e p e n d e n c e ,a n o v e lp r e d i c t i o nm o d e li s c o n s t r u c t e db a s e do nt h es u p e r i o r i t yo fd e c o r r e l a t i o no fw a v e l e tt r a n s f o r m t h i s n o v e lm o d e lh a sa l s oh i g hp r e d i c t i o na c c u r a c yt ol o n g - r a n g ed e p e n d e n c e a tt h e s a m et i m e ,t h e i m p r o v e d m o d e la l s o c o n q u e r s t h ed e f e c to fc o m p u t i n g c o m p l i c a t i o no ff a r i m a m o d e la n dk e e p st h eb r i e f n e s so fa l g o r i t h m k e yw o r d s :w a v e l e tt r a n s f o r m ;m u l t i f r a c t a l ;m u l t i s c a l e ;d e p e n d e n c y ;t r a f f i cm o d e l 西南交通大学 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校 保鼯并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和 借阅。本人授权西南交通大学可以将本论文的全部或部分内容编入有关数据库 进行检索,可以采用影印、缩印或扫描等复印手段保存和汇编本学位论文。 本 1 2 ( 请在以上方框内打“) 学位论文作者签名: 嚣期: 本授权书; 指导老师签名:锨多每 霾麓:扩t 扩t 多 1厶铤一h 0几锄等 建胡乃 西南交通大学学位论文创新性声明 本人郑重声明:所至交的学位论文,是本人在导师指导下独立进行研究 工作所取得到成果。除文中已经注明引用的内容外,本论文不合任何其他个 人或集体已经发表或撰写过的研究成果对本文的研究做过贡献的个人和集 体,均已在文中作了瞬确酌说喷。本人完全意识到本声臻的法律结果由本人 承担。 本论文主要研究多重分形下网络流量的建模、性能分析等问题,其创新点 如下: ( 1 ) 针对各种类型流量进行分形刻画,并且研究影响性能的主要因素 本文首先对实际流量进行分形界定,即确定实际流量是单分形还是多重分 形,并曼针对各种类型流量进行分形刻画。同时为了研究多重分形下影响流量 的主要因素,本文通过对实际流量分块的方法进行测试,验证了实际流量在大 尺度上表现出自相似、小尺度上表现出多重分形,并且发现不仅h u r s t 参数对 性能有影响,均值和方差也存在一定的影响。所以在对网络性能进行评价时, 不仅需要考虑h u r s t 参数,还要考虑均值、方差等因素。( 见第3 章) ( 2 ) 基于小波变换的实际流量分解与合成 本文幂| j 用离散小波变换对实际流量进行了分解与合成,对于某些非平稳时 间序列经小波分解后可以近似为平稳时问序列,这样就可以采用传统的方法对 分解后的时间序列进行合成。在合成的过程中,为了保持原流量趋势并且减少 突发,本文保持流量的尺度系数不变,然后产生正态比例系数,根据尺度系数 与小波系数的关系可以求得小波系数,最后进行流量重构。( 见第4 章) ( 3 ) 基于小波变换的实际流量预测 本文首先采用小波变换对实际流量进行处理,将现有的a r 模型和a r m a 模型进行改进,使其不仅对短相关流量有较好的预测准度,阕时对长褶关数据 也有较好的预测准度。( 见第5 章) 学位论文俸者签名: 绸锭 噍枷蹰箩月刁鼹 西南交通大学硕士研究生学位论文第1 页 第1 章绪论 1 1 分形概念的提出 “分形”一词译于英文f r a c t a l ,系分形几何的创始人曼德尔布罗特【l 】 ( b b m a n d e l b r o t ) 于1 9 7 5 年由拉丁语f r a n g e r e 一词创造而成,词本身具有 “破碎”、“不规则”等含义。m a n d e l b r o t 研究中最精彩的部分是1 9 8 0 年他 发现的并以他的名字命名的集合,他发现整个宇宙以一种出人意料的方式构成 白相似弘4 j 的结构( 见图卜1 ) 。m a n d e l b r o t 集合图形的边界处,具有无限复杂 和精细的结构。如果计算机的精度是不受限制的话,你可以无限地放大它的边 界。图1 - 2 和图1 - 3 就是将图1 - 1 中两个矩形框区域放大后的图形。当你放 大某个区域,它的结构就在变化,展现出新的结构元素。无论您怎样放大它的 局部,它总是曲折而不光滑,即连续不可微。微积分中抽象出来的光滑曲线在 实际生活中是不存在的。所以说,m a n d e l b r o t 集合是向传统几何学的挑战。 自相似和标度不变性是分形的两个重要特性。多重分形 5 - 9 1 也称为分形测 度,它是研究一种物理量在一个支撑上的分布状况,换句话说,多重分形理论 是定义在分形上的多个标度指数的奇异测度所组成的无限集合。多重分形理论 定量刻画了分形测度在支撑上的分布状况。 图1 1 v l a n d e l b r o t 集合图1 - 2m a n d e l b r o t 集合局部放大 西南交通大学硕士研究生学位论文第2 页 图1 - 3m a n d e i b r o t 集合局部放大 分形不仅在自然界中广泛存在,在计算机网络的实际流量中也是存在的。 如图1 - 4 所示,实际流量在不同的尺度下就表现出分形特性,如从l o o s 到l o o m s 的变化过程中,实际流量就是前一部分的局部放大。 图1 - 4 实际流量的分形表现 1 2 研究背景 自1 9 9 3 年l e l a n 等人【1 0 】发现网络业务的自相似特性以来,大量的研究结果 表明网络流量具有普遍的自相似、长相关特性【1 1 1 【1 2 】,即在很长的时间尺度上 都存在流量突发,聚合流量不会随着聚合尺度的增加而很快地平滑掉。自相似 和长相关特性对网络性能有重要的影响,自相似输入下的队列长度分布星多项 式衰减,而非传统的m a r k o v 模型的指数衰减【l 孓”】。自相似的普遍存在对传统 的基于m a r k o v 的流量建模、性能分析和流量工程提出了挑战,引起了人们的 西南交通大学硕士研究生学位论文第3 页 普遍关注。 但是随着近年来对网络流量深入研究发现,实际流量不能简单的用自相似 进行刻湎,而是表现出明显的尺度特性:在大尺度上表现出自相似( 即单分形 m o n o f r a c t a l ) ,在小尺度上表现出多重分形。实际流量的分形特性不仅具有统 计意义,并且对网络性能与网络控制有重要影响,尤其在网络资源有限的情况 下,建立一个有效的网络模型来处理网络各种情况,将会极大的提高网络的性 能与服务质量。传统的对实际瘸络流量的分析大多基于单尺度,不能对流量的 奇异性做出刻画,因此所得到的结论具有片面性,并且这对分析不同类型的流 量也产生了一定困难,比如对多媒体流量和数据流量的刻画,而多尺度正好能 克服这个缺陷。实际网络流量的非高斯特性表现出来的性能与以往所认识的流 量特性具有很大的差异,当把多尺度、多分形、号# 高斯等因素考虑进来时,传 统的分析方法就显得无能为力了。比如时间尺度从l o o m s 变化到1 0 m s 时传统 的分析方法就无法精确的进行刻馘了,这就需要寻找一种新的方法去研究。 小波 1 6 - 2 1 j 是一种时频域变换方法,小波变换对具有长程依赖性的流量起到 了去相关作用,在时域不容易解决的闯题可以转化到频域中来,同时多重分形 为描述信号在小尺度上的奇异性提供了良好的数学框架。通过小波变换信号可 以一层一层分解到不同的频域上,分解后的信号在频域上比原始信号单一,并 且对信号作了平滑,因此分解后信号的平稳性眈原始信号好得多。对于某些菲 平稳时间序列,其小波分解震的流量可以用乎稳时间序列来处理,这样就可以 采用传统的方法对分解后的时间序列进行处理,从而为某些非平稳时间序列的 预测提供了一种新的方法。另外“压缩性( c o m p r e s s i o n ) 是小波变换的基本 特性之,鄯小波变换系数褶比原来的信号变得“稀疏 ,能量主要集中在少 数系数上,因而具有明星的非高斯性。所以,利用小波对实际网络流量的分形 特性进行刻画,具有比较高的准确性和有效性,也是当前网络研究的热点。 1 3 研究现状 随着多重分形在实际流量中的发现,以及实际流量所表现出来的尺度特 性1 2 2 2 3 1 ( 即大尺度是上表现出自相似特性,小尺度上表现出多重分形特性) , 西南交通大学硕士研究生学位论文第4 页 同时小波对处理分形特性具有良好的效果,大量的国感外研究人员利用小波来 分析和刻画实际流量的分形特性,所涉及到的工作概括起来大致有这样几方 面。 ( ) 实际流量的尺度特性刻画 对实际流量的尺度特性刻画主要包括全局尺度刻蕊和局部尺度刻厕。通过 全局尺度的刻画分析实际流量的能量谱,并求出实际流量的分形参数h u r s t 参 数( 用来确定流量的自相似程度) ,p a t r i c ea b r y 和d a r r y lv e i t c h 在 2 4 中给 出了如何在多重分形的条件下计算不同尺度的h u r s t 参数值的方法,两局部尺 度的刻画可以分析出实际流量所表现出的异于全局尺度行为的局部不规律特 性,通过求解结构函数和划分函数来确定实际流量的分形时间,推断划分函数 的线性状态,就能判断信号是否表现出自相似或者多重分形特性。h u i m i n c h e n t 2 5 】针对多重分形下流量的突发特性,采用了多窗口小波变化方法来估计 时f h j 尺度可变的h u r s t 参数值。a c g i l b e r t 和w w i l l i n g e r 2 6 j 利用传统的串联 方式来处理多重分形下不同类别的流量,并将其应用到实际广域网中去。l u i g i a t z o r i 、n i c o l a a s t e 和m a u r oi s o l a 2 7 l 提出了一种准确的在网络流量测量中对估 计多重分形参数的实时途径:采用一神合适的策略来不断调整流量的估计间 隔,以此来将流量近似为稳定。h o n gf e i t 2 8 l 对多重分形条件下对排队的尾分 布进行了研究,采用的是有限的荤队列服务源并以固定速率来产生输入。q i o n g l i 和d a v i dl 。m i l l s t 2 9 l 调查研究了因特网数据包动态延迟等的尺度行为。i a n w c 。l e e 和a b r a h a m0 ,f a p o j u w o t 删对多重分形理论中确定流量的分形特性的 关键因素结构函数t ( q ) 进行了深入研究,通过7 种不同的结构函数的计算方法, 发现使蹋小波域的估计方法对处理突发的菲稳定的流量在精度上要比使用时 间域的估计方法高得多。t r a n gd i n hd a n g 、s i n d o rm o l n a r 和i s t v i nm a r i c z a p l j 开发了新的网络流量模型,用来获取具有多重分形特性的流量信息,这个模型 不仅可以灵活的处理长相关、多重分形和对数正态分布的流量,还可以方便的 应用到实际流量排殴性能的测量中去。q i n 9 0 i al i n 和d ic h e n 3 2 j 等在小尺度下 对因特网流量进行测量发现,流量密度是引起非稳定和非相关性的主要因素。 张骏温在 3 3 中对因特网业务量多重分形性本质成因进行了研究,发现业务量 话南交通大学硕士研究生学位论文第5 页 多重分形特性是由于t c p 独特的发送行为和多个t c p 连接的汇聚造成的。丛 锁在 3 4 中给出了基于离散小波变换的多重分形模型。 但是这些研究虽然给出了确定实际流量分形特性的方法,但是很少对不同 类型的流量在不同的尺度下表现出来的性能作综合分析、以及产生不阕性能的 原因做出解释,并且很少对多重分形下影响性能的因素进行深刻讨论。 ( 2 ) 实际流量的分解与合成 多重分形为描述信号在小尺度上的奇异性提供了菠好的数学框架,小波变 换对具有长程依赖性的信号起到了去相关的作用,所以在时域里难以分析和建 模的i n t e m e t 网络流量过程在小波域晕就变得相对容易。小波变换将具有长相 关的数据去除相关性后,便可以利用传统方法来处理分解之后的流量。 v i n a yj r i b e i r o 、r u d o l fh 。r i e d i 和r i c h a r dg 。b a r a n i u k 在 3 5 】中孳| 入了一种新 的多重分形框架,讨论研究排队中出现的尾分布和长棚关特性。j i n w uw e i 、 j i a n g x i n gw u 和s h u q i a oc h e n 3 6 】等研究了多重分形流量产生器与流量分析的 结合点。j oy e wt h a m 、s u r e n d r ar a n g a n a t h 和a s l l r a fa k a s s i m 了7 j 引入了一种 大尺度视频压缩模型,专门用来处理速度界予1 0 3 0 k b i t s s 之闯的低比特率的 视频会议和可视电话。龙图景【3 8 】对多重分形小波模型进行了一定的改进,提 出的新模型在各个时间尺度上对小波系数都依据源数据尺度系数的边缘分布 作了修正。这些研究往往比较集中于利用小波对实际流量进行分解,但是利用 小波对实际流量进行合成还做的不够,所涉及到的算法也比较单一,并且大多 都是基于m a l l a t 算法圳。 ( 3 ) 实际流量的预测 实际流量的分形特性不仅具有统计意义,并且对溺络性能与网络控制有重 要影响,尤其在网络资源有限的情况下,建立一个有效的网络模型来预测网络 负载,并及时做出处理,将会极大的提高网络的性能与服务质量。现在对网络 流量进行预测有很多方法,传统的认为网络流量是服从p o s s i o n 分布或近似为 m a r k o v 过程,所以大都是基于线性模型来近似处理流量的发展趋势,主要有 基于自回归a r 或自回归滑动平均a r m a 的预测模型,这些模型算法比较简单, 短期预测有较高的精度,但不适用于长期预测。实际流量往往具有分形特性, 西南交通大学硕士研究生学位论文第6 页 建立自相似基础上的预测模型f a r i m a 可以同时刻画长楣关与短相关特性,在 小尺度与多步网络预测上有较好的精度,但是计算量比较大。x i nw a n g 、y o n g r e n 和x i u m i n gs h a n t 4 0 j 等在小波变换的基础上建立了新的流量预测器 w d r l s ,将实际流量进行分解,然瑟将小波系数近似为短相关进行处理,实 现了在线预测网络流量( 包括长相关与短相关流量) 。w a l t e rw i l l i n g e r t 4 l 】对广 域网流量进行自相似分析研究,将所得到的相关结论运用在g i g a t e r a b i t 速度 的流量预测中去。文献 4 2 1 、【4 3 】中用独立高斯模型对小波系数进行建模,但 并不能描述小波系数的非高斯特性,难以刻锺| 小尺度上的多重分形特性。文献 4 4 】提出了一种基于小波变换的多重分形建模方法,但是比较复杂,缺乏一般 性。 现阶段圈内外利用小波变换对多重分形所作的研究仍然存在不足,归纳起 来主要表现在这样一些方面: 1 ) 针对各种类型实际流量的尺度特性没有全面地进行分析和刻画。 2 ) 对实际流量的分形特性的影响因素缺少说明和实际试验数据支持。 3 ) 对实际流量进行分解研究比较深入,但是对流量合成方面所做工作不够 深入,并且采用的算法大多都是m a l l a t 算法,对于具有多藿分形特性的实际 流量的合成性能不是 瑟好,缺少挂能分柝。 4 ) 在流量预测方面对短相关流量进行预测传统模型比较成熟,但是对分形 模型还有待进一步研究。 5 ) 对于实际流量的性能分析( 比如时延,丢包率等) 在多重分形条件下的 分析不够深入,在不同尺度下所表现出的性熊没有具体说明。 针对上述存在的问题,本文利用小波变换在多重分形条件下对实际流量 进行了一系列的分析和刻画,并且在现有算法的基础上进行改进,提出了新的 算法。 1 ,4 本文的主要工作 多重分形是一个新的研究领域,在流量的多重分形研究中还缺乏一套完整 有效的研究方法和体系。为了建立一个包括多重分形业务模型、性能评价以及 谣南交通大学硕士研究生学位论文第7 页 网络应用研究的体系,这就需要研究人员从实际工程情况和基本的网络技术出 发,利用现有的数学理论和工作,选择适合于多重分形业务研究的方法。 本文在对比泊松模型和自相似模型的基础上引入了多重分形理论,概括介 绍了小波变换的模型和算法,对多重分形模型的建模分析、性能评价进行了较 为系统的研究,并且提供了些后续研究所必需的理论基础、方法工具和技术 手段等。 本文的主要工作包括: ( 1 ) 针对各种不同类型流量进行分形刻画 本文首先对各种实际流量( 包括多媒体流量、数据流量、长相关流量、短 相关流量等) 进行分形界定,即确定实际流爨是单分形还是多重分形。通过对 实际流量的全局尺度分析和局部尺度分析来说明流量是否表现撼多重分形特 性。全局尺度分析主要是针对信号的统计特性丽畜,研究这些统计特性在不同 的尺度上具有的变化规律,而局部尺度分析是为了研究实际流量所表现出的异 于全局尺度行为的局部不规律特性。对实际流量的尺度分祈最终变化到对流量 的能量谱的分折以及结构函数、划分丞数的计算,确定流量的分形以及产生分 形的时间。 ( 2 ) 研究在多重分形条件下影响性能的主要因素 传统方法对实际流量进彳亍的研究所得到影响性能的主要因素,与多重分形 条件下影响性能的主要因素是有差异的。为了研究多重分形下影响流量的主要 因素有哪些,本文通过对实际流量进行分块变化的方法进行测试,最终验证了 实际流量在大尺度上表现出囱相似、在小尺度上表现出多重分形,并且发现不 仅h u r s t 参数对相关性有影响,均值和方差对相关性也存在一定的影响。所以 在对网络性能进行评价时,不仅需要考虑h u r s t 参数,还要考虑均值、方差等 因素。另外,为了研究是否每一科流量都具有相似的特性,本文对各种不同的 实际流量进行了试验。数据流量在小尺度上表现出短相关性,大尺度上表现出 长相关性。焉多媒体监务流表现出褶反的情况,在小尺度上表现出长相关,大 尺度上表现出短相关。当对长相关流量和短相关流量进行对比试验时,发现它 们的能量谱存在一定的变化规律和差异。因此在分析网络流量时,需要综合考 西南交通大学硕士研究生学位论文第8 页 虑到它们在不同尺度下所表现出来的特性。 ( 3 ) 基于小波变换的实际流量分解与合成 小波变换对具有长程依赖性的流量起到了去相关作用。通过小波变换信号 可以一层一层分解到不同的频域上,分解君的信号在频域上比原始信号单一, 并且对信号作了平滑,因此分解后信号的平稳性比原始信号好得多。本文利用 离散小波变换对实际流量进行了分解与合成,对于某些非平稳时间序列经小波 分解后可以平稳时闻序列来处理,这样就可以采用传统的方法对分解后的时间 序列进行合成,从两为某些非平稳时间穿列的合成提供了种新的方法。在合 成的过程中,对实际流量进行小波变换得到它的尺度系数和小波系数,其中尺 度系数刻画流量大致趋势,小波系数刻画流量的细节部分。在以往的模型中, 一般是将每级的尺度系数( 除最大一级外) 根据上一级的尺度系数和小波系 数计算褥到,丽小波系数通过高颠随机数计算出来,这样将增大与原流量的误 差。本文为了保持原流量趋势,并且减少突发,将保持原流量的尺度系数不变, 然后产生讵态比例系数,根据尺度系数与小波系数的关系可以求得小波系数, 最后可以进行流量合成。采耀这种算法合成螽的流量能更好地逼近原始流量, 并且具有很好的性能。 ( 4 ) 基于小波变换的实际流量预测 传统的流量预测模型大都是基于线性模型来近似处理流量的发展趋势,主 要有基于自回归a r 或臼回归滑动平均a r m a 的预测模型。但是实际流量是 具有分形特性并且是长相关的,所以本文首先采用小波变换对实际流量进行处 理,将现有的a r 模型和a r m a 模型进行改进,使其不仅对短相关流量有较 好的预测准度,同时对长楣关数据也有较好的预测准度。 。 对a r 模型和a r m a 模型的改进有相似的思路,首先就是对实际流量进 行小波变换,然后根据各自模型的特点来进行算法上的改进。比如a r 模型采 用小波系数柬驱动白噪声信号,得到预测后的小波系数,再进行流量预测;而 a r m a 模型则采用每一层小波系数 乍为实际数据来进行初始纯,估计相关参 数,然后根据公式得到预测后的小波系数。最后通过试验来说明经改进之后的 模型对长相关数据和短相关数据都有很好的预测准度。 西南交通大学硕士研究生学位论文第9 页 1 5 论文内容安排 论文共5 章,分为四大部分。 第一部分由第1 章组成,是本论文的绪论。该章介绍论文的研究背景、研 究蠢的和意义、研究现状及现有研究工作存在的闽题、以及论文的主要研究工 作、研究方法和研究成果。 。 第二部分由第2 章组成,为基本理论与方法介绍,为后续章节的讨论奠定 理论基础。在介绍色相戗、多重分形、小波变换等概念的基础上,给出了本文 分析用到的讨论基于小波变换进行多重分形下的方法与思路。 第三部分由第3 章组成,为基于小波变换的多重分形的实际流量研究。 在这部分中首先利用小波变化刻函嬲络流量是否存在分形特性,然后分析影响 网络流量分形特性的因素,最后对各种网络流量进行多尺度刻画。 第四部分由第4 和第5 章组成,主要研究基于小波变换的实际流量分解与 合成以及流登预测等闻题。第4 章探讨了基于小波变换的实际流量的合成问 题,提出了新的合成算法;第5 章讨论了实际流量的预测问题,根据小波变化 对现有的预测模型进行改进。 西南交通大学硕士研究生学位论文第l o 页 第2 章基于小波变换的多重分形理论基础 2 1 网络流量特性分析 2 1 1 自相似特性的发现 一直以来人们普遍认为网络流量都是服从p o i s s o n 分布,但是1 9 8 9 年到 1 9 9 2 年间l e l a n d 和w i l s o n 等f 4 5 】人使用具有很高时间分辨率的以太网监视设备 在b e l l c o r em o r r i s t o w n e 4 6 1 1 4 7 l 研究和工程中心的即个以太网段上收集到了数百 万个实际传输的数据包,发现这种叠加的l a n 业务所表现感的统计自相似性 完全不同于传统的p o i s s o n 模型。e r r a m i l l i 和w i l l i n g e r 4 s - 5 0 等人收集并分析了 大量的从i s d n 、以太网和v b r 视频业务中得到的数据;b e l l c o r e 的研究人员 从使用7 号信令的共路信令网上收集了大量原始业务数据做了分析,等等。从 大量的业务流量的研究结果表明:无论是局域网上的数据还是v b r 业务,都 在相当长的时间尺度下呈现出统计自相似性。不论网络的拓扑结构、用户数量、 服务和利用类型如何变化,这种自相似性是始终存在的。 2 1 2 产生自相似的原因 对予网络流量如何会产生自相似现象,这罩面牵涉的因素很多,总的归纳 起来有这样几个方恧: ( 1 ) w e b 流量的自相关性 w e b 文件大小的分布( 包括用户请求的文件、实际传输的文件、文件的传 输时阆、服务器端存储的文件等) 呈重尾分布,客户端c a c h e 的影响相对较小, 造成w e b 文件传输时间的重尾分布,从丽形成w e b 流量的自相似性。 ( 2 ) 重传机制( r e t r a n s m i s s i o n ) 产生囱相似特性 当时间尺度超过1 0 倍的数据包传输时间,重传数据包流量的方差在总的 流量( 新数据包、重传数据包和丢失的数据包) 中占据绝大多数成分。帮使改 变重传机制的参数,如缓存大小、重传企图的次数和超时时限,不能改变重传 负载的自相似特性。 西南交通大学硕士研究生学位论文第l l 页 ( 3 ) t c p 拥塞控制的混沌特性( e r i c s s o n ) b n 的比率控制着系统相位迁移,即从周期性到混沌,并在特定的参数下 产生自相似时间序列;单个的t c p 流量符合渐进自相似;在瓶颈缓存处堆叠 的t c p 流量是短时相关的,其物理解释是t c p 拥塞控制使瓶颈缓存占用率最 大来平滑流量,堆叠的流量得到平滑,单个t c p 流仍保持长相关性。 2 1 3 自相似的数学描述 ( 1 ) 自相关函数 假设以平稳随机过程,即统计特性( 均值、方差、相关系数等) 不随时间 推移两变化。一阶平稳( 均值为常数) ,二阶平稳( 均值和方差为常数,任意 两时间点之间的协方差只取决于时间间隔,又称之为广义平稳) ,那么自摆关 函数定义为: r ( k ) = 研( 鼍一) ( 鼍+ 女- j u ) e ( x , 一) 2 】 ( 2 - 1 ) ( 2 ) 自相似过程 如采一个平稳随机过程x = ( z :f = o ,l ,2 ) ,其囱相关函数满足 ,( k - p l ,( 是) ,当k - - o o ,其中0 夕 0 , l i r a l l ( t x ) i l 。( f ) = l ( 常见的慢变函数,如l ) = 常数,厶( f ) = l o g ( t ) ) 。并且对x 进行堆叠,堆叠产生的时间序列为x ( m ) = ( 置拼:k = 0 ,l ,2 ) ,其中 五仰l1 m ( x k + l + + 瓦,) ,k o ,1 ,2 ( 2 2 ) 那么x 坍自相关函数,御满足:,肌( 尼) 。r ( k ) ,对所有m = 1 ,2 ,( 露= 1 ,2 ,3 ,) 在实际过程中采用渐进自相似过程来模拟,其x ( 坍) 自相关函数r ( 卅) 满足 ,( 肼( 1 ) = 2 1 - p l ,当m 哼o o ( 2 3 ) 广( 埘( 露) = 1 2 8 2 ( 是2 。) ,当m o o ( k = 2 ,3 ,哆。 ( 2 4 ) 5 2 表示一个算予符,其作用予函数f ( k ) 表示 西南交通大学硕研究生学位论文第r 2 页 万2 ( ,( 东) ) = f ( 量+ 1 ) - 2 f ( k ) + f ( 蠡- 1 ) ( 2 5 ) ( 3 ) 鸯相似参数h u r s t 自相似参数h u r s t 引】( 简称h 参数) 用来刻画个随机过程的自相似程度, h 参数满足0 5 h 1 ,h 值越大自相似程度越高,h 值越小自相似程度越低。 使用公式可以求褥一髓机过程的h 参数值: h = l - i l l 2 ,0 0 ,称为比例系数, 霉= l 。式( 2 1 9 ) 称为多重分形模型。 通过l e g e n d e r 变换可得: 哦一lim,-,0奇q-1l n 扣引 协2 娥1 n 善p ( ,) 1 n , 删 定理1 - q 次广义分维数坡满足不等式 q q ,g q 根据定理的结论,可推知:线( 相似维) 岛( 信息维) 0 2 ( 关联维) 。 ( 2 2 1 ) 用线性回归方法处理实际数据并计算出广义分维数的晓( 郎线性回归方 程的斜率) 时,不一定都满足不等式坟珥( 当q q 时) 。这是因为用统计 上的线性回归方法得出的结果是整体上的结果( 取决于所有的数据) ,它与用 取极限方法得出的结果是不一样的。 这里弓| 入齐波夫定律( j o h n 。n l a n dk o t z s ) : 如果随机变量z 的分布律 p ( z = ,) = 口,“,p l ,= l ,2 , ( 2 2 2 ) 则随枕变量z 服从齐渡夫定律。式中g = ( ,一尹) q 为常数,p 为指数参数。 ,等l 随机变量z 的分布函数、数学期望和方差分别为: 嚣( 三) = 尹( z 三) = g ”尹p l ,s : 层( z ) = (

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论