(计算机软件与理论专业论文)网络流量预测技术研究.pdf_第1页
(计算机软件与理论专业论文)网络流量预测技术研究.pdf_第2页
(计算机软件与理论专业论文)网络流量预测技术研究.pdf_第3页
(计算机软件与理论专业论文)网络流量预测技术研究.pdf_第4页
(计算机软件与理论专业论文)网络流量预测技术研究.pdf_第5页
已阅读5页,还剩53页未读 继续免费阅读

(计算机软件与理论专业论文)网络流量预测技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着i n t e r a c t 及其应用的迅速发展,网络规模日益增大,网络应用日益复杂,网络 管理工作越来越繁重,网络故障也频频出现,为了实现可靠的数据传输及合理的网络资 源分配,就需要深刻了解网络的控制机制和复杂的行为特性。网络流量预测对大规模网 络管理、规划、设计具有重要意义,高质量的网络流量预测显得越来越重要和迫切。 本文的主要研究目的是探索新的预测模型以提高网络流量预测的准确性,及加快预 测速度。 首先,全面叙述了网络流量预测的国内外研究现状,为后续的研究奠定了基础; 其次,分析了真实环境下的网络流量所呈现的相当明显的多尺度特性,接着,分析 并比较了几种基于自相似性的网络流量模型的优缺点; 第三,建立了基于改进b p w n n 的预测模型。针对传统b p 小波网络( b p w n n ) 易陷入局部极小,收敛速度慢的缺陷,使用一种学习速率自适应的算法对b p w n n 进行 改进; 第四,建立了基于改进的q p s o 算法训练b p 网络的预测模型。针对标准的q p s o 算法不可避免的出现早熟的不足,研究了一种新的基于参数自适应的量子粒子群优化算 法。该算法较好的避免了粒子群的早熟,提高了算法的全局收敛能力; 第五,建立了融合小波变换与贝叶斯l s s v m 的预测模型。首先将原始流量数据时 间序列进行小波分解,并将分解得到的近似部分和各细节部分分别单支重构到原级别 上;对各个重构后的序列分别用最小二乘支持向量机进行预测;将贝叶斯证据框架应用 于最小二乘支持向量机模型参数的选择;将各个预测结果重构后得到对原始序列的预测 结果。 最后,分别将这三种预测模型用于单步和多步的流量预测之中,比较它们的预测精 度和预测速度。 关键词:网络流量预测,神经网络,最d * - 乘支持向量机,粒子群优化算法,量子 粒子群优化算法,贝叶斯证据框架,小波变换 a b s t r a e t 一 _ _ _ i - l _ _ _ _ _ _ - _ _ _ _ _ _ _ _ _ _ - _ _ - - - - _ - _ l _ - _ _ - i a b s t r a c t a st l l er a p i dd e v e l o p m e n ta n da p p l i c a t i o no fi n t e m e t , t h es c a l eo fi n t e m e ti sb e c o m i n g l a r g e ra n dl a r g e r , t h ea p p l i c a t i o no ft h ei n t e r n e ti sb e c o m i n g m o r ea n dm o r ec o m p l i c a t e d ,t h e t a s ko fm a n a g e m e n tb e c o m e sm o r ea n dm o r eh e a v i l y t h ep r o b l e mo fn e t w o r ka p p e a r sa g a i n a n da g a i n i no r d e rt or e a l i z er e l i a b l ed a t at r a n s f e ra n dr e a s o n a b l e i n t e m e tr e s o u r c e d i s t r i b u t i o n ,i ti sv e r yi m p o r t a n tt oc o m p r e h e n dt h ec o n t r o lm e c h a n i s ma n dc o m p l i c a t e d b e h a v i o r a lc h a r a c t e ro fn e t w o r k t i 刮匝cp r e d i c t i o nh a ss i g n i f i c a n tm e a n i n g sf o rm a n a g e m e n t , l a y o u ta n dd e s i g no fl a r g es c a l en e t w o r k t r a 伍cp r e d i c t i o nw i t hh i g hq u a l i t yi sg e t t i n gm o r e a n dm o r ei m p o r t a n ta n de x i g e n t i nt h i sp a p e r t h er e s e a r c hi sf o c u s e do ne x p l o r i n gn e wn e t w o r kt r a f f i cp r e d i c t i o nm o d e l s w i t hh i 【曲a c c u r a c ya n ds p e e d f i r s t l y , t h ep a p e rc o m p r e h e n s i v e l yn a r r a t e st h ec u r r e n t s i t u a t i o na b o u tn e t w o r kt r a f f i c p r e d i c t i o na th o m ea n da b r o a d i to f f e r st h ef o u n d a t i o nf o rt l l ef o l l o w i n gr e s e a r c h e s s e c o n d l y , t h ep a p e ra n a l y z e ss o m em a i nc h a r a c t e ra b o u tn e t w o r kt r a g i c i nt h ea c t u a l n e t w o r ke n v i r o n m e n t ,w h i c hp r e s e n t sq u i t eo b v i o u sm u l t i - s c a l ec h a r a c t e r , t h e n ,a n a l y z e sa n d c o m p a r e st h ea d v a n t a g ea n dd i s a d v a n t a g eo fs o m en e t w o r ka n a l y t i cm o d e l sb a s e do nt h e c h a r a c t e ro fs e l f - s i m i l a r i t y t h i r d l y , ap r e d i c t i o nm o d e l b a s e do ni m p r o v e db pw a v e l e tn e u r a ln e t w o r ki se s t a b l i s h e d c o n s i d e r i n gt h a tt r a d i t i o n a lb pw a v e l e tn e u r a ln e t w o r k ( b p w n n ) i se a s yt o t a k el o c a l c o n v e r g e n c ea n dh a ss l o w l yl e a r n i n gc o n v e r g e n tv e l o c i t y , am e t h o d b a s e do na d a p t i v el e a r n i n g r a t ei su s e dt oo p t i m i z ei ti na c c e l e r a t i n gt h el e a r n i n gc o n v e r g e n c ev e l o c i t y f o u r t h l y , ap r e d i c t i o nm o d eb a s e do nb pn e u r a ln e t w o r kt r a i n e db yi m p r o v e dq p s o i s e s t a b l i s h e d p r o p o s e san e wa d a p t i v ep a r a m e t e rc o n t r o lm e t h o df o rq p s o t oa v o i dt h e p a r t i c l ep r e m a t u r e l ya n di m p r o v et h ea b i l i t yo fg l o b a lc o n v e r g e n c e f i f u l l v ap r e d i c t i o nm o d ec o m b i n i n gw a v e l e tt r a n s f o r ma n db a y e s i a nl s - s v mi s e s t a b l i s h e d t h eo r i g i n a ln e t w o r kt r a f f i ct i m es e r i e si sd e c o m p o s e di n t oa p p r o x i m a t es e r i e s a n ds e v e r a ld e t a i ls e r i e s n er e s u l to fs i n g l eb r a n c hr e c o n s t r u c t i o no fe a c hd e c o m p o s e ds e r i e s i sm o r eu n i t a r yt h a nt h eo r i g i n a ls e r i e si nf f e q u e n c y ,a n di tc a nb eb u i l tt r a f f i cm o d e lw i t h l s s v m t h eb a y e s i a ne v i d e n c ef r a m e w o r ki sa p p l i e dt ol s - s v mi no r d e rt od e t e r m i n et h e r e g u l a r i z a t i o np a r a m e t e r sa n dk e r n e lp a r a m e t e r se f f e c t i v e l y f i n a l l y , c o m p a r e st h es p e e da n dp r e c i s i o nb e t w e e nt h et h r e em o d e l si n t h ec a s eo f o n e s t e pa n dm u l t i s t e pn e t w o r k t r a f f i cp r e d i c t i o n k e y w o r d s :n e t w o r kt r a f f i cp r e d i c t i o n , n e u r a ln e t w o r k ,l s - s v m ,p s o ,q p s o , b a y e s i a nf r a m e w o r k , w a v e l e tt r a n s f o r m 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取 得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文 中不包含其他人已经发表或撰写过的研究成果,也不包含本人为获得江南 大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志 对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 签 名:j 虹日黝啪蛆 关于论文使用授权的说明 本学位论文作者完全了解江南大学有关保留、使用学位论文的规定: 江南大学有权保留并向国家有关部门或机构送交论文的复印件和磁盎,允 许论文被查阅和借阅,可以将学位论文的全部或部分内容编入有关数据库 进行检索,可以采用影毋,缩印或扫描等复削手段保存、汇编学位论文, 并且本人电子文档的内容和纸质论文的内容相一致。 保密的学位论文在解密后也遵守此规定。 签 名:曼鲎红导师签名:弛! 塑。 日期型触 第一章绪论 第一章绪论 1 1 课题的背景和意义 i n t e m e t 庞大的规模、异质而复杂的体系结构和丰富的动态特性,使得对其进行理 论分析成为一件相当艰巨的任务。但是为了保证和提高现有网络的服务质量、推动互联 网络和信息基础结构的健康发展、研究和开发下一代的网络体系结构都需要对现代互联 网络的行为特征和性能表现有深刻的认识和理解。流量工程对于大规模网络容量规划、 网络设备设计、网络资源管理及用户行为调节等都有积极意义。通过对网络流量的测量 与预测,可以了解网络之间的流量情况及趋势,从而更有效地进行网络优化,更好地进 行路由设计和负载均衡的设计;通过对网络流量的测量与预测,可以决定网络拥塞控制, 这样就可以降低因网络拥塞带来的信息丢失和延迟,充分利用网络资源,提高服务质量; 通过网络流量的预测与分析,使提前告警成为可能。流量预测技术,是指根据所检测到 的历史数据,通过建立适当的流量模型,对将来的流量数据进行预测。由预测的结果, 可以得到将来流量的大致趋势,如果给定一个阈值,当预测的结果超出给定阈值时,就 发出预警,从而网络管理人员可以事先查看网络状态,可以发现潜在的攻击和入侵行为, 实现网络入侵检测。 在网络流量预测中,流量模型起着非常重要的作用,准确的流量模型能捕获实际网 络流量的统计特征,一个模型如果不能捕获实际网络流量的统计特征,将引起较差的网 络性能,因为它们要么过高估计网络性能,要么低估了网络性能。流量模型必须有可管 理的参数个数,参数估计尽量简单。建立恰当的流量模型不是一件容易的事情,建立什 么样的模型,这个问题仍然是在研究的课题。流量分析模型都是在随着对流量特性的逐 步认识的基础上不断完善的。随着网络的普及以及新的应用例如v o i p 的出现,网络的突 发业务流量急剧增加,使得基于传统的流量特征不再适合于当前网络流量的分析。早在 1 9 9 4 年w i l s o n 和l e l a n d 等人就发现传统的泊松模型已经不能用来描述现代数据网的流 量y 1 1 , 2 】,随后,学者们纷纷投入到网络流量的研究之中。 网络流量的研究主要涉及两大方面【3 l :网络流量建模和流量的分析与预测。网络流 量建模指的是建立一种网络流量模型,同时使用一些数学形式来描述这种模式下网络所 产生的流量特性。虽然研究人员已经提出了各种不同的流量模型,希望能够更好地理解 网络业务的性能和规律,但目前的自相似流量模型都存在着这样或那样的缺点,要么生 成的流量不符合实际要求,要么过分复杂,在生成长时间流量时在计算上不可行。一个 理想的网络流量模型应该具有以下几个方面的要求:( 1 ) 能够准确地刻画与网络流量相关 的统计特性;( 2 ) 在计算上是高效可行的;( 3 ) 可以应用在与网络设计相关的分析过程中。 所以,我们还需要努力,建立一个更符合实际网络特性、更高效的网络流量模型。 1 2 网络流量预测的国内外研究现状 近些年来,众多学者致力于网络流量预测,许多新的模型不断被提出,许多新的预 江南大学硕士学位论文 测方法不断被应用。网络流量预测方法主要有回归模型、时间序列模型、灰色预测法、 神经网络、模糊理论、基于均值法、基于中间值法、小波理论、统计学习理论方法等1 4 】。 邹柏贤等人根据格拉布斯准则与实际采集的非单播包数的观测值序列,建立该流量 参数的正常行为,然后平稳化该序列,估计出网络流量的a r m a ( 2 ,1 ) 模型,用线性最小 均方误差预测方法,对网络流量进行预测,并检测在将来超越阈值的可能性和发生时间。 这样,在网络过载发生之前,可以预先采取防范措施,来保证网络的正常服务。这种方 法改变了以往的网络管理响应方式,使得网络过载的预警成为可能,对网络流量进行很 好的早期预测【5 】。薛可等人在分析研究网络流量实测数据的基础上,建立了网络流量预 测的模型,给出了不同预测步数条件下的流量预测数据,并和流量实测值进行了对比实 验,结果表明,该模型在预测步数较小的情况下,预测误差在5 左右【6 】。基于长相关 特性的时间序列分析方法,采用模型对网络自相似业务进行研究,利用“后项预报”技 术对序列进行分形反滤波,在模型辩识、参数估计中利用粗、精估计结合的方法建立模 型。选择伯克力实验室的经典实测数据,利用f a r i m a 模型进行值估计、分数差分定 阶及消除长相关性的操作,实验证明了该模型的有效性 r l 。y o s h i y a s h u 等人对东京大学 网络2 的路由器f d d i 接口的流量采用不同的时间尺度进行仿真,比较分析了a r i m a 与f a r i m a 模型在不同情况下应用的优缺点,当尺度分辨率高于6 0 秒时,a r i m a 模 型比f a r i m a 模型更优越峭j 。 由于网络流量数据是随时间变化的数据,因此我们可以把网络流量数据看成是一个 时间序列,用时间序列的方法对流量数据进行建模。时间序列有平稳时间序列和非平稳 时间序列。学者们利用时间序列模型有效的预测网络流量 9 a 0 1 。何建提出一种基于时间 序列的方法来进行网络流量预测,使得一个具有成长性,非平稳性的大尺度网络流量数 据序列,经过取自然对数,提出趋势项后得到一个短时间相关信号序列,而人们对于短 时间相关序列的研究是非常成熟和完善的,因此通过该方法可以得到较为精确的宏观网 络流量的预测模型i l 。 大量研究发现,网络流量的某些特性已远远超出了传统队列论中泊松和马尔可夫流 量模型的框架1 1 2 1 ,用线性方法来预测非线性的网络流量在理论上就存在不足,它的预测精 度不高。科研人员早已证明具有非线性结构的神经网络系统可以逼近任意的非线性函数 【1 3 1 。由于神经网络具有自学习能力,它可以只通过输入输出数据构建出非线性模型,因 而被广泛用于计算机网络的流量控制和流量预测【1 4 _ 引。目前b p 网络是应用最广泛和成 功神经网络之一,它结构简单,可塑性强。然而b p 网络却存在着易陷入局部极小和收 敛速度慢等缺陷。进化算法具有较强的全局收敛能力和较强的鲁棒性,且不需要借助问 题的特征信息,如导数等梯度信息。因此,将其应用于神经网络学习算法,不仅能发挥 神经网络的泛化映射能力,而且能够提高神经网络的收敛速度及学习能力。z h a o x i a w a n g 等人根据神经网络的自学习能力和模糊逻辑的动态性和及时性等特点,将模糊逻 辑和神经网络有机的结合起来,利用一个具有五层结构的模糊神经网络( f n n ) 作为模 型进行网络流量预测,仿真结果表明,f n n 能够很好的预测复杂网络业务,比单独的神 经网络模型具有更快的收敛速度和更好的预测性能,这为复杂网络网络业务流量的预测 2 第一章绪论 研究提供了一种有效途径【l9 1 。小波神经网络是结合小波变换良好的时频局域化性质与传 统神经网络的自学习功能而形成的 2 0 , 2 1 】,雷霆等人结合小波变换和人工神经网络的优 势,建立一种网络流量预测的小波神经网络模型。首先对流量时间序列进行小波分解, 得到小波变换尺度系数序列和小波系数序列,以系数序列和原来的流量时间序列分别作 为模型的输入和输出构造人工神经网络并加以训练。用实际网络流量对该模型进行验 证,结果表明,该模型具有较高的预测效果【2 2 1 。刘渊等人采用小波分析理论作为逼近工 具,由小波函数构造神经网络具有良好的逼近能力,介绍了小波神经网络的基本构造和 学习方法并将小波神经网络混沌时间序列预测方法引入网络流量预测中,实验表明,与 r b f 神经预测方法相比,小波神经网络预测方法的逼近效果更好,误差更小【2 3 1 。w e ng u o 等人利用粒子群算法的全局搜索策略代替传统b p 网络的训练方法即梯度下降法。将b p 网络的参数包括权值和阈值列为粒子的位置向量,将均方误差能量函数式作为用于优化 的目标函数,通过粒子群算法进行迭代,寻求最优解。将这个模型用于网络流量的预测, 实验结果表明,该模型具有更快的收敛速度和更高的预测精度 2 4 1 。 神经网络基于经验风险最小化原则,存在一些固有缺陷,如训练过程中存在局部 极小、结构和类型的选择过分依赖于经验、存在过学习现象、收敛速度比较慢、网络节 点数难于确定等,在一定程度上限制了其发展。v a p n i k 等人根据统计学习理论提出了支 持向量机( s v m ) 学习方法1 2 5 1 ,s v m 基于结构风险最小化原则,解决了神经网络的一些缺 陷,且在训练样本较少的情况具有很好的泛化能力。s u y k e n sj a k 提出最d , - - 乘支持 向量机方法( l e a s ts q u a r e s s u p p o r tv e c t o rm a c h i n e s ,l s s v m ) 【2 6 】,这种方法采用最小二 乘线性系统作为损失函数,求解过程变成了解一组等式方程,求解速度相对加快,具有 较好的泛化能力,不存在局部极小点和维数灾难等问题。杨光等人提出了基于小波核最 d x - 乘支持向量机的网络流量预测方法。利用小波核函数的多分辨率特性提高了支持向 量机的非线性建模能力,通过对实测网络流量数据的学习,对未来网络流量预测。实验 结果表明,取得了较好的预测效果【z 7 1 。 1 3 本文的研究工作 为了满足目前日益膨胀的互联网通信的要求,必须要对当前的高速带宽网络进行有 效管理。网络流量预测模型的建立是网络管理的基础工作之一,一个准确度高的预测模 型不但可以准确地提供将来的流量数据,而且可以应用于拥塞控制,接入控制和网络带 宽的分配等许多方面。 本文主要围绕神经网络和支持向量机两种均具备自学习能力的智能算法用于网路 流量预测展开研究。着重于以下几个方面的研究: ( 1 ) 研究并改进了以b p 小波网络作为模型的网络流量预测。小波神经网络是小波分 析理论与神经网络理论相结合的产物,从网络形式上来看是将小波分解与前馈神经网络 相融合,常规单隐层神经网络隐节点的s i g m o i d 函数由小波函数代替,相应的输入层到 隐层权值及隐层的阈值分别由小波函数的尺度因子和平移因子代替。由于小波网络参变 量多,比小波分解具有更多的自由度和更强的逼近能力,适当选取网络参数和算法就可 江南大学硕士学位论文 以达到较好的逼近能力。利用小波神经网络进行时间序列预测,可以有效避免普通神经 网络预测模型中需人为给定网络结构这一理论上不严密的缺陷,通过伸缩和平移因子构 成标准正交基生成小波级数,使小波神经网络达到最佳的模型逼近效果,从而达到最优 拟合,有效的提高了预测精度。然而,小波网络常采用梯度下降法训练网络参数,但梯 度下降法具有收敛速度慢、易陷入局部极小值的缺点。本文使用一种学习速率自适应的 算法对b p 小波神经网络进行改进,加快了收敛速度,从而提高了该预测模型的预测速 度,该方法简单实用,并且具有普适性。 ( 2 ) 研究并改进了利用量子粒子群优化( q p s o ) 算法训练b p 神网络作为预测模型 的网络流量预测。因为采用梯度下降法训练b p 网络常会使网络陷入局部极小,降低网 络的性能,因此,我们采用q p s o 算法来训练b p 网络。将网络的权值和阈值编码成粒 子群的位置向量,每个粒子代表网络的一组权值和阈值。将误差函数作为改进的q p s o 算法的适应度函数,搜索到的使适应度函数值最小的一组粒子向量就是网络的一组最优 参数。q p s o 算法的速度一位移搜索模型操作简单,计算复杂度低,并通过惯性权重协 调全局搜索与局部搜索,既能以较大的概率保证最优解,克服b p 算法局部最优的缺陷, 又可提高局部区域的收敛速度。然而q p s o 虽然能够保证算法的全局收敛性,并且算法 中用来控制算法收敛速度的唯一参数易于控制,但是在收敛的情况下,由于所有的粒子 都向最优解的方向飞去,导致粒子不可避免地趋向同一化( 多样性损失) ,使得后期收 敛速度明显变慢,同时算法收敛到一定精度时,无法继续优化,进而陷入局部最优解, 这是群体智能算法包括p s o 算法所固有的缺点。本文在研究了一种新的参数自适应的 方法改进q p s o 算法,并将改进后的q p s o 算法作为b p 网络的训练算法用于网络流量 预测。 ( 3 ) 研究并改进了融合小波变换与最d - - 乘支持向量机( l s s v m ) 作为预测模型的 网络流量预测。神经网络基于经验风险最小化原则,作为一种通用函数逼近器,能以任 意精度近似任意非线性函数和动态系统,是高度非线性对象建模的有力工具。但该方法 的固有缺陷在一定程度上限制其发展。支持向量机( s v m ) 基于结构风险最小化原则, 解决了神经网络的一些缺陷,且在训练样本较少的情况具有较好的泛化能力,因此目前 广泛应用于解决分类和回归问题。标准s v m 算法将一个实际问题转化为一个带不等式 约束的二次凸规划问题。求解凸二次规划所得的解是唯一的最优解,但当数据量较大时, 求解过程所需计算资源很大。l s s v m 是s v m 的一种演变,将s v m 算法中的不等式约 束改为等式约束,且将误差平方和损失函数作为训练集的经验损失,从而将问题转化为 一个线形矩阵求解问题。小波变换具有多分辨率,即多尺度的特点,可以由粗到精的逐 步观察信号。小波变换是处理非平稳时间序列的有效方法之一,因此首先将原始流量数 据时间序列进行小波分解,并将分解得到的近似部分和各细节部分分别单支重构到原级 别上,对各个重构后的序列分别用最小二乘支持向量机进行预测。然而,无论是s v m , 还是l s s v m ,都对核函数参数,正规化参数比较敏感。近来,由于贝叶斯方法具备的逻 辑一致性以及简单灵活的特点,已经被应用于s v m 和l s s v m 的参数优化。本文在现 有网络流量预测研究以及对l s s v m 的研究基础上,提出一种新的网络流量预测模型, 4 第一章绪论 即融合小波变换与贝叶斯l s s v m 的网络流量预测模型。 1 4 论文的组织结构 论文共分七章,各章的主要内容安排如下: 第一章是绪论,共分4 节。第l 节介绍本课题的背景、意义;第2 节详细介绍了国 内外研究状况;第3 节对本文的主要研究内容作了一个综合阐述,第4 节说明了本文的 结构安排。 第二章是网络流量的特性及模型研究,共分2 节。第1 节介绍了真实的网络流量所 表现出的几个重要特性;第2 节分析并比较了网络流量基于自相似特性的主要预测方法 及模型的优缺点。这一章为本文的建模研究工作奠定了理论基础。 第三章是基于改进b p 小波网络的网络流量预测研究,共分3 节。第1 节详细介绍 了b p 算法的原理、小波分析、小波神经网络的算法和结构及其所面临的挑战;第2 节 是对小波神经网络算法的改进研究;第3 节详细介绍了利用构建的模型对实际网络流量 所进行的预测仿真实验。 第四章是基于改进的q p s o 训练b p 网络的网络流量预测研究,共分5 节。第l 节 详细介绍了粒子群算法的基本原理;第2 节介绍量子粒子群算法的原理及其优缺点;第 3 节是对量子粒子群算法的改进研究;第4 节阐述如何利用改进后的量子粒子群算法来 改进b p 神经网络;第5 节详细介绍了利用构建的模型对实际网络流量所进行的预测仿 真实验。 第五章是融合小波变换与贝叶斯l s s v m 的网络流量预测研究,共分4 节。第1 节 介绍了小波分析及其单支重构的原理:第2 节介绍了用于回归估计的最小二乘支持向量 机的算法原理;第3 节介绍贝叶斯框架对最d x - 乘支持向量机参数的推导过程;第4 节 详细介绍了利用构建的模型对实际网络流量所进行的预测仿真实验。 第六章是三种预测模型的测性比较,共分2 节。第1 节对笔者所构建的三种预测模 型进行回顾和总结,并说明了比较方法;第2 节详细介绍了三种预测模型的对比实验。 第七章对全文的研究工作进行总结,对未来的研究工作进行展望。 江南大学硕士学位论文 第二章网络流量的特性及模型研究 2 1 网络流量的特性 网络流量行为的刻画对于实现数据可靠传输,合理分配网络资源具有重要的指导意 义。流量预测是根据流量过去的历史资料,建立恰当的数学模型对未来的流量进行预测。 所以,了解流量的特性对掌握流量预测本质,提高流量预测精度有重要意义。随着计算 机网络规模的扩展和业务种类的不断增长,网络流量时间序列已经成为一个非线性、多 时间尺度变化的动力系统。在真实环境中的网络流量呈现出相当明显的多尺度特性,如 自相似性、长相关性、多重分形性、突发性等特性。 2 1 1 自相似特性 ( 1 ) 自相似性的概念 网络流量在数学上可表征为一个随机过程,它所蕴涵的自相似性是统计意义上的。 自相似性反映了网络流量在各个不同的时间标度上的结构相似性,表现为突发没有明确 的长度,即突发性在广泛的时间标度上都存在,而且呈现丛集的特点。 自相似过程的定义如下: 自相似性( s e l f - s i m i l a r i t y ) 是指一个随机过程在各个时间规模上具有相同的统计特 性。网络通信中的自相似性表现为在较长一段时间里,单位时间内分组数的统计特性不 断随时间规模的变化而变化。自相似性的另一个重要特性是长相关性,主要表现在随机 过程的二阶统计特性上。 下面给出其统计描述【2 8 】 设x = x j ,j = l 一2 ) 为一协方差平稳的随机序列,即x 具有恒定均值t = 研x f 】,和 有限方差盯2 = e k x i 一) 2 j ,其自相关函数,( 七) = e 【( x f 一) ( x m 一) 】盯2 ,( 七= o ,1 2 。) 仅 与k 有关。假设x 的自相关函数具有如下形式: ,( 七) 一k p l l ( 七) ,k 0 0 其中o f l o ,有l i m 粤粤:l 今l ,( 历) 一 吖“k 一垡岛凹丛型型,( 七:1 ,2 3 。) 为x 的m 阶平滑过程,并记时间序列 x ( m ) = ( x f 川,x ,) 的自相关函数为,( 舢,m = l ,2 3 一 定义2 1 过程x 被称为严格二阶自相似的且具有自相似系数日= l 一旦2 ,如果其历阶 平滑过程x ( 历) 具有与原过程x 同样的相关函数,即,( 肘( 七) = ,( 七) 对所有 ( 所= l 2 ,k = 1 , 2 ,) 成立。 定义2 2 过程x 被称为是渐进二阶自相似性的,且具有自相似系数h = l 一譬,如果 6 第二章网络流量的特性及模型研究 ,( 1 ) 一2 1 - p l ,m 一( 后= 2 ,3 ,) 式中艿2 ( 厂) 表示作用在上的二次差分算子,即 万2 ( 七”= ( 七+ 1 ) 一2 f ( k ) + f ( k - 1 ) 严格( 或渐近) 自相似过程最显著的特点是它的m 阶平滑过程x ( 埘) 在m 寸o o 时相关 函数结构上是非退化的,这一点与传统的p o s s i o n ,m a r k o v 等短相关过程自相关函数的指 数衰减,即当班专时,( 嘲( 竞) o ( 即x ( 席) 趋于白噪) 完全不同 2 9 1 。 ( 2 ) 自相似过程的参数估计方法 自相似模型的重要参数h u r s t 参数是以水文学家h e h u r s t 的名字命名的。他通过对 尼罗河及其它河流水位的多年研究,发现尼罗河水位在8 0 0 年的历史中符合自相似模型。 其它河流,如莱茵河的水位起伏则要相对稳定一些。 现代网络通信中大量事实表明,网络通信量具有自相似性【1 1 。若时间序列 工= 以,七= 1 2 。) 及其聚合过程x ( 历) 方差满足v a r x ( 埘】_ 黑;自相似函数满足: m 、 l i mr ( k ,x ( 所) r ( k ,z ) 。则称x 为自相似过程。式中h 称为h u r s t 参数,表征自相似 打卜- 性的程度,若0 5 s 日1 ,表示x 具有一定程度的自相似性,日值越大,自相似性越强。 若0 h s 0 5 ,则x 缺乏或不具有自相似性。因此,正确和快速的对h u r s t 参数进行测 量对于研究网络的自相似特性及其变化具有非常重要的意义。 ( 3 ) 自相似性对网络性能的影响 自相似性对网络性能有着十分重要的影响,网络流量的自相似特性对于传输过程中 的丢包率、信道利用率以及接纳控制会产生严重的影响,很多分析研究显示了自相似性 存在的长期相关性引起网络性能的下降,原因在于网络流量的自相似性特征随着丢失率 增加而增加。当连接数增加时,若丢失率固定,其自相似参数也在增加。当多个流通过 瓶颈链路时,会有较高的突发性。当链路延迟增加时,自相似程度也在增加。当超时重 传值减小时,自相似程度也相应减少。所以它需要较常规队列分析更大的缓冲区,增加 队列延迟、丢包率,因此降低了网络的性能【3 0 】。 流量合成是网络基本的作用,通过流量合成,网络可以更加有效地利用交换机、路 由器等共享资源。研究发现当多个自相似过程聚合时,合成过程仍具有自相似性,其自 相似参数与独立输入源过程中自相似参数最大值相近。该结果表明,自相似网络流的突 发性不能通过合成而平滑掉,而在网络的交换和交叉节点,输入网络流都是具有较高突 发性的合成网络流,其自相似性对网络性能具有极其重要的作用,因此在网络设计、控 制和管理时,必须深入地分析和研究自相似性所带来的影响。 2 1 2 长相关特性 长相关性是统计特性,近年来在通信领域中倍受关注。如果一个时间序列在所有的 时间尺度上都是相关联的,则说明它具有长相关性【3 1 1 。 从数学角度,一个自相似过程可以用多种方法来描述,或者说具有多重特性: 7 江南大学硕士学位论文 ( 1 ) 慢衰减方差特性:取样平均的方差随取样窗口m 的增大,其递减速率慢于取样 窗口的倒数,即v a r x ( m ) m ,m 寸,0 o o ; k = l ( 3 ) l f - n o i s e 特性:谱密度在原点符合幂律分布,即 厂( 兄) 扩7 ,力寸0 , 0 7 l ,且y = l 一。 其中长相关性是最为重要的一个特性,长相关用来反映自相似过程的持续现象。对 一个平稳离散时间序列x ,如果它的自相关函数p ( k ) 下降得很慢,即 以七) 1 k r 口,k 专o o ,0 a 1 ,它就是长相关的。反之,如果自相似函数p ( k ) 下降得较快( 至 少呈指数下降) ,则称之为短相关。 具有l r d 性质的过程,其自相关系数按照双曲线函数衰减,即: 当l 七卜,0 l 时,有从七) 叫k i - p ,而对于s r d ,有:p ( 七) f z - l k l 。其中,当i 七卜, 且0 口 0 ,0 日 l 。当片= 1 2 时,f b m 即为一般布朗运动。 分形布朗运动是一个均值为零的连续高斯过程,其增量过程是分形高斯噪声f g n 过程,其自相关函数为: 成( 七) = 1 2 ( ik + l1 2 日- 2ikj 2 日+ i 七一l1 2 ) ,k 1( 2 5 ) f b m 和f g n 都是严格的自相似随机过程。 f b m 模型能够描述网络业务流的自相似特性,只需要平均速率m ,方差a 和h u r s t 参数三个参数就可以完整的刻画整个模型,在数学上有坚实的理论基础且比较好处理, 因而可以很方便的应用于流量的实时仿真和特性分析。 f b m 模型分析网络流量时也存在一些不足:由于f b m 是严格自相似的过程,模型 的参数较少使得其描述能力有限,可以用来对长相关数据进行建模,但无法描述业务的 短相关特性,从而不能对既有长相关特性又有短相关特性的流量准确建模;而且,f b m 模型带有高斯性,对于非负的信号( 即非高斯的信号) ,也不能很好地分析。因此,f b m 仅适用于局域网内实时建模的仿真和性能分析,而不能完整地描述流量实际情况。 2 2 3 分形自回归求和滑动平均模型( f a r i m a ) 由于真实业务数据可能具有不同的相关结构,人f f j 0 1 入了基于f a m m a ( p ,d ,q ) 过程 的业务生成方法,其中,p , q 为非负数,d 为实数。f a r j m a ( p ,d ,q ) 是a r j m a ( p ,d ,q ) 的一 个扩展形式,具有如下定义: o ( b ) a 4 五= 秒( b ) q ( 2 6 ) 对实数d ( o

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论