(计算机软件与理论专业论文)基于智能算法的网络流量预测技术研究.pdf_第1页
(计算机软件与理论专业论文)基于智能算法的网络流量预测技术研究.pdf_第2页
(计算机软件与理论专业论文)基于智能算法的网络流量预测技术研究.pdf_第3页
(计算机软件与理论专业论文)基于智能算法的网络流量预测技术研究.pdf_第4页
(计算机软件与理论专业论文)基于智能算法的网络流量预测技术研究.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(计算机软件与理论专业论文)基于智能算法的网络流量预测技术研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着i n t e m e t 的迅猛发展和更多的计算机联入i n t e m e t ,互联网环境日趋复杂。为了 实现资源共享的最终目标,网络传输数据量日益扩增,随之而带来的问题、故障层出不 穷,给网络管理工作带来了沉重的负担。因此深入理解网络的行为特性和控制机制显得 尤为重要。通过对网络流量的预测,了解网络之间的流量情况,以至对网络流量进行比 较精确的分析和预测,十分有利于网络的设计和控制;通过设置路由功能,设计负载均 衡,可以尽可能使拥塞带来的信息延迟和损耗程度降之最低;而且可以对网络进行入侵 检测,发掘和排斥隐藏的攻击入侵行为。因此网络流量预测的可行性和必要性显得尤为 重要,特别是高质量的预测对于管理和设计大规模网络环境意义重大。 本文研究的宗旨是为了提高网络流量的预i 贝! f 精度和稳定性,作者的工作是探索出新 的网络预测模型。 第一,全面叙述了网络流量预测的背景、意义以及研究现状,为后续的研究工作奠 定了基础; 第二,分析了网络流量的重要特性,包括自相似性、长相关性、多重分形特性等, 这对掌握流量预测本质,对提高预测的精度有着重要的意义。 第三,在理解网络流量特性的基础上,分析了几种传统的网络流量模型,这对于用 智能算法构造流量预测模型有着重要的指导意义; 第四,建立了基于小波包消噪和e l m a n 网络的网络流量预测模型。针对传统e l m a n 网络预测精度低,结合小波包消噪和e l m a n 神经网络的优势,先将原始流量序列进行小 波包消噪,将消噪后的序列作为e l m a n 神经网络的输入,待预测序列作为输出。通过消 噪后的前n 天的流量序列,预测出后m 天流量序列。 第五,提出一种新的网络流量预测模型,基于小波分析和a r - l s s v m 理论,首先 通过小波分析的方法对原始序列进行小波分解,再进行单支重构操作,利用最小二乘支 持向量机和自回归模型分别预测,最后再一次进行重构操作,最终实现原始序列的预测 结果,提高了网络流量的预测精度以及稳定性。 第六,建立了基于q p s o 优化b p 的网络流量预测模型。针对p s o 算法的缺点,采 用q p s o 算法对b p 神经网络的权值和阈值进行优化,并利用历史记录训练b p 网络。 关键词:网络流量预测,小波包消噪,小波分析,神经网络,最小二乘支持向量机, 粒子群算法,量子粒子群算法,小波变换 一了一 ; a b s t r a c t w i t ht h er a p i dd e v e l o p m e n ta n dm o r ec o m p u t e r sl i n k e di n t ot h ei n t e m e tn e t w o r k , t h e s c a l eo fi n t e m e ti sb e c o m i n gm o r ec o m p l i c a t e d , i no r d e rt or e a l i z et h eg o a lo fr e s o u r c es h a r e , t h ea m o u n to ft h en e t w o r kw a f f l ei si n c r e a s i n g ,t h et a s ka n ds t r e s so fn e t w o r km a n a g e m e n t b e c o m e sh e a v i l y a n df a i l u r e sa n dq u e s t i o n sa p p e a ra g a i na n da g a i n , i ti sv e r yi m p o r t a n tt o c o m p r e h e n dt h ec o n t r o lm e c h a n i s ma n dc o m p l i c a t e db e h a v i o r a lc h a r a c t e r i th a si m p o r t a n t s i g n i f i c a n c et h r o u g ha n a l y s i sa n dp r e d i c t i o n s :i tc o n t r i b u t e st ou n d e r s t a n ds i t u a t i o n , s ot h e n e t w o r kt r a 伍cc a nb ea c c u r a t e l yp r e d i c t e da n ds i m u l a t e d i t su s e f u lf o rd e s i g n i n ga n d c o n t r o l l i n g i tc a nb em o l ee f f e c t i v ef o ro p t i m i z a t i o n , a n db eb e t t e rf o rr o u t i n gd e s i g na n d l o a d b a l a n c e dd e s i g n i tc o u l dd e t e r m i n et h en e t w o r kc o n g e s t i o nc o n t r 0 1 w h i c hc a nr e d u c e n e t w o r kc o n g e s t i o nd u et ot h el o s sa n dd e l a yo fi n f o r m a t i o n i tc a nm a k ef u l lu s eo fn e t w o r k r e s o u r c e st oi m p r o v es e r v i c eq u a l i t y i tm a yr e a l i z ei n t r u s i o nd e t e c t i o n , d e t e c ta n de x c l u e p o t e n t i a la t t a c k sa n di n t r u s i o n s n e t w o r kt r a 伍cp r e d i c t i o ni sn e c e s s a r y ,h i g hq u a l i t yt r a f f i c p r e d i c t i o nh a ss i g n i f i c a n tm e a n i n g sf o rl a r g es c a l en e t w o r km a n a g e m e n ta n dd e s i g n p u r p o s eo ft h es t u d yi st oi m p r o v et h ef o r e c a s ta c c u r a c ya n ds t a b i l i t yo fn e t w o r kt r a f f i c , t h em a i nw o r ki st or e s e a r c ha n de x p l o r en e wn e t w o r k p r e d i c t i o nm o d e l s f i r s t l y , i nt h ep a p e rb a c k g r o u n d , s i g n i f i c a n c ea n dr e s e a r c hs t a t u sa b o u tn e t w o r kt r a f f i c p r e d i c t i o na r ec o m p r e h e n s i v e l yn a r r a t e d ,t om a k ef o u n d a t i o nf o r t h ef o l l o w i n gr e s e a r c h e s s e c o n d l y , t h ep a p e ra n a l y z e ss o m ei m p o r t a n tc h a r a c t e r s ,i n c l u d i n gs e l f - s i m i l a r i t y , l o n g - r a n g ed e p e n d e n c e ,m u l t i f a r i o u sc h a r a c t e r i s t i c s i t si m p o r t a n tf o rm a s t e r i n gt r a 伍c p r e d i c t i o ne s s e n c ea n di m p r o v i n gt r a f f i ca c c u r a c y t h i r d l y ,b a s e do nu n d e r s t a n d i n gt h ec h a r a c t e r i s t i c sa b o u tn e t w o r kt r a 伍c , s e v e r a l t r a d i t i o n a ln e t w o r kt r a f f i cm o d e l sa r ea n a l y z e d ,w h i c hh a ss i g n i f i c a n tg u i d em e a n i n g sf o r m a k i n gu s eo fi n t e l l i g e n ta l g o r i t h m sf o rt r a f f i cp r e d i c t i o nm o d e lc o n s t r u c t i o n f o u r t h l y , am o d e lb a s e do nw a v e l e tp a c k e td e n o i s i n ga n de l m a ni sf o u n d d e - n o i s i n gt h e 1 x a f 矗cs e r i e sw i t hw a v e l e tp a c k e t , t h e n t a k i n gt h ed e - n o i s e ds e r i e sa st h ei n p u to fe l m a nw h i l e t h ep r e d i c t i v es e r i e sa st h eo u t p u to fe l m a n b yu s i n gt h en d a y s d e - n o i s e dt r a f f i cs e r i e st o f o r e c a s tt h e l a t e rm ( 埘s p r e d i c t i v es e r i e s n l en d a y s d e - n o i s e ds e r i e si st o k e na sas l i d i n g w i n d o wa n dm a p p e di n t ot h el a t e rm d a y s p r e d i c t i v es e r i e s f i f t h l y ;am o d eb a s e do nw a v e l e ta n a l y s i sa n da r - l s s v mi se s t a b l i s h e d f i r s t l y , t h e s e r i e sa r ed e c o m p o s e d , g e r i n gal o wf r e q u e n c ys i g n a la n ds e v e r a lh i g hf r e q u e n c ys i g n a l s ,t h e a p p r o x i m a t i o np a r ta n dd e t a i lp a r t sw e r er e c o n s t r u c t e dt ot h eo r i 西砌l e v e l ,t h en e x ts e q u e n c e o f e a c hw e r ep r e d i c t e du s i n gl e a s ts q u a r e ss u p p o r tv e c t o rm a c h i n e sa n ds e l f - r e g r e s s i o nm o d e l , t h ef i n a l ,w i t ht h ev a r i o u sr e c o n s t r u c t e ds e q u e n c e ,g e t t i n gt h ep r e d i c t i o ns e q u e n c eo fo r i g i n a l s e q u e n c e ,i m p r o v i n gt h ef o r e c a s ta c c u r a c ya n ds t a b i l i t yo fn e t w o r kt r a f f i c s i x t h l y , am o d eb a s e do nb p n no p t i m i z e db yq p s oa l g o r i t h mi se s t a b l i s h e d i t c o n s i d e r st h ef l a wo fp s oa l g o r i t h m q p s oa l g o r i t h mi sa p p l i e dt oo p t i m i z et h ew e i g h t sa n d t h r e s h o l d si nb pn e u r a ln e t w o r k ,a n dh i s t o r i c a lr e c o r d sa r eu s e dt ot r a i nb pn e u r a ln e t w o r k k e y w o r d s :n e t w o r kt r a f f i cp r e d i c t i o n , w a v e l e tp a c k e td e n o i s i n g ,w a v e l e ta n a l y s i s , n e u r a ln e t w o r k ,l s - s v m ,p s o ,q p s o ,w a v e l e tt r a n s f o r l n n 目录 目录 摘要i a b s t r a c t 】 】: 第一章绪论1 1 1 研究背景及意义l 1 2 网络流量预测的研究现状2 1 3 本文的主要研究工作4 1 4 论文的组织结构5 第二章网络流量的特性7 2 1 自相似特性7 2 2 长相关特性8 2 3 多重分形特性9 本章小结9 第三章传统的网络流量模型1 1 3 1o n o f f 模型1 1 3 2p o i s s o n 模型1 1 3 3a r m a 模型1 2 3 4f b m 模型1 4 本章小结1 4 第四章基于小波包消噪和e l m a n 的网络流量预测研究1 5 4 1 小波包消噪的基本原理和步骤1 5 4 1 1 小波包消噪的基本原理1 5 4 1 2 信号的小波包消噪的基本步骤1 6 4 2 人工神经网络1 6 4 2 1 人工神经网络简介1 6 4 2 2e l m a n 神经网络1 7 4 3 预测方法及其步骤1 8 4 4 仿真实验1 8 本章小结2 1 第五章基于小波分析和a r l s s v m 的网络流量预测研究2 3 5 1 小波分析基本理论2 3 5 1 1 小波概念及几种常用小波,2 3 5 1 2 小波变换分类2 5 5 1 3 多分辨分析2 5 5 1 4 小波分解与其单枝重构2 5 5 2 最小二乘支持向量机2 6 目录 5 3 基于m a l l a t 算法的a r - l s s v m 预测方法2 7 5 4 试验结果与分析2 8 5 4 1 仿真实验2 8 5 4 2 结果分析2 8 本章小结3 2 第六章基于q p s o 训练b p 的网络流量预测研究3 3 6 1b p 神经网络3 3 6 1 1b p 算法原理3 3 6 1 2b p 网络的设计3 5 6 1 3b p 算法限制与不足3 5 6 2 粒子群( p s o ) 算法3 6 6 2 1 算法原理3 6 6 2 2 算法流程3 7 6 2 3 算法参数3 7 6 2 4 参数设置3 8 6 2 5 粒子群算法的缺陷3 9 6 3 量子粒子群( q p s o ) 算法3 9 6 3 1 算法理论3 9 6 3 2 算法描述4 0 6 4 预测方法及步骤4 0 6 5 仿真实验4 1 6 6 结果分析4 2 本章小结4 4 第七章总结与展望4 5 7 1 本文总结4 5 7 2 未来工作展望4 5 致谢4 7 参考文献4 8 附录:作者在攻读硕士学位期间发表的论文5 2 第一章绪论 第一章绪论 1 1 研究背景及意义 目前,当代互联网产业迅猛发展,网民人数急剧增加,有效地助推了整个互联网的 发展。与此同时,在一定程度上也冲击和挑战了网络服务质量。 根据中国互联网络信息中心( c n n i c ) 于2 0 1 0 年7 月1 5 日发布的第2 6 次中国互联 网络发展状况统计报告显示,截至2 0 1 0 年6 月,中国网民规模达到4 2 亿,突破了4 亿关口,较2 0 0 9 年底增加3 6 0 0 万人,较2 0 0 9 年底提高2 9 个百分点;宽带网民规模为 3 6 3 8 1 万,使用电脑上网的群体中宽带普及率已经达到9 8 1 ;i p v 4 地址达到2 5 亿, 半年增幅7 7 ;域名总数下降为1 1 2 1 万,其中c n 域名7 2 5 万。c n 在域名总数中的 占比从8 0 降至6 4 7 。网站数量下降到2 7 9 万,c n 下网站占网站整体的7 3 7 ;人 均一周上网时长达到1 9 8 个小时。如下图1 1 可以清晰的反映出中国网民规模和普及率。 2 1 1 0 5 1 2 2 口0 5 。5 2 0 口1 2 z 口口7 5 2 霉叮7 1 2 2 0 0 8 2 9 口霉l z 2 0 0 5 - 5 2 0 0 $ , i z z 霉l - _ 一咒藏一夏鬏一蕾馒簟 图1 1 中国网民规模和普及率 f i g 1 1t h es c a l eo f c h i n e s ei n t e m e tu s e r sa n dp e n e t r a t i o nr a t e 因为计算机网络的规模如此庞大,所以网络性能也比较容易受到影响,因此可能发 生网络故障的概率也随之增大,与此同时也给网络管理带来了很大的难度,同时也使得 对其进行理论分析成为一项困难而又艰巨的任务,但是为了给广大的用户提供优质的服 务,保证和提高网络的服务质量,推动互联网产业的健康发展,维护工作与管理工作日 益凸显。以前的网络管理行为大多是发生在网络故障产生之后,因此相关管理人员往往 来不及采取比较及时的纠正措施。所以事先预测到可能存在的问题并发出警报显得尤为 重要,这样就方便于网络管理人员采取切实有效的措施,群策群力,集中全力防止故障 的发生,并切实做好网络安全工作。 流量预测技术是指通过采集原有流量数据对未来的流量数据进行预测的过程中建 立适当的流量模型而产生的一种技术,它能够相对精确地预测出将来流量的趋势。以便 于相关管理人员及早查看状态,提前发现攻击行为和入侵行为,在一定程度上避免了故 障的发生。所以要想提前告警必须研究流量预测技术。 流量模型在流量预测过程中起着尤其重要的作用。若一个模型不能比较真实的反映 实际网络流量的重要统计特征,则在估计网络性能方面过低或者过高。那么,在进行网 络流量预测的过程中,准确的流量模型显得特别重要。虽然建立恰当的流量模型非常的 秭弧燃矾懈慨张 一 一 一 一 蚋 。 江南大学硕士学位论文 不容易,但我们要想做好流量预测工作,势必要建立一个适当的网络流量预测模型,因 为它事关捕获比较贴近实际网络流量的统计特征,事关预测的效果。 网络流量的研究主要包括建模和分析与预测这两大方面的工作【l 羽,其中网络流量 建模更为重要。网络流量建模指的是使用一些数学形式来建立一种适当的流量模型,并 描述由此而产生出来的流量特性。虽然流量模型方面的专家和学者从事了大量的研究工 作,但就目前来看,还是有所欠缺,存在这样或那样的问题。要么复杂程度过高,要么 生成的流量与实际情况不相符合,甚至相差甚远,要么在计算方面不可行。一个理想的 网络流量模型应具备如下三个方面的要求:( 1 ) 在计算上是高效可行的;( 2 ) 能够准确地 刻画出与网络流量相关的统计特性;( 3 ) 能够在与网络设计相关的分析过程中得到应用。 因此,面对新形势,面对新情况,我们还需继续努力,集中精力攻破各个难题,为建立 一个更符合实际、更为高效的网络流量预测模型而努力奋斗。 1 2 网络流量预测的研究现状 目前,众多流量预测技术方面的专家学者致力于网络流量预测,进行了大量的科学 研究,取得了一定成效,并提出了许多新的模型。在二十世纪7 0 年代和8 0 年代早期研究 人员在借鉴p s t n 的流量模型的基础上,用传统模型中的经典模型p o i s s o n 模型来刻画数 据网络的流量模型 6 1 :根据格拉布斯准则,邹柏贤等人建立流量参数的正常的网络行为 模式,然后采用方差分析的方法进行平稳化,并成功地估计t 丑a r m a ( 2 ,1 ) 模型,对网络 流量进行预测,给出在将来时间超过阈值的可能性的概率的大小值,并对发生时间进行 检测。这样,网络管理员便能够对网络过载可能性的大小事先做出判断,以至于通过提 前采取行之有效的防范措施或及时使其得到修复的方法,从而使网络处于正常运行的状 态,更好地实现了网络预警功能1 7 】,和提出一种网络流量的预处理方法即采用一种统计 分析的方法对网络流量进行平稳化处理,使得网络流量平稳或更加地接近平稳,从而在 一定程度上消除了网络流量不稳定性对建模造成的影响【s 】,并明确指出使用该平稳方法 可以有效地提高预测准确度;薛可等人在分析研究网络流量实测观测数据的基础之上, 推导并建立t a r m a ( 2 ,1 ) 模型,提出了基于不同预测步数下的流量预测数据,仿真试验 结果表明,该模型在预测步数小于3 的情况下,预测误差会比较小,一般在5 左右1 9 】; 王兆霞等人针对网络管理中的流量控制问题,为了达到预测的目的,将模糊逻辑和n n 有机地结合起来,构造出了符合实际情况的五层模糊神经网络( f n n ) ,并用训练n n 的相 应学习算法,虽i b p 算法来训练网络。仿真试验结果表明,与传统的n n 算法相比较,f n n 不仅在网络自相似业务量方面预测效果佳,且收敛速度也比较快【l o j ;丛锁等人通过对网 络流量特性和尺度特性的研究,提出了基于小波技术的网络流量特性刻画【i ,通过对实 测的流量数据的分析,提出一种基于离散小波变换的网络流量多重分形模型【1 2 1 ,用于分 析网络流量的自相似特征;现如今也有众多的学者把人工神经网络技术成功应用到网络 流量预测中来,取得了一定成效;何建给出了一种方式对网络流量数据进行模拟实验即 基于时间序列,这种方法能够得到较为精确的预测模型【1 3 】:雷霆等人结合小波变换良好 的时频局域化与传统神经网络的自学习优势,建立一种小波神经网络模型来对网络流量 进行预测。先对序列进行小波变换,从而得到两个序列,即小波系数序列和小波变换尺 2 第一覃绪论 度系数序列,构造出人工神经网络模型,并进行训练。结果发现该模型的预测效果比较 理想【1 4 】;孙俊等在取得粒子收敛行为的研究成果之后,从量子力学的角度,提出了一种 以d e l t a 势阱为基础p s o 算法模型。这种模型认为粒子具有量子的行为,从而提出了量 子粒子群算法( q u a n t u m b e h a v e dp a r t i c l es w a r mo p t i m i z a t i o n ) t 1 5 1 ;c r u z 等人根据流量的突 发性特征,建立了完全不同于传统的流量分析方法,即采用非概率统计的方法建立的突 发性约束的流量模型【净1 7 1 。 由于i n t e m e t 的实时性、随机性、动态性和含噪性以及网络行为的不稳定的特点, 网络流量数据序列往往表现出非平稳性,但是传统的模型绝大多数是针对平稳的网络流 量序列,并不太适合非稳定的流量序列。 通信网络中的流量模型可以分为稳定的流量模型和不稳定的流量模型,短相关和长 相关模型均属于稳定的流量模型。其中自回归模型( ,自回归滑动平均模型( a r m a ) , 以及自回归求和滑动平均模型( a r a m a ) 和马尔可夫过程均属于短相关模型。长相关流 量模型包括分形布朗运动模型( f b m ) 和分数差分自回归求和滑动平均模型( f a r j m a ) 。 现如今还没有出现既有短相关特性,又有长相关特性的模型。 大规模网络系统本身就是复杂非线性的,同时又受外界多种因素的干扰,不仅其内 部运行关系难以确定,而且呈现出非平稳动态随机变化特性。时间序列在刻画网络流量 行为的模型过程中起着极为重要的作用。a r 模型、a r m a 模型、马尔可夫模型等传统 的时间序列预测只能处理平稳过程;而a r i m a 模型和a r i m a 季节模型只能用于处理齐 次的非平稳性过程【1 8 1 。在很大程度上,传统模型限制了模型的预测效果1 1 9 1 。智能算法蓬 勃发展,在预测领域表现出较大的优势和潜力。 神经网络是非线性对象建立模型的有力工具,但因为本身所固有的收敛速度慢、隐 层节点数难以确定、过学习现象、训练过程中容易陷入局部极小、训练时需要大量数据 样本和网络结构的选取过分依赖经验等缺陷。v a p i l i k 等人基于结构风险最小化的统计学 - j 理论给出了支持向量机( s 旧学习方法【2 0 】,比较成功地解决了非线性、高维模式识别 和小样本等实际问题,并克服了神经网络学习方法中存在的不足,提高了学习方法的推 广能力,目前广泛应用于解决回归问题。s v m 在解决样本问题时也面临一些问题,比如 二次规划( q p ) 问题,传统的算法在每一步迭代过程中均要进行核函数的矩阵运算,而核 函数的矩阵占有的内存是随着样本数呈平方增长的。因为迭代误差的不断累积,最终将 在算法的精度上得不到保证。s u y k e n sj a k 在v a p n i k 等人提出支持向量机模型之后提 出最小二乘支持向量机方法( l e a s ts q u a r e s s u p p o r tv e c t o rm a c h i n e s ,l s s v m ) j ,该方法 具有良好的预测效果。 到目前为止,对网络流量进行预测的方法主要有两种,一种是基于人工智能理论的 预测方法,另一种是基于时间序列模型的预测方法。这两种方法在本质上都是一致的。 基于时间序列模型的预测方法可以分为以下三种类型圈,长相关流量模型、短相关流量 模型和多重分形流量模型。其中多重分形流量模型是在对广域网汇聚流量进行尺度分析 圆过程中由r i e d i 等人发现的,该流量过程需要用多重分形( m u l t i f r a c t a l ) 进行刻画,并 把小波理论引入到流量建模过程中【2 4 】,其流量模型主要包括层叠模型和基于离散小波 3 江南大学硕士学位论文 变化的多重分形模型( d w w m ) 瞄j 这两种模型。 近些年来,涌现了大量基于神经网络、支持向量机、模糊神经网络等各种人工智能 方法的流量预测模型,并且这些预测方法绝大多数在预测的过程中引进了小波分析理 论。 本文侧重研究基于人工智能方法的模型进行网络流量预测,并对预测结果进行分 析。 1 3 本文的主要研究工作 通过以上介绍,了解到网络流量分析、建模和预测对网络性能评价具有十分重要的 意义。建立符合实际网络流量统计特性的模型,有助于对网络流量进行比较精确的分析 和仿真,也有助于网络的设计和控制。所以本文主要将围绕神经网络和最d x - - 乘支持向 量机两种智能算法应用于网路流量预测技术研究。 本文的研究目标是: ( 1 ) 研究以小波包消噪原理和方法步骤以及e l m a n 网络作为模型的网络流量预测。 小波分析过程中,强烈抑制信号的高频成分,在信号的细节方面,损失严重,它仅仅只 对信号的低频成分细分。但是小波包分析方法,就更为全面,它能够同时进行分解其上 一层的低频信息和高频信息,局部分析能力明显增强。现如今绝大多数研究人员采用的 静态前馈神经网络,它是基于b p 算法的。鉴于网络流量具有动态特征的功能的考虑, e l m a n 网络是一种绝对典型的动态神经元网络,它具备映射动态特征的功能,是通过存 储内部状态实现的,有效地使系统具有适应时变特性的能力。采用e l m a n 神经网络对网 络流量建模是无可厚非的。本文在对神经网络技术研究和对小波包消噪理解的基础上提 出的一种基于小波包消噪和e l m a n 网络的网络流量预测模型,提高了预测能力,且方法 简单,并被普遍使用。 ( 2 ) 研究以小波分析和a r - l s s v m 作为预测模型的网络流量预测。神经网络以其 较好的函数逼近能力和自学习能力较多地应用于时间序列预测,但由于其本身固有的隐 含层节点数难以确定、过学习、收敛速度慢、容易陷入局部极小以及网络结构的选择过 分依赖经验等缺陷,影响和限制了网络的泛化能。s u y k e n sj a k 在深入研究支持向量 机的基础上提出了最小二乘支持向量机方法( 1 e a s ts q u a r e s s u p p o r tv e c t o r m a c h i n e s ,l s s v m ) ,这种方法求解速度快,泛化能力强,局部极小点和维数灾难等一系 列难题已不复存在,如今已有一些研究学者将最d x - - 乘支持向量机用于时间序列预测。 本文提出一种基于小波分析和a r - l s s v m 的非平稳时间序列预测方法,将原始流量数 据归一化后采用二进小波变换提取序列中的低频成分和高频成分,对低频信息和高频信 息分别建模,最后将各模型的预测结果进行叠加,从而得到原始序列的预测值,从而提 高了非平稳的网络流量序列的预测精度。 ( 3 ) 研究以q p s o 算法优化b p 神经网络作为预测模型的网络流量预测。在传统的 p s o 算法中,有限的搜索范围将粒子限制在一个有限的区域。q p s o 算法具有模型简单、 收敛性能更好以及收敛速度更快的优点。所以,本文提出一种基于q p s o 算法优化b p 网络的网络流量预测模型,预测能力好。 4 第一章绪论 1 4 论文的组织结构 本论文共有七章,主要工作安排如下: 第一章是绪论,分为4 节。第1 节对研究课题的背景及意义进行详细介绍;第2 节 对本课题的国内外研究现状简要介绍;第3 节综合阐述了本文的主要研究工作;第4 节 安排了本文的组织结构。 第二章是网络流量的特性,分为3 节。第1 节介绍了自相似性;第2 节介绍了长相 关性;第3 节介绍了多重分形特性。这一章着重分析了网络流量的一些重要特性,为建 立恰当的网络流量模型提供了重要的理论基础,为研究人员在本课题方面的探索和研究 提供了方便。 第三章是传统的网络流量的模型,分为4 节。第1 节介绍了o n o f f 模型;第2 节 介绍了p o i s s o n 模型;第3 节介绍了a r m a 模型;第4 节介绍了f b m 模型。这一章介 绍了几个传统的网络流量预测模型,为以后建立新的预测模型提供了理论基础。 第四章是基于小波包消噪和e l m a n 神经网络的网络流量预测研究,共分4 节。第1 节对小波包消噪的基本原理和步骤进行了比较详尽的阐述;第2 节对人工神经网络进行 介绍,着重介绍了e l m a n 神经网络;第3 节介绍了此模型的预测方法及其步骤:第4 节 详细介绍了利用构建的模型对实际网络流量所进行的预测仿真实验。 第五章是基于小波分析和a r - l s s v m 的网络流量预测研究,共分4 节。第l 节对 小波分析基本理论进行介绍;第2 节对最小二乘支持向量机的算法原理进行详细介绍; 第3 节介绍基于m a u a t 算法的a r - l s s v m 预测方法;第4 节详细介绍了利用构建的模 型对实际网络流量进行的预测进行仿真模拟实验。 第六章是基于q p s o 优化b p 的网络流量预测研究,共分6 节。第l 节介绍了b p 神经网络;第2 节介绍了粒子群算法;第3 节介绍了量子粒子群算法;第4 节介绍了此 模型的预测方法及步骤;第5 节介绍了此方法的仿真实验;第6 节分析了仿真实验的结 果。 第七章是对本文的研究工作进行全面总结,并指出本课题的一些不足和有待完善的 地方,并展望后续的研究工作。 5 江南大学硕士学位论文 6 第二章网络流量的特性 第二章网络流量的特性 2 1 自相似特性 2 0 世纪9 0 年代,自相似特性被比较正式地引入到网络流量特性的描述方面,随后, 网络流量的自相似特性也被网络流量的建模和预测考虑在内,而h u r s t 参数表征了网络 流量序列自相似性的强度,因此比较准确地估计h u r s t 参数对于网络流量自相似特性的 研究具有重要意义。 一般情况下,自相似就是指局部的结构跟总体的结构具有一致性,这里的结构既包 括时间上的,也包括空间上的。 ( 1 ) 概念 自相似过程的定义表述如下: 在网络通信的过程当中自相似性具体表现为在较长时间区域里,在各个单位时间内 分组数的统计特性随着时间规模的改变而不断地改变。长相关性是自相似性的一个重要 特性。如果一个随机过程在各个时间规模上具有相同的统计特性,那么就称之为自相似 性( s e l f - s i m i l a r i t y ) 。 下面给出数学统计描述 2 6 1 设x = x j ,_ ,= 1 2 ,且x 均值= e 【五】和方差仃2 = e l ( 五- u ) 2 j 恒定,其 r ( k ) = e l ( x , 一) ( 置“一0 o 2 , = o ,l ,2 ,) 只与k 值相关。设x 的自相关函数为以下 形式: ,( 七) k - p l l ( 七) ,k _ 唧 l 为对于奶0 ,l 郴h n 哿- l 企v ( 朋) 一 吖a k 一盟业止型,( 七:1 23 ) , m 记序列x ( m ) = ( x f 川,砖,) 的自相关函 数为,( 驯,其中m = 1 , 2 3 一 定义2 1 过程x 被称为具有h :1 一譬的严格二阶自相似的,若其m 阶平滑过程x ( 掰) z 与原过程x 具有一样的相关函数,即,( 朋( 七) = ,( 七) 对所有伽= l 一2 ,k = l 一2 。) 成立。 定义2 2 过程x 被称为具有日= l 一譬的渐进二阶自相似的,若其,- ( 1 ) j 2 1 一声一1 , 二 m _ o o ( k = 2 , 3 ,) 式中万2 表示为二次差分算子,即 6 2 ( 厂( 七) ) = ( 七+ 1 ) 一2 厂( 七) + f ( k 1 ) 严格二阶自相似或者渐进二阶自相似两者突出的特征是:在m o o 时,它的m 阶平 滑过程x ( 用) 的相关函数从结构上来说是非退化的,这完全不同与一些短相关过程自相关 函数的指数衰减【2 7 】。 7 江南大学硕士学位论文 ( 2 ) 参数估计方法 实践证明,在当今网络通信过程中:网络通信量具有自相似性网。如果网络流量时 间序列x = 以,七= l ,2 ,) 及它的聚合过程z 阳) 方差满足陆【x 伽) 】- 兽筹筹;自相似函数 满足:l i mr ( k ,x ( m ) r ( k ,x ) 。则称x 为自相似过程。如果o h o 5 ,则x 缺乏或者 不具有自相似性;如果0 5 h 1 ,表示x 有自相似性,如果日值越大,则自相似性越 强。因此,快速而精确的对参数h u r s t 进行测量对于网络的自相似特性的研究及其变化 的研究具有十分重要的意义和作用。 现如今,研究人员提出了许多方法用于对h u r s t 参数进行测量,包括r s 法( r e s c a l e d r a n g em e t h o d ) 、方差冗余法( v a r i a n c eo f r e s i d u a l sm e t h o d ) 、方差法( v a r i a n c em e t h o d ) 、绝 对值法( a b s o l u t ev a l u em e t h o d ) 、周期图法( p e r i o d g r a mm e t h o d ) 等图形法四1 以及包括 w h i t t l e 法、局部w h i t t l e 法( l o c a lw h i t t l em e t h o d ) 、集合w h i t t l e 法( a g g r e g a t e dw h i t t l e m e t h o d ) 、小波法( w a v e l e tm e l o d ) 等非图形法【3 0 】。 ( 3 ) 对网络性能的影响 自相似性对网络性能的影响是不言而喻的,在网络流量传输过程中信道利用率、丢 包率和接纳控制受网络流量的自相似特性的影响,研究表明,因为网络流量的自相似性 特征随着丢失率的增长而增加,所以自相似性存在的长期相关性会引起网络性能的下 降。如果丢失率恒定,当连接数增加时,则其自相似参数随之而增加。当链路延迟增加 的时候,自相似程度也在增加。当多个流通过瓶颈链路时,则会具有较高的突发性。因 此,更大的缓冲区需要用较常规队列进行分析,增加丢包率和队列延迟,所以在一定程 度上降低了网络的性能【3 l l 。 2 2 长相关特性 在实践中,通过对实际流量的研究分析不难发现,在很大的时间尺度上,网络流量 呈现突发性和高可变性。在衰减速度方面,实际情况观测到的要比短相关的网络流量模 型的自相关要慢许多,从而使得在使用它们进行排队分析和网络性能估计的时候与实际 情况相差甚远。所以新的长相关性流量分析模型被提出,它们中有的是和其它领域的理 论相结合,有的是对现有模型的扩展,这些对网络流量的分析和预测起到了极大的推动 作用 3 2 1 。 从数学角度,一个自相似过程具有多重特性: ( 1 ) 长期相关性: x 的自相关函数不是可累加的,即e r ( k ) 专; k = l ( 2 ) 慢衰减方差特性:当取样窗口m 增大时,取样窗口的倒数比取样平均的方差的 递减速率要快,即v a r x ( m ) m 一,m

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论