




已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,关于网络流量自相似特性的研究,马皓 北大网络实验室 2002年10月31日,2,提纲,问题提出 自相似的数学描述 产生自相似的原因 自相似对网络性能的影响 国内相关工作 可能的研究方向,3,问题提出,研究起源 Will Leland, Murad Taqqu, Walter Willinger, and Daniel Wilson, On the Self-Similar Nature of Ethernet Traffic (Extended Version), IEEE/ACM Transactions on Networking, February 1994.(Bellcore 510 citations) Vern Paxson, Sally Floyd, Wide-Area Traffic: The Failure of Poisson Modeling, IEEE/ACM Transactions on Networking,3(3), June 1995. (Lawrence Berkeley Lab. 408 citations, FTP & Telnet) J. Beran, R. Sherman, M. S. Taqqu, and W. Willinger, “Long-Range Dependence in Variable-Bit-Rate Video Traffic“, IEEE Transactions on Communications, February/March/April, 1995. (193 citations),4,问题提出,意义 开拓了全新的研究领域,经典的理论分析依据(如泊松过程和马尔可夫模型),不在适合网络流量的分析和建模。 “the (r)evolution of the Internet is impacting the world of mathematics in the small as well as in the large - both on how mathematics is done, and, for understanding the network itself, on what sort of mathematics is done - and why this, in turn, makes Internet engineering a gold mine for new, exciting and challenging research opportunities in the mathematical sciences.” by Walter Willinger and Vern Paxson in “Where Mathematics meets the Internet” “Goodbye Poisson” & “Hello Fractal” !,5,问题提出,什么是自相似? 为什么研究自相似? 产生自相似的原因? 泊松过程随机变量(单位时间呼叫到达的次数)是独立的、且服从相似分布,即 PXknet(t)n/n! (n0) 马尔可夫模型对过去具有有限记忆,即在已经知道“现在”的条件下,其“将来”不依赖于“过去” 时间t与过去时间t-s,若s足够大,则t与t-s时的业务量是不相关的,即仅考虑s较小时业务到达间的相关性,称之为短时相关Short Range DependenceSRD模型,6,自相似的数学描述,网络流量模型 时间序列,表示每单位时间到达的字节数或数据包数量 自相似的物理描述 网络流量在很宽的时间尺度内存在突发现象,“Burst” 时间尺度几十毫秒、秒、分钟、小时,7,8,9,10,11,自相似的数学描述,数学定义 假设前提平稳随机过程,即统计特性(均值、方差、相关等)不随时间推移而变化。一阶平稳(均值为常数),二阶平稳(均值和方差为常数,任意两时间点之间的协方差只取决于时间间隔,又称之为广义平稳) 自相关函数定义为: r(k)E(Xt)(Xt+k)/E(Xt)2,12,自相似的数学描述,自相似 条件1针对一个平稳随机过程 X(Xt: t0,1,2,3) 条件2其自相关函数满足r(k) kL1(k),当k,其中01,L1是慢变函数,即对所有x0,limtL1(tx)/L1(t)1(常见的慢变函数,如L1(t)常数,L1(t)(t)) 条件3-对X进行堆叠,堆叠产生的时间序列为X(m)(Xk(m):k1,2,3 ),其中 Xk(m) 1/m(Xkm-m+1 Xkm),k1, 2, 3, ,13,自相似的数学描述,自相似(Exactly second order) self-similar X(m)的自相关函数r(m)满足:r(m)(k)r(k),对所有m1, 2, (k1, 2, 3, ) 渐进自相似(Asymptotically second order) self-similar X(m)的自相关函数r(m)满足: r(m)(1)211,当m r(m)(k)1/22(k2),当m (k2, 3, ) 2表示一个算子符,其作用于函数f(k)表示2(f(k)f(k1)2f(k)f(k1),14,自相似的数学描述,自相似参数H H1/2 r(k)k(2-2H)L1(k),当k 渐进自相似(asymptotically self-similar) r(k)1/2(k1)2H2k2H(k1)2H 严格自相似 (exactly self-similar) 参数H满足0.5H1,参数H用来表示自相似的程度,15,自相似的数学描述,自相似的特性 长相关(LRDlong range dependence、large scale correlation、long term correlation ) 长相关定义若一个随机过程满足自相似的条件1和条件2,即其自相关函数随时滞的增加呈双曲线衰减(幂律衰减),则该随机过程呈现长相关性 长相关自相似,自相似是长相关的特例/简单模型 不可和性,即k r(k)。不可和性的物理意义在于高滞后的相关虽然是个别的小量,但其累计的结果则十分重要 短相关过程(short-range dependence)自相关函数呈指数衰减,即r(k)k,当k(01),其自相关函数是可和的,即0k r(k),16,自相似的数学描述,自相似的特性 慢衰减方差 自相似过程的方差满足var(X(m)am,当m,其中01,a是与m无关的正常数,与前条件2中相同 短相关过程的方差满足var(X(m)bm1,当m,其中b是与m无关的正常数 自相似过程的方差衰减要慢于短相关过程,17,自相似的数学描述,自相似的特性 Hurst效应 H表示Hurst参数,自相关程度的度量 重新调制尺度权差(R/S)对于一个给定的观察序列X1, X2, X3 Xn,样本均值为X(n),样本方差为S2(n),则R(n)/S(n)1/S(n)max(0, W1, W2, , Wn)min(0, W1, W2, , Wn),其中Wk(X1X2X3Xk)kX(n),k1,2,3n,R表示重新调整尺度的极差 R/S: Rescaled adjusted range analysis,18,自相似的数学描述,自相似的特性 Hurst效应 Hurst在1991年和1995年发现大多数自然产生的时间序列满足ER(n)/S(n)cnH,当n,其中Hurst参数典型为0.73,c是与n无关的正常数 若观察序列取自一个短相关模型,曼德博罗等发现,满足ER(n)/S(n)dn0.5,当n,其中d与n无关的正常数 上述两式的差异通常称之为赫斯特效应或赫斯特现象 Hurst赫斯特英国的水文专家,长期从事尼罗河水坝工程研究 Mandelbrot曼德博罗分形理论的创始人,美籍法国数学家,19,自相似的数学描述,自相似 r(k) kL1(k),k(01),L1是慢变函数 k r(k) var(X(m)am,m(01),短相关 r(k)k,当k(01) 0k r(k) var(X(m)bm1,m,20,自相似的数学描述,如何测度自相似 数学定义针对无限长度的时间序列 实际中仅仅一段时间的取样,保证取样点足够多,21,自相似的数学描述,如何测度自相似 针对有限的时间序列来估计Hurst参数 方法1分析堆叠过程X(m)的方差,自相似的慢衰减方差特性 var(X(m)am- (m) (var(X(m)(m)(a) (m),0.4 H0.8,22,自相似的数学描述,如何测度自相似 方法2基于R/S统计的时域分析 ER(n)/S(n)cnH (n) (ER(n)/S(n)H(n)(c) (n) 原始的时间序列分为大小为n的块,对每个块计算其R(ti,n)/S(ti,n),H0.79,23,自相似的数学描述,如何测度自相似 基于周期图(Periodogram)的频域分析 协方差函数傅立叶变换功率谱 用周期图近似估计功率谱 从谱密度中找到参数H,24,自相似的数学描述,具备自相似的数学模型 自相似理论广泛地应用在水文和经济学领域 分形(分数)高斯噪声fractional Gaussian noise FGN 分形(分数)布朗运动fractional Brownian motion FBM,是分形高斯噪声的增量和过程 分形(分数)自回归滑动平均过程fractional ARIMA processes AutoRegressive Integrated Moving-Average,渐进自相似过程,25,自相似的数学描述,网络流量的建模 ON/OFF模型叠加大量的ON/OFF源,每个源有两个状态,即ON和OFF。在ON状态,以连续速率发送数据包,在OFF状态,不发送数据包。每个发生源ON或OFF的时长独立地符合重尾分布(Heavy-tailed distribution) 重尾分布若一随机变量满足重尾分布,则PXx x-,当x, 00,xk,分布函数为F(x)PXx1(k/x),当减小,大量的概率质量集中在分布的尾部 H(3)/2 佩瑞多.韦尔福雷多(Pareto Vilfredo)意大利经济学家和社会学家,26,自相似的数学描述,ON/OFF网络流量模型,27,对流量自相似研究的三个方面,分析流量的特征,建模 小波分析(Discrete Wavelet Transform)和分形理论 分形和多重分形(Multifractal)模型 “可信的”网络流量生成模型 产生流量自相似的原因 评估自相似流量对网络的影响,28,产生自相似的原因,是流量内在的特性还是网络协议的调制作用? Web流量的自相关性 (Boston University, 1996, 1998,实际数据) Web文件大小的分布(包括用户请求的文件、实际传输的文件、文件的传输时间、服务器端存储的文件等)呈重尾分布,客户端Cache的影响相对较小Web文件传输时间的重尾分布Web流量的自相似性,29,产生自相似的原因,若文件大小符合重尾分布,则对应的文件传输均导致链路层的自相似性,Web、NFS、FTP等 (Purdue University, Boston University, 1996, NS模拟) 上述情况似乎都可以从ON/OFF模型找到解释的理由,30,产生自相似的原因,对IP流量成分的进一步分析 (Hungary, Budapest Uni. Of Tech.&Econo. 实际数据,2000) 不同协议成分如IP、ICMP、TCP、UDP、HTTP、SMTP、FTPdata、FTPcontrol、OSPF、Telnet,是否多重分形(multifractal)和分形(monofractal,即自相似),31,产生自相似的原因,对IP流量成分的进一步分析 (Hungary, Budapest Uni. Of Tech.&Econo. 实际数据,2000),32,产生自相似的原因,重传机制(Retransmission)产生自相似特性(CMU,1997) 模拟条件输入是泊松到达(即,新数据包(不包括重传的数据包)到达是一个简单的泊松过程),数据包长度为常数,一个队列情况,先进先服务,无拥塞控制的重传机制 结论当时间尺度超过10倍的数据包传输时间,重传数据包流量的方差在总的流量(新数据包、重传数据包和丢失的数据包)中占据绝大多数成分。 即使改变重传机制的参数,如缓存大小、重传企图的次数和超时时限,不能改变重传负载的自相似特性,33,产生自相似的原因,TCP拥塞控制的浑沌特性(Ericsson,Traffic Analysis and Network Performance Lab. 2000) 浑沌系统的特征:非线性(Nonlinearity)、确定性(Determinism)、混乱中的有序(Order in disorder)、对初始状态的敏感性(蝴蝶效应)(Sensitivity to initial conditions or the “butterfly effect”)、不可预见性(Unpredictability) 模型(NS模拟):TCP Tahoe(Slow-Start、Congestion Avoidance、Fast Retransmit) 参数设置:link rate-C、delay-D、buffer size-B以及TCP流的数量-N,34,产生自相似的原因,TCP拥塞控制的浑沌特性(Ericsson,Traffic Analysis and Network Performance Lab. 2000) 结论:B/N的比率控制着系统的相位迁移,即从周期性到浑沌,并在特定的参数下产生自相似时间序列;单个的TCP流量符合渐进自相似,H0.5;在瓶颈缓存处堆叠的TCP流量是短时相关的,H0.5,其物理解释是TCP拥塞控制使瓶颈缓存占用率最大来平滑流量,堆叠的流量得到平滑,单个TCP流仍保持长相关性。 为什么堆叠的网络流量仍具有长相关性(H0.5)?TCP拥塞控制和具有重尾特性的上层协议共同作用。 TCP本身是一个产生自相似特性的确定性过程,35,产生自相似的原因,针对传输层(TCP和UDP)更进一步的研究(Purdue University, Boston University, 1996, NS模拟) TCP(Tahoe、Reno或Vegas)可靠的传输机制和流量控制机制保留了由文件大小重尾分布所引发的长相关性 无流量控制和不可靠的UDP并不使生成的流量具有长相关性,36,产生自相似的原因,网络拓扑的影响 (Purdue University, Boston University, 1996, NS模拟) 对流量自相似的估计并不因网络拓扑结构变化而改变,37,产生自相似的原因,重尾分布的ON/OFF和浑沌的TCP导致Internet流量的分形特性(自相似),Application Layer,Transport/Network Layer,Application Layer,Transport/Network Layer,Heavy-Tailed File Size Distribution ,Congest Control and Reliability,Self-Similarity Link Traffic H,38,自相似流量对网络性能的影响,网络性能的度量吞吐量(throughout)、延时(delay)、数据包丢失(packet loss) 从排队论的视角,网络是队列的集合,每个队列有一个缓存(buffer)临时保存到达的数据包。数据包到达缓存等候转发,则会产生延时。若达到数据包的数量超过缓存大小,则产生丢弃数据包的现象,同时需要对丢弃的数据包进行重发,导致吞吐量降低。实际上,网络的缓存通常保持很大以避免数据包丢失,维护高的吞吐量,39,自相似流量对网络性能的影响,自相似流量对网络性能产生负面影响 缓存占用比传统排队论的分析结果要大,结果导致更大的延时(也即队列长度分布在自相似流量作用下的衰减比短时相关源(泊松到达过程)作用下要慢),由长相关特性决定,40,自相似流量对网络性能的影响,自相似流量对网络性能产生负面影响 缓存的线性增长导致指数规律减少的数据包丢失,以及成比例增长的传输带宽利用率。该理论对自相关流量不适用,41,自相似流量对网络性能的影响,自相似流量对网络性能产生负面影响 数据包丢失率与缓存大小和自相似之间的关系当趋近于1,自相似程度增大(H(3)/2),数据包丢失率增大,42,自相似流量对网络性能的影响,自相似流量对网络性能产生负面影响 文件大小的重尾分布与吞吐量的关系,平均缓存 占用(字节) 与 数据包 平均延时 成比例,43,国内相关工作,“自相似业务量的多重分形分析”,电子学报,2000年,第28卷,第1期,P.96-98; “CERNET网络业务的自相似性及性能分析”,天津大学学报(自然科学与工程技术版),2000年,第33卷,第3期,P.367-370; “突发业务的多重分形建模及其参数估计”,电子学报,1999年,第4期,第27卷; “网络中业务流的自相似性与线性AR1模型”,电子学报,1999年,第4期,第27卷; “自相似业务模型下的队列分析大偏差技术”,通信学报,1999年,第20卷,第4期;,44,国内相关工作,“自相似业务合成流的建模及排队性能分析”,通信学报,1999年,第20卷,第8期; “自相似业务:基于多分辨率采样和小波分析的Hurst系数估计方法”,电子学报,1998年
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 校园安全教育体验馆解说
- 证劵从业考试题库及答案
- 疫情防控施工方案工地
- 解密2025年氢能储运技术进步与安全标准制定进展报告
- 离婚协议范本:夫妻共同债务分担及清偿流程解析
- 市场仿真花施工方案
- 锂电池智能生产管理平台的搭建与实施
- 产业园区门面摊位使用权及物业管理合同
- 工业固体废物综合利用项目施工方案
- 给水工程备用水源设计方案
- 短视频编辑与制作(第2版)PPT完整全套教学课件
- 领导干部个人有关事项报告表(模板)
- 《中国近现代史纲要》 课件 第十一章 中国特色社会主义进入新时代
- 《最优化方法》研究生配套教学课件
- EN61238-1额定电压36kV电力电缆用压接和机械连接器 试验方法和要求
- 专利法全套ppt课件(完整版)
- 自动插件机操作指导书
- 培智三年级上册生活数学全册教案
- 高考作文卷面书写
- 船舶驾驶台资源管理bridge team management
- 心律失常介入培训教材课后练习及答案
评论
0/150
提交评论