(计算机应用技术专业论文)ip城域网流量建模研究——流量分布特征及模型化.pdf_第1页
(计算机应用技术专业论文)ip城域网流量建模研究——流量分布特征及模型化.pdf_第2页
(计算机应用技术专业论文)ip城域网流量建模研究——流量分布特征及模型化.pdf_第3页
(计算机应用技术专业论文)ip城域网流量建模研究——流量分布特征及模型化.pdf_第4页
(计算机应用技术专业论文)ip城域网流量建模研究——流量分布特征及模型化.pdf_第5页
已阅读5页,还剩69页未读 继续免费阅读

(计算机应用技术专业论文)ip城域网流量建模研究——流量分布特征及模型化.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

西北工业大学硕士论文 摘要 随着网络技术的迅速发展, 互联网的规模日益庞大, 互联网所提供的内容也 日 趋多样化、 复杂化,网 络流量特征研究的重要性日 益突出。 本文以西安多媒体 城域网为研究对象,对其网络流量进行特征分析及建模研究。 主要的研究结果为以下三点: i对原始网络流量进行自 相似特性分析, 并通过自 相关函数和自 协方差来检 验流量的自 相似特性和长程依赖性, 发现自 协方差c ( ) ( k )( 其中m为聚集度) 是以近似重尾曲线的方式逐渐衰减的。 2发现i p 城域骨干网流量的分布密度可以用g a m m a 分布进行比较准确的拟 合, 而其尾部则可以使用重尾分布曲 线进行拟合。 在本人涉猎的文献中尚未见此 类研究报道。 3在多重分形小波模型 ( mwm)基础上,采用上述研究结果分别对尺度系 数和因子的分布做以修正,建立了网络流量的 mwm- g模型,实验结果表明了 该模型的有效性, 因此, 本文的研究将对有类似网络拓扑结构和流量特点的城域网分析研究带 来新的视角。 关键词:自 相似、长程依赖性、h u r s t 参数、g a m m a 分布、小波 西北工业大学硕士论文 abs tract wi t h t h e r a p i d d e v e l o p m e n t o f n e t w o r k t e c h n o l o g y , t h e i n t e rn e t i s g e tt i n g i n c r e a s i n g l y b u l k y . t h e s u p p l i e s o f n e t w o r k a n d r e q u i r e m e n t s o f u s e r s a r e b e c o m i n g m o r e a n d m o re c o m p l e x a n d d i v e r s e . a s a r e s u l t , i t i s in c r e a s i n g l y p r o m i n e n t o n c h a r a c t e r i s t i c s a n a ly s i s o f n e t w o r k t r a f f i c . b y t a r g e t i n g x i a n b r o a d b a n d mu l t i m e d ia n e t w o r k ( x i a n ma n ) , w e a n a l y z e t h e c h a r a c t e r i s t i c s a n d s e t u p a m o d e l t o t h e n e t wo r k t r a f f i c fr o m xi an man. he re a r e t h e ma i n t h r e e res u l t s o f o u r res e a r c h : 1 f i r s t l y , w e a n a l y z e t h e s e l f - s i m i l a r i t y o f n e t w o r k t r a f f i c . s e c o n d l y , c h e c k i n g t h e s e l f - s i m i l a r i t y a n d l o n g r a n g e d e p e n d e n c e t h r o u g h t h e a u t o c o r r e l a t i o n f u n c t i o n a n d a u t o c o v a r i a n c e . l a s t l y , w e h a v e f o u n d t h a t a u t o c o v a r i a n c e c ) ( k ) ( m : a g g r e g a t i o n o r d e r ) , a c c o r d i n g w i t h t h e r u l e o f h e a v y - t a i l f u n c t i o n , i s d e c a y i n g g r a d u a l l y . 2 d i s c o v e r i n g t h a t t h e d i s t r i b u t i o n d e n s it y o f x i a n ma n b a c k b o n e t r a ff i c c a n b e f i t a c c u r a t e l y w i t h g a m m a d i s t ri b u t i o n g a ( a , a ) , a n d i t s t a i l c a n b e fi t w i t h t h e h e a v y - t a i l d i s t r i b u t i o n . u p t o n o w , t h e r e s t i l l h a v e n o t b e e n a n y r e p o rt s r e l a t e d t o t h e r e s u l t s a b o v e w h i c h a m o n g 3 b ase d o n mwm , t h e d o c u me n t s i d a b b l e d a t . w e p r o p o s e a n e w m o d e l ( mwm- g ) t h r o u g h m o d i f y i n g t h e d i s t ri b u t i o n o f s c a le c o e ff i c i e n t a , a n d f a c t o r 再 ,w it h t h e re s u lt s a b o v e . t h e re s u l t s o f t h e e x p e r i m e n t s h o w t h e o f t h i s mo d e l . t h e re f o r e , t h e r e s e a r c h r e s u l t s i n t h i s t h e s i s b r i n g us a new vi ew o n a n a l y s i s o f ma n w i t h s i m i l a r n e t w o r k t o p o l o g i c s t r u c t u r e a n d n e t w o r k t r a ff i c k e y w o r d s : s e l f - s i m i l a r i t y, l o n g - r a n g e wa v e l e t hu r s t , ga mma d i s t r i b u t i o n , 西北工业大学硕士论文 第一章绪论 1 . 1研究网络流f规律的意义 随着网络技术的迅速发展及 工 n t e r n e t 服务和应用的普及,互联网的规模日 益庞大,网络用户在急剧增长, 互联网所提供的内容也日 趋多样化、复杂化。 互 联网的每一步发展也越来越依赖于网络的性能、 安全性和可靠性, 而且成为一个 涉及公众的日常生活、国民经济和国防安全的重大问题。 然而,由于目 前对大型网络如 i p城域网的流量特征、业务特征、用户行为 还研究甚少, 网络的规划设计没有一套比较成熟的理论和方法作为指导, 仍然按 照传统的经验设计方法, 哪里发生拥塞, 就在哪里增加带宽, 增强处理能力。 这 样做尽管简化了设计, 但是这只能局部的解决问题, 不能满足对网络性能日益增 高的要求。以西安为例,目 前西安i p宽带多媒体城域网的设计还是更多的依赖 以往的网络运行管理经验, 理论化的规范性设计所占比重很少, 所以在投资建设 上, 比较盲目, 风险较大。 如果建立网络性能如流量、 时延、 抖动等的数学模型, 再利用网络仿真技术模拟网络承载的实际流量,从而获取网络的重要性能指标, 为网络设计提供可靠的依据,并验证实际方案的优劣,就能缩短网络建设周期, 提高网络设计的科学性,降低网络投资的风险。 城域网是一个规模庞大的通信网络系统, 是我国互联网的主要组成部分, 由 城域网辐射周边地区, 各个城域网互连组成全国骨千网, 己经成为各大网络的基 本模式。 可见对大规模网络进行基础性的研究, 掌握大规模网络的规律, 对科学 的设计网络结构,优化升级网络具有重大意义。 本论文以西安i p宽带多媒体城域网( 以下简称西安i p 城域网) 为研究对象, 探讨网络流量的规律,希望对今后更加深入的研究带来帮助。 1 . 2 研究现状 目 前,国内外对网络流量的研究非常重视,展开了大量的工作。 在数据采集分析方面, i p m o n i t o r i n g p r o j e c t ( i p m o n ) 小组代表了国 外较先 进的水平。其主要工作是监测分析 i p网络中数据分组级的流量参数 ( 如延迟、 丢失) 和网络性能参数。 i p mo n的数据分析包括: p a c k e t t r a c e分析, b g p 路 由信息分析,延迟分析,通过上述可以分析 i p网络的链路使用率,一组具有相 同协议号、相同源目 的地址的数据分组的分布状况,以 及数据分组大小的分布, 数据分组的各种延迟参数等。 在数据流量 规律的 分析 方面,国内 外 许多 研究发现 1 1 2 3 4 1 , 在很多网 络环 西北工业大学硕士论文 第一章绪论 1 . 1研究网络流f规律的意义 随着网络技术的迅速发展及 工 n t e r n e t 服务和应用的普及,互联网的规模日 益庞大,网络用户在急剧增长, 互联网所提供的内容也日 趋多样化、复杂化。 互 联网的每一步发展也越来越依赖于网络的性能、 安全性和可靠性, 而且成为一个 涉及公众的日常生活、国民经济和国防安全的重大问题。 然而,由于目 前对大型网络如 i p城域网的流量特征、业务特征、用户行为 还研究甚少, 网络的规划设计没有一套比较成熟的理论和方法作为指导, 仍然按 照传统的经验设计方法, 哪里发生拥塞, 就在哪里增加带宽, 增强处理能力。 这 样做尽管简化了设计, 但是这只能局部的解决问题, 不能满足对网络性能日益增 高的要求。以西安为例,目 前西安i p宽带多媒体城域网的设计还是更多的依赖 以往的网络运行管理经验, 理论化的规范性设计所占比重很少, 所以在投资建设 上, 比较盲目, 风险较大。 如果建立网络性能如流量、 时延、 抖动等的数学模型, 再利用网络仿真技术模拟网络承载的实际流量,从而获取网络的重要性能指标, 为网络设计提供可靠的依据,并验证实际方案的优劣,就能缩短网络建设周期, 提高网络设计的科学性,降低网络投资的风险。 城域网是一个规模庞大的通信网络系统, 是我国互联网的主要组成部分, 由 城域网辐射周边地区, 各个城域网互连组成全国骨千网, 己经成为各大网络的基 本模式。 可见对大规模网络进行基础性的研究, 掌握大规模网络的规律, 对科学 的设计网络结构,优化升级网络具有重大意义。 本论文以西安i p宽带多媒体城域网( 以下简称西安i p 城域网) 为研究对象, 探讨网络流量的规律,希望对今后更加深入的研究带来帮助。 1 . 2 研究现状 目 前,国内外对网络流量的研究非常重视,展开了大量的工作。 在数据采集分析方面, i p m o n i t o r i n g p r o j e c t ( i p m o n ) 小组代表了国 外较先 进的水平。其主要工作是监测分析 i p网络中数据分组级的流量参数 ( 如延迟、 丢失) 和网络性能参数。 i p mo n的数据分析包括: p a c k e t t r a c e分析, b g p 路 由信息分析,延迟分析,通过上述可以分析 i p网络的链路使用率,一组具有相 同协议号、相同源目 的地址的数据分组的分布状况,以 及数据分组大小的分布, 数据分组的各种延迟参数等。 在数据流量 规律的 分析 方面,国内 外 许多 研究发现 1 1 2 3 4 1 , 在很多网 络环 西北工业大学硕士论文 境中都存在自 相似通信流量。自 相似现象是指在一种维度的不同的“ 放大” 程度 或不同尺寸上看起来是相同的或表现是相同的。 关于自 相似数据通信量的最早的 研究是 “ o n t h e s e l f - s i m i l a r n a t u r e o f e t h e r n e t t r a f f i c , 这篇论文打破 了使用泊松通信量假设进行直接的排队分析就足以描述所有网络通信量的幻想。 触发了网络流量的研究活动。 9 0 年代中期, l e l a n d 等人通过对l a n的流量分析、 k l i v a n s k y 等人对w a n 流量分析发现流量的自 相似性, p a x s o n 等人随后验证了泊松模型在w a n上的失 效性is ) , 并报告了 对广域t c p 通信量以 及t c p 连接上承 载的f t p 和t e l n e t 通 信量的研究结果, 结论如下: ( 1 ) 通常使用的泊松模型在很宽的时间尺度上严重 低估了t c p 通信量的突发程度。 ( 2 ) 交互式t e l n e t通信量连接的到达可以用 泊松模型很好的描述, 然而对分组到达的泊松假设, 即指数分布的到达间隔时间 的假设就明显低估了通信量的突发程度。 ( 3 )对于f t p 所进行的成批传送而言, 通信量的结构再一次与泊松模型有明显的差异,和 t e l n e t数据的情况相同, f t p 会话的到达和泊松模型吻合得很好, 但数据连接的到达突发程度就大得多。 另外,每次突发中所含的字节数目的分布服从重尾分布。 b e l lc o r e 通过对以太网上的数据包业务流量进行监测,结果表明,突发业务 到达过程更适应用渐进或严格自 相似模型来表示, 并且可以用一种方法对以太网 通信量建立模型满足 ( 1 )产生的结果与实际以太网通信量是相似的。( 2 )只需 定义很少的参数, 就可模拟产生以太网流量。 其中 采用的方法是将以太网通信量 描述为由许多p a r e t o 型的o n / o f f 信源叠加产生的。 每个这样的信源都在o n时 段和o f f时段或空闲时段之间交替,在 o n时段信源就发送一串分组。如果假 设各个时段都是由独立、 相同分布的随机变量描述并且每个信源都服从同一种分 布, 那么就可能( 但很困难) 确定多个这种信源的叠加或复用后的行为。 实际上, 这种方法可以用来产生对应于传统通信量模型的通信量。 关键的因素是要使用一 个有限方差分布,诸如用指数或几何分布来描述o n和o f f时段的长度。可以 看到这些模型并不反映真实的以太网通信量。 b e l l c o r e 的研究员采取的方法是采 用具有无穷大的方差分布,特别是采用参数a 在 1 和 2之间的 p a re t 。分布作为 o n / o f f时段的模型。 在这个范围内, p a r e t o分布具有有限均值和无穷大的方差, 并 证明 许多 分布随 机 变量的 叠加结 果是h u r s t 参 数h = ( 3 - a ) / 2 的自 相似 通信 量。 注意对于1 a 2 , 有0 . 5 h 1 ,即h处于自 相似范围内。 类似p a r e t o 这 样的重尾分布反映了单个以太网信源的实际情况。 表面上看, 重尾分布的较高或 无穷大的方差表现出极大的可变性, 因此也就表现出在所有时间尺度上都具有可 变性。 一个应用或一个工作站通常以突发的方式产生通信量, 突发之间是空闲时 段。 对于高方差分布而言, 则有关时间间隔的范围可能非常宽, 很短的突发有很 多,很长的突发也有很多,这就是n o a h( 诺亚)效应。 西北工业大学硕士论文 w i l l i n g e r 等人研究发现,具有无限方差的o n期间 和o f f期间时段的流量 源严格交替, 导致了网络流量聚集并呈现自 相似性或者长程相关性, 从而在一定 程度上揭示了网络流量自 相似性产生的机理。 综上所述,自 相似性已成为网络流 量 研 究 的 一 个 重 要 课 题 6 1 71 81 在网络仿真方面, 国内外也进行了很多研究。 网络仿真不仅仅检测假设模型、 检测分析的正确性, 还为那些根本无法进行分析的复杂模型提供研究的可能( 仿 真在直观方面给研究者提供极大帮助。 )网络拓扑结构和流量的复杂性,以及网 络拥塞的自 适应控制理论, 所有的这些使仿真法成为解决网 络问题的最得力的工 具。 常用的 仿真工具主要有o p n e t . n s 2 等。 o p n e t 9 1 是一个商用的网 络仿真 工具, 包含有关网络设备、网络协议、 应用和服务器操作等专业知识, 支持以太 网、 a t m 接口 等网 络接口。 n s 2 如上述, 是b e r k e l e y 大学开发的免费网 络仿真工 具,它可以模拟各种 i p 网络环境,并实现了对许多网络协议的模拟。 在国内 , 很多 人 在从 事 关于网 络流 量的 分 析 研究 工 作 10 1 1 11 12 1 , 例如, 中国 科学院软件研究所的项目 “ 信息网前沿技术研究: 通信网络动态仿真”中对科技 网流量进行分析, 验证广域网流量的长程依赖性, 并将广域网流量的长程依赖特 性应用于千兆交换路由器的缓存控制。 再例如, 文献 “ 自 相似业务合成流的建模 及排队性能分析” ( 通信学报,1 9 9 9 年,第 2 0 卷,第 8 期) 基于临界时间尺度 的概念对自 相似业务流对a t m 交换机/ 复用性能的影响做了进一步的研究;文献 “ 自 相似业务:基于多分辨率采样和小波分析的h u r s t 系数估计方法”,( 电子 学报,1 9 9 8 年,第7 期) 提出了新的基于小波技术的h u r s t 参数计算方法,与 传统算法相比, 新算法更为准确。 上海复旦大学的 研究成果 “ a n e w m u l t i f r a c t a l t r a f f i c m o d e l b a s e d o n t h e w a v e l e t t r a n s f o r m m e a s u r e m e n t a n d a n a l y s i s o f i p n e t w o r k t r a f f i c ,这些都从不同角度研究了网络流量的规律, 但是针 对具体的城域网络流量的研究报道不多。 1 . 3 p q 络流f的研究方法 网络流量决定网络性能的好坏,若网络所接受的流量超过它实际的运载能 力, 就会导致网络性能下降。为了使网络性能进一步改善, 就需要对网络流量进 行分析研究,从中抽取能刻画网络流量特征的参数, 建立网络流量数学模型,并 利用仿真来模拟实际流量。目 前采用的主要方法为: ( 1 )根据概率统计学,对所测量数据进行统计分析,从原始数据流量中获 得数据的一些分布特性如均值和方差的估计等等。 c 2 )确定流量的分布。在此过程中常常要对母体分布函数的形式或某些参 数作某种假设, 并进行假设检验。 假设检验是指如何抽取子样并集中子样的有关 西北工业大学硕士论文 w i l l i n g e r 等人研究发现,具有无限方差的o n期间 和o f f期间时段的流量 源严格交替, 导致了网络流量聚集并呈现自 相似性或者长程相关性, 从而在一定 程度上揭示了网络流量自 相似性产生的机理。 综上所述,自 相似性已成为网络流 量 研 究 的 一 个 重 要 课 题 6 1 71 81 在网络仿真方面, 国内外也进行了很多研究。 网络仿真不仅仅检测假设模型、 检测分析的正确性, 还为那些根本无法进行分析的复杂模型提供研究的可能( 仿 真在直观方面给研究者提供极大帮助。 )网络拓扑结构和流量的复杂性,以及网 络拥塞的自 适应控制理论, 所有的这些使仿真法成为解决网 络问题的最得力的工 具。 常用的 仿真工具主要有o p n e t . n s 2 等。 o p n e t 9 1 是一个商用的网 络仿真 工具, 包含有关网络设备、网络协议、 应用和服务器操作等专业知识, 支持以太 网、 a t m 接口 等网 络接口。 n s 2 如上述, 是b e r k e l e y 大学开发的免费网 络仿真工 具,它可以模拟各种 i p 网络环境,并实现了对许多网络协议的模拟。 在国内 , 很多 人 在从 事 关于网 络流 量的 分 析 研究 工 作 10 1 1 11 12 1 , 例如, 中国 科学院软件研究所的项目 “ 信息网前沿技术研究: 通信网络动态仿真”中对科技 网流量进行分析, 验证广域网流量的长程依赖性, 并将广域网流量的长程依赖特 性应用于千兆交换路由器的缓存控制。 再例如, 文献 “ 自 相似业务合成流的建模 及排队性能分析” ( 通信学报,1 9 9 9 年,第 2 0 卷,第 8 期) 基于临界时间尺度 的概念对自 相似业务流对a t m 交换机/ 复用性能的影响做了进一步的研究;文献 “ 自 相似业务:基于多分辨率采样和小波分析的h u r s t 系数估计方法”,( 电子 学报,1 9 9 8 年,第7 期) 提出了新的基于小波技术的h u r s t 参数计算方法,与 传统算法相比, 新算法更为准确。 上海复旦大学的 研究成果 “ a n e w m u l t i f r a c t a l t r a f f i c m o d e l b a s e d o n t h e w a v e l e t t r a n s f o r m m e a s u r e m e n t a n d a n a l y s i s o f i p n e t w o r k t r a f f i c ,这些都从不同角度研究了网络流量的规律, 但是针 对具体的城域网络流量的研究报道不多。 1 . 3 p q 络流f的研究方法 网络流量决定网络性能的好坏,若网络所接受的流量超过它实际的运载能 力, 就会导致网络性能下降。为了使网络性能进一步改善, 就需要对网络流量进 行分析研究,从中抽取能刻画网络流量特征的参数, 建立网络流量数学模型,并 利用仿真来模拟实际流量。目 前采用的主要方法为: ( 1 )根据概率统计学,对所测量数据进行统计分析,从原始数据流量中获 得数据的一些分布特性如均值和方差的估计等等。 c 2 )确定流量的分布。在此过程中常常要对母体分布函数的形式或某些参 数作某种假设, 并进行假设检验。 假设检验是指如何抽取子样并集中子样的有关 西北工业大学硕士论文 信息, 并对假设的正确性进行判断。 在实际应用时, 如果这个假设是给定的统计 假设, 那么这种情况下所建的模型就是确定的。 如果假设未给定, 则在建模的时 候, 需要进行择优判断, 即对给定的数据集, 选择最合适的模型。当然这种择优 也是相对的, 因为模型并不是唯一的, 因为可能还有更好的模型适合给定的数据 集。 ( 3 ) 根据统计分析后得出的数据特性进行流量建模。 本论文以西安i p 城域网作为研究对象。通过以下三步进行研究: ( 1 ) 数据采集: 在节点设备和源端设备上采集l p包的进出数据量。 数据采 集工具以v c为平台,基于s n mp开发。 ( 2 )数据分析:通过计算采集数据的均值、方差等统计量,发现数据流量 的分布特征,通过假设检验得出结论。 ( 3 )建模仿真:建模仿真则在得出数据流量分布规律的基础上,通过仿真 验证其有效性。 1 . 4本论文的组级结构 第一章: 绪论, 阐述研究网络流量规律对网络性能的重要性、 研究现状和主 要研究方法。 第二章: 主要对研究过程中 所编写的程序, 做简要说明。 按程序的功能可分 两大部分: 数据采集,基于s n mp( 简单网络管理协议)实现的数据采集的程序。 数据分析, 主要包括两大功能模块, 数据分析模块和数据拟合模块: 数据分 析模块主要分为 ( 1 )数据处理;包括对原始流量进行预处理,计算基本的统计 量等。( 2 )特性分析;包括对网络流量进行自相似分析 ( s e l f - s i m i l a r s - s ) 、自 相关分析( a u t o c o r r e l a t i o n ) 、自 协方差分析等。 数据拟合模块从分布密度的角 度, 对原始数据的分布进行拟合 ( 包括g a m m a 拟合、指数分布拟合、重尾分布拟合 等) 。 第三章: 首先介绍自 相似特性及其相关概念, 然后使用实际采集的网络流量, 采用方差 时间图方法进行自 相似性分析,并通过自 相关函数和自 协方差对自 相 似性和长程依赖性进行验证。 第四章:通过分析城域骨干网络流量,发现其分布密度曲线有如下特点: ( 1 )接入层节点到分布层节点的链路流量一般相对较小,分布密度曲线比 较散乱,但总体上近似于指数分布; ( 2 )分布层节点到核心层节点的链路流量一般相对较大,分布密度曲线比 较平滑且有强的规律性,近似为g a m m a 曲线。随后根据上述结果,进行分布曲 西北工业大学硕士论文 信息, 并对假设的正确性进行判断。 在实际应用时, 如果这个假设是给定的统计 假设, 那么这种情况下所建的模型就是确定的。 如果假设未给定, 则在建模的时 候, 需要进行择优判断, 即对给定的数据集, 选择最合适的模型。当然这种择优 也是相对的, 因为模型并不是唯一的, 因为可能还有更好的模型适合给定的数据 集。 ( 3 ) 根据统计分析后得出的数据特性进行流量建模。 本论文以西安i p 城域网作为研究对象。通过以下三步进行研究: ( 1 ) 数据采集: 在节点设备和源端设备上采集l p包的进出数据量。 数据采 集工具以v c为平台,基于s n mp开发。 ( 2 )数据分析:通过计算采集数据的均值、方差等统计量,发现数据流量 的分布特征,通过假设检验得出结论。 ( 3 )建模仿真:建模仿真则在得出数据流量分布规律的基础上,通过仿真 验证其有效性。 1 . 4本论文的组级结构 第一章: 绪论, 阐述研究网络流量规律对网络性能的重要性、 研究现状和主 要研究方法。 第二章: 主要对研究过程中 所编写的程序, 做简要说明。 按程序的功能可分 两大部分: 数据采集,基于s n mp( 简单网络管理协议)实现的数据采集的程序。 数据分析, 主要包括两大功能模块, 数据分析模块和数据拟合模块: 数据分 析模块主要分为 ( 1 )数据处理;包括对原始流量进行预处理,计算基本的统计 量等。( 2 )特性分析;包括对网络流量进行自相似分析 ( s e l f - s i m i l a r s - s ) 、自 相关分析( a u t o c o r r e l a t i o n ) 、自 协方差分析等。 数据拟合模块从分布密度的角 度, 对原始数据的分布进行拟合 ( 包括g a m m a 拟合、指数分布拟合、重尾分布拟合 等) 。 第三章: 首先介绍自 相似特性及其相关概念, 然后使用实际采集的网络流量, 采用方差 时间图方法进行自 相似性分析,并通过自 相关函数和自 协方差对自 相 似性和长程依赖性进行验证。 第四章:通过分析城域骨干网络流量,发现其分布密度曲线有如下特点: ( 1 )接入层节点到分布层节点的链路流量一般相对较小,分布密度曲线比 较散乱,但总体上近似于指数分布; ( 2 )分布层节点到核心层节点的链路流量一般相对较大,分布密度曲线比 较平滑且有强的规律性,近似为g a m m a 曲线。随后根据上述结果,进行分布曲 西北工业大学硕士论文 线的拟合和验证,并提出相关的拟合算法。 第五章:提出改进的多重分形小波模型。在 mwm 模型的基础上,对尺度 系数和因子的分布进行修正。最后验证该改进模型的有效性。 西北工业大学硕士论文 第二章数据采集及数据分析程序设计 2 1 西安i p 城域网简介 作为互联网的重要组成部分,i p 城域网是一个规模庞大的通信网络系统, 它是根据业务发展和竞争的需要而建设的城市范围内的宽带多媒体通信网络,i p 城域网作为本地的公共信息服务平台的网络骨干,承载着各种多媒体业务,为用 户提供各种接入服务。 2 1 1 西安i p 城域网的网终结构 主流城域网的拓扑结构有双核( 或多核) 分层结构、环型结构等类型引。 西安宽带i p 城域网的网络结构通常分为三层:核心层、分布层和接入层,如图 1 1 所示,核心层网络完成高速数据转发的功能。分布层网络节点则主要实现扩 展核心层设备的端口密度和端口种类,扩大核心层节点的业务覆盖范围,汇聚接 入节点,解决按入节点到核心节点间光纤资源紧张问题,实现接入用户的可管理 性等功能。接入层网络节点主要是将不同地理分布的用户快速有效地接入骨干 网。但从功能上,可分为骨干网和接入网两层:骨干网承担骨干流量的传输与交 换,接入网实现用户的认证接入和计费等功能。目前接入网有l a n 接入、a d s l 接入和拨号接入等方式。城域网的主要设备类型包括骨干路由器、骨干交换机和 接入服务器。 卜 工厂办公楼高校家庭 驻地同 6 西北工业大学硕士论文 图2 1 西安i p 城域网结构 2 1 2 西安l p 城域网的核心组网技术 作为网络连接和交换的平台,城域网骨干网络需要快速的交换和转发能力, 还要有冗余链路以保证网络安全可靠以及良好的流量控制和q o s 等。下面对目 前城域网建设的几种主流技术作以简单介绍与分析。 ( 1 ) a t m 技术 a t m 采用5 3 字节固定长度的信元( c e l l ) 作为最基本的传输单元,利用i p o a 、 l a n e 、m p o a 和m p l s 等协议来承载i p 。它的优点在于可以把不同的服务( f r 、 d d n 、v o i c e 、d 1 ) 集中到一个管道中,并提供分类管理,同时可以提供强大的流 控机制但a t m 在传输i p 业务时存在协议过于复杂,信头协议太大,设备价格高 而速率有上限( 目前a t m 接口最高速率是2 5 g ,而且6 2 2 m 和2 5 g 接口价格非 常高) 。 ( 2 ) o e ( 千兆以太网) 技术 g e 技术基于传统的成熟稳定的以太网技术,设备价格较低。它可以自然的 方式来升级现有的以太网、工作站、管理工具和管理人员的技能,实现与用户原 有以太网的无缝连接,中间不需要任何格式转换,大大提高了数据转发和处理能 力。可以说g e 的突出优势是低带宽成本以及简单、易用和对i p 的无缝支持。 但在流量控制和带宽管理、可管理性和安全等方面能力则还有待于进一步完善。 ( 3 ) p o s ( p a c k e t o v e r s d h ) 技术 p a c k e to v e rs d h ( p o s ) ,更准确的说,是i p p p p h d l co v e rs d h s o n e t 。 它由于省去了a t m 层可以简化网络体系结构,从而可减少费用,提高传输速度和 效率,而且由于保留了s d h 的基本传输体系和性能监控,可以实现网络层保护。 但在i po v e rs d h 中s d h 仍是以链路的方式来支持i p 网,没有从本质上提高i p 网的性能。和g e 技术相比,p o s 端口价格则仍显过高。 ( 4 ) d p t ( 动态包传输) 技术 d p t 技术是基于光纤传输的优化包传输,结合了i p 路由的带宽效率、成本 有效性和服务丰富性以及光纤环的带宽丰富性和积极自愈功能,提供了下一代数 据化的光纤传输解决方案,最大限度的提高了网络稳健性和可用性。d p t 采用 分组环解决方案,充分利用带宽复用功能,比t d m 的s d h 设备和分,插复用器 ( a d m ) 等组网方式经济便宜。 在西安i p 城域网中,核心层与分布层之间多采用p o s 技术,而分布层与接 入层之间多采用o e ( 千兆以太网) 技术。 2 2 西安l p 城域网的流量信息采集 西北工业大学硕士论文 图2 . 1 西安 工 p 城域网结构 2 . 1 . 2西安 i p 城域网的核心组网技术 作为网络连接和交换的平台,城域网骨干网络需要快速的交换和转发能力, 还要有冗余链路以 保证网络安全可靠以 及良 好的流量控制和 q o s等。 下面对目 前城域网建设的几种主流技术作以简单介绍与分析。 ( 1 ) a t m技术 a t m采用5 3 字节固定长度的 信元( c e l l ) 作为最基本的传输单元, 利用i p o a , l a n e , m p o a和m p l s 等 协议来承载i p 。 它的 优点 在于可以 把不同的 服务 ( f r , d d n , v o i c e , d i ) 集中到一个管道中, 并提供分类管理, 同时可以 提供强大的流 控机制但a t m在传输i p业务时存在协议过于复杂, 信头协议太大, 设备价格高 而速率有上限 ( 目 前a t m接口 最高速率是2 .5 g ,而且6 2 2 m和2 .5 g接口 价格非 常高) 。 ( 2 ) g e ( 千兆以 太网 ) 技术 g e技术基于传统的成熟稳定的以太网技术,设备价格较低。它可以自 然的 方式来升级现有的以太网、 工作站、 管理工具和管理人员的技能, 实现与用户原 有以太网的无缝连接, 中间不需要任何格式转换, 大大提高了数据转发和处理能 力。可以说 g e的突出优势是低带宽成本以及简单、易用和对 i p的无缝支持。 但在流量控制和带宽管理、可管理性和安全等方面能力则还有待于进一步完善。 ( 3 ) p o s ( p a c k e t o v e r s d h ) 技术 p a c k e t o v e r s d h ( p o s ) ,更准确的说,是 i p / p p p / h d l c o v e r s d h / s o n e t . 它由于省去了a t m 层可以简化网络体系结构, 从而可减少费用, 提高传输速度和 效率,而且由于保留了s d h 的基本传输体系和性能监控,可以实现网络层保护。 但在i t o v e r s d h 中s d h 仍是以 链路的方式来支持i p 网,没有从本质上提高i p 网的性能。和g e 技术相比,p o s 端口价格则仍显过高。 ( 4 ) d p t ( 动态包传输) 技 术 d p t技术是基于光纤传输的优化包传输,结合了i p路由的带宽效率、成本 有效性和服务丰富性以及光纤环的带宽丰富性和积极自 愈功能, 提供了下一代数 据化的光纤传输解决方案,最大限度的提高了网络稳健性和可用性。 d p t采用 分组环解决方案,充分利用带宽复用功能,比t d m的s d h设各和分崛 复用器 ( a d 娜等组网方式经济便宜。 在西安i i i 城域网中, 核心层与分布层之间多采用p o s 技术, 而分布层与接 入层之间多采用g e ( 千兆以 太网 ) 技术。 2 . 2 西安 i p 城域网的流f僧息采集 西北工业大学硕士论文 图2 . 1 西安 工 p 城域网结构 2 . 1 . 2西安 i p 城域网的核心组网技术 作为网络连接和交换的平台,城域网骨干网络需要快速的交换和转发能力, 还要有冗余链路以 保证网络安全可靠以 及良 好的流量控制和 q o s等。 下面对目 前城域网建设的几种主流技术作以简单介绍与分析。 ( 1 ) a t m技术 a t m采用5 3 字节固定长度的 信元( c e l l ) 作为最基本的传输单元, 利用i p o a , l a n e , m p o a和m p l s 等 协议来承载i p 。 它的 优点 在于可以 把不同的 服务 ( f r , d d n , v o i c e , d i ) 集中到一个管道中, 并提供分类管理, 同时可以 提供强大的流 控机制但a t m在传输i p业务时存在协议过于复杂, 信头协议太大, 设备价格高 而速率有上限 ( 目 前a t m接口 最高速率是2 .5 g ,而且6 2 2 m和2 .5 g接口 价格非 常高) 。 ( 2 ) g e ( 千兆以 太网 ) 技术 g e技术基于传统的成熟稳定的以太网技术,设备价格较低。它可以自 然的 方式来升级现有的以太网、 工作站、 管理工具和管理人员的技能, 实现与用户原 有以太网的无缝连接, 中间不需要任何格式转换, 大大提高了数据转发和处理能 力。可以说 g e的突出优势是低带宽成本以及简单、易用和对 i p的无缝支持。 但在流量控制和带宽管理、可管理性和安全等方面能力则还有待于进一步完善。 ( 3 ) p o s ( p a c k e t o v e r s d h ) 技术 p a c k e t o v e r s d h ( p o s ) ,更准确的说,是 i p / p p p / h d l c o v e r s d h / s o n e t . 它由于省去了a t m 层可以简化网络体系结构, 从而可减少费用, 提高传输速度和 效率,而且由于保留了s d h 的基本传输体系和性能监控,可以实现网络层保护。 但在i t o v e r s d h 中s d h 仍是以 链路的方式来支持i p 网,没有从本质上提高i p 网的性能。和g e 技术相比,p o s 端口价格则仍显过高。 ( 4 ) d p t ( 动态包传输) 技 术 d p t技术是基于光纤传输的优化包传输,结合了i p路由的带宽效率、成本 有效性和服务丰富性以及光纤环的带宽丰富性和积极自 愈功能, 提供了下一代数 据化的光纤传输解决方案,最大限度的提高了网络稳健性和可用性。 d p t采用 分组环解决方案,充分利用带宽复用功能,比t d m的s d h设各和分崛 复用器 ( a d 娜等组网方式经济便宜。 在西安i i i 城域网中, 核心层与分布层之间多采用p o s 技术, 而分布层与接 入层之间多采用g e ( 千兆以 太网 ) 技术。 2 . 2 西安 i p 城域网的流f僧息采集 西北工业大学硕士论文 ( 1 ) s n mp 概述 本文基于s n m p ( 简单网 络管理协议, s i m p l e n e t w o r k m a n a g e m e n t p r o t o c o l ) 从西安宽带多媒体城域网骨干网采集的网络流量数据。 . s n mp 协议 为了获得网络流量的原始数据, 我们通过s n m p简单网 络管理协议, s i m p l e n e t w o r k m a n a g e m e n t p r o t o c o l ) 协议实现. s n m p 协议为网络管理系统提供 底层网络管理的框架。其中包括 s n m p的消息格式,以及如何在应用程序 和设备之间传递信息等。 . mi b概述 管理信息数据库 ( n u b ) 是一个信息存储库, 它包含了管理代理中的有关配 置和性能的数据, 有一个组织体系和公共结构, 其中包含分属不同组的许多 个数据对象。 mi b数据对象以一种树状分层结构进行组织,这个树状结构 中的每个分枝都有一个专用的名字和一个数字形式的标识符。 使用这个树状 分层结构, mi b浏览器能够以一种方便而且简洁的方式访问整个m i b数据 库。 ( 2 ) 西安i t城域网的流量采集方案 . 采样间隔的选择: 为了采集到尽可能详细的流量细节, 应该取尽可能小且有 实际意义的采样时间间隔。为此,我们使用一个能够支持最小采样间隔达 t o m s 的s n mp采样软件。采样的对象选定为骨干网路由器的连接的骨干链 路, 链路带宽主要 有1 0 b p s 和2 . 5 0 b p s 两 种。 在数据采集时, 我们把采样间 隔就设定在 l o m s 。选定l o m s ,是综合考虑设备的支持能力、采样软件的支 持能力和对网络流量的时间刻画精细程度三者的结果。 . 采样时间的选择:城域网原有的流量监控系统显示,被测试链路的流量, 呈 现以 一天为周期的显著的周期性, 符合直觉判断。 每天中上午9 : 0 0 到1 2 : 0 0 , 下午3 : 0 0 到晚上6 : 0 0 ,晚上7 : 0 0 到1 1 : 0 0 ,流量均处于比 较高的水平。 鉴于此, 我们选择9 : 0 0 到1 2 : 0 0 , 3 : 0 0 到晚上6 : 0 0 的不同时段进行了多次 采样。每次采样时间段定为 3 0分钟左右,因为对于骨干网络,有理由认为 3 0 分钟体现出来的规律对于一天2 4 小时有很好的代表意义,特别是我们抽 取的是网络的忙时,且研究的是网络流量的微观规律, 而不是研究其在若干 天、周、月、年所呈现的宏观规律。 为了避免测试 ( 即 s n mp请求、应答)流量对测试结果的影响,我们在数 据处理时剔除了这部分流量。 西北工业大学硕士论文 2 . 3数据分析程序设计 数据分析程序包括数据分析模块和数据拟合模块。 数据分析模块主要对原始 数据进行预处理, 计算基本的统计量以及数据的自 相似分析、自 相关分析等; 数 据拟合模块从分布密度的角度,对原始数据的分布进行拟合。如图2 . 2 所示: 图 2 . 2数据分析程序说明 ( 1 ) 本研究采用的数据分析程序包括: . 数据预处理 在数据采集过程中, 每条链路上的流量由 进入和流出两部分构成,分别路由 器上两个s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论