(计算机应用技术专业论文)网络流量行为的测量分析与预测.pdf_第1页
(计算机应用技术专业论文)网络流量行为的测量分析与预测.pdf_第2页
(计算机应用技术专业论文)网络流量行为的测量分析与预测.pdf_第3页
(计算机应用技术专业论文)网络流量行为的测量分析与预测.pdf_第4页
(计算机应用技术专业论文)网络流量行为的测量分析与预测.pdf_第5页
已阅读5页,还剩77页未读 继续免费阅读

(计算机应用技术专业论文)网络流量行为的测量分析与预测.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 本文针对当前校园网络管理存在的问题,将理论方法与实际分析相结合,对 校园网流量行为的特性进行了一系列的研究,为校园网络的管理提供了一定的决 策支持。 文章首先介绍了网络流量和网络行为学的基本概念以及相关理论。其次,详 细说明了流量行为研究的几个重要组成部分,如网络测量、流量分析和预测的各 种技术,并着重描述了本课题采用的方法和技术,如被动测星方法、抽样测量技 术、确定时间序列分析预测方法等。然后,以校园网流量为例,阐述了本课题中 流量行为分析的整个过程,包括流量分析系统的实现,流量数据的采集,流量行 为的分析,流量行为的预测。 在采集中,本课题使用了r f c 2 3 3 0 推荐的p o i s s o n 抽样方法,取得了较好的 采集效果;在分析中,总结出了四种流量突发特征:平稳变化型、单个突发型、 持续突发型、间隔突发型,并从行为学的角度对其进行了分析;在预测中,对确 定时间序列方法中的季节变动模型做了一些改进,对当日流量行为进行预测,并 将预测结果与实际抽样流量做了比较,证明预测具有较高的可信度。 关键词:流量行为、网络测量、泊松抽样、时间序列分析 a b s t r a c t t os o l v ep r o b l e m si nt h em a n a g e m e n to ft h ec a m p u sl a n ,t h i st h e s i si n t e g r a t e s t h et h e o r ya n dt e c h n i q u ew i ma c t u a la n a l y s i s a n das e r i e so fr e s e a r c hi nt h e c h a r a c t e r i s t i co fn e t w o r kt r a f f i cb e h a v i o ro ft h ec a m p u sl a nh a v eb e e nd o n e ,w h i c h o f f e rs o m es u p p o r t so f m a k i n gd e c i s i o ni nt h em a n a g e m e n to f t h ec a m p u sl a n f i r s t l y ,t i f f st h e s i si n t r o d u c e st h eb a s i cc o n c e p ta n dc o r r e l a t i v et h e o r i e so f n e t w o r k t r a f f ma n dn e t w o r kb e h a v i o rs u b j e c t s e c o n d ly ,t h et h e s i sp r e s e n t ss e v e r a li m p o r t a n t c o m p o n e n t so ft h er e s e a r c hi nt r a l 五cb e h a v i o r , w h i c hi n c l u d e sn e t w o r km e a s u r e m e n t a n dt r a f f i ca n a l y s i sa n dt r a f i s cf o r e c a s t t h et e c h n i q u e sa d o p t e di n t h i st h e s i sa r e e m p h a s i z e ds u c ha so fp a s s i v em e a s u r e m e n t ,s a m p l i n ga n da s s u r e dt i m es e r i e s t h e n , t h et h e s i sd e s c r i b e st h ew h o l ep r o c e s so fa n a l y z i n gt h e 蜮cb e h a v i o rt h r o u g ht h e e x a m p l eo ft h ec a m p u sl a nt r a f f i ci n t h i sp r o j e c t , w h i c hi n c l u d e sd e s i g n i n ga n d r e a l i z i n ga ne x p e r i m e n t a ls y s t e m ,g a t h e r i n gt r a f f i cd a t a , a n a l y z i n gt r a f f i cb e h a v i o r , a n d f o r e c a s t i n g i ns a m p l i n g ,p o s s i o ns a m p l i n gt e c h n o l o g yr e c o m m e n d e db yr f c 2 3 3 0i su s e d , a n dt h es a m p l i n ge f f e c ti sf r e e i na r l a l y z i n g ,w es u m m a r i z ef o u rc h a r a c t e r i s t i c so f t r a f f i cb u r s t i n ga n da n a l y z et h e s ec h a r a c t e r i s t i c si np o i n to fb e h a v i o rs u b j e c tv i e w , w h i c hi n c l u d e ss m o o t hc h a n g i n g ,s i n g l eb u r s t i n g ,c o n t i n u o u sb u r s t i n ga n di n t e r v a l b u r s t i n g i nf o r e c a s t i n g ,w ea 街u s tt h es e a s o nc h a n g em o d e lo fa s s u r e dt i m es e r i e s , a n dp u ti ti n t of o r e c a s t i n gt h ec h a n g et r e n do ft r a f f i ct o d a y a f t e rc o m p a r i n g f o r e c a s t i n gr e s u l tw i t ha c t u a ls a m p l i n gt r a i t i c ,o u rf o r e c a s ti sp r o v e dr e l i a b l e g r a d u a t ec a n d i d a t e :w e iq h a gt i n g ( c o m p u t e ra p p l i c m i o nt e c h n o l o y ) d i r e c t e db y :p r o f z h a nc h u a n j i e k e yw o r d s :t r a f f i cb e h a v i o r , n e t w o r km e a s u r e m e n t ,p o s s i o ns a m p l i n g ,a n a l y s i so f t i m es e r i e s 独创性声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其 他人已经发表或撰写过的研究成果,也不包含为获得南昌土学或其他教育机 构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献 均已在论文中作了明确的说明并表示谢意。 学位论文作者签名:亳啜知歇签字日期:w 年名月r 日 学位论文版权使用授权书 本学位论文作者完全了解南昌大学有关保留、使用学位论文的规定, 有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和 借阅。本人授权南昌大学可以将学位论文的全部或部分内容编入有关数据库进 行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。 ( 保密的学位论文在解密后适用本授权书) 学位论文作者签名:瓤弼疆凌导师签名:占善戈 签字日期:7 4 0 1 以- 年6 月y 日 签字日期:渺年易月5e t 学位论文作者毕业后去向 工作单位: 通讯地址: 电话 邮编 网络流量行为的测量分析与预测 1 1 课题背景及意义 第一章绪论 随着全球信息化进程的加快,网络尤其是国际互联网作为现代信息社会最重 要的基础设施之一,它已渗透到社会的各个领域,成为国家发展和社会进步的基 本需求,是未来知识经济的基础载体和支撑环境。信息社会和正在逐渐形成的全 球化知识经济形态对信息网络管理提出了很高的要求,但i n t e m e t 网络在管理方 面逐渐暴露出许多缺陷。近年来国内外的有关研究大都是通过对大量业务数据进 行分析研究,提炼出反映网络某些真实特性的新的数学模型,如自相似模型等。 但是由于现代网络信息传输的高突发性和随机性,至今尚未发现令人满意的能全 面反映网络状态和行为的理论和模型。因此迫切需要对现有的信息网络进行新的 思考和研究,探索新一代网络行为学。这些新的理论和方法必须突破传统理论的 限制,能够处理在规模和复杂性发生数量级变化的网络信息交换问题,适应超大 规模超高速信息网络的需要,满足更及时、更方便的服务需求,为新一代信息网 络的建设和管理提供理论基础和技术支撑。 近期,国内外纷纷展开了对网络行为的研究,并取得了不少成果: n i p m a s ( n e t w o r ki pm e a s u r e m e n ta n da n a l y s i ss y s t e m ) 系统是中科院计算 所网络测试实验室开发的基于业务的大型网络性能监测系统,该系统起源于国家 i n t e m e t 的大规模测量和分析研究项目,得到了国家自然科学基金委和中国科学 院知识创新工程的支持,同时被纳入国家8 6 3 计划。n i p m a s 基本实现了网络行 为分析的以下目标:建立完整的大规模互联网网络行为测量理论体系,提出网络 行为的量化描述方法和系统科学的测量与分析方法,构筑完善的、完全自主的、 可扩展的大规模互连网络测量和分析平台,开展大规模的国家i n t e r n e t 测量和分 析,提出我国i n t e m e t 体系的物理特征、流量特征、路由特征、故障特征、用户 行为特征和网络行为的变化规律。在网络测量过程中,n i p m a s 的一个显著特点 就是采用了自己提出的主动业务探测模式。与传统网管软件不同的是,n i p m a s 没有采用s n m p 轮询的方法,而是采用分布式探针,以主动测量为主。n i p m a s 可以随时随地了解到任意两条端到端业务通路问的运营状况,且测量密度容易控 网络流量行为的测量分析与预测 制,测量引起的附加流量较小。n i p m a s 把主动测量和基于业务的测量方式相结 合,弥补了被动测量和基于设备管理的不足。 t m a s ( t r a f i em e a s u r e m e n ta n da n a l y s i ss y s t e m ) 系统是西安交通大学开发的 基于c a n o n e t ( c h i n aa d v a n c e di n f o o p t i c a ln e t w o r k ) 的业务流测量与分析系 统,起源于国家九五8 6 3 项目c a i n o n e t 中的“业务流设计”和十五8 6 3 项目“流 量工程与网络行为学”课题。该系统分为两个子系统测量子系统和分析子系 统,采用分布式系统结构,其中分析要求和测量要求可以根据用户的需要进行定 制。在测量子系统引入了代理机制,用以解决用户任务的达成问题,而分析子系 统可以进行在线和离线的双重分析,提供了对网络流量记录一定的分析能力。同 时,根据不同的实际情况,该系统可实现动态重组,灵活性高,具有较强的可扩 展性。 p l v l a ( p a s s i v em e 踟e m e ma n da n a l y s i s ) 项目和a m e ( a c t i v em e 郴e m e m p r o j e c t ) 项目是美国应用网络研究国家实验室( n l a n r ) 的测量项目,受到美国 国家科学基金n s f 的资助,为高级网络( 如v b n s ,a b l i e n e ) 提供协作性的服务 支持。p m a 和a m p 是n l a n r 开发出的网络分析架构n a i ( n e t w o r ka n a l y s i s i n f r a s t r u c t u r e ) 的两个核心项目,旨在刻划高性能连接( h p c ) 网络的网络行为特 征。p m a 采用o c 3 m o n 数据搜集系统,包括专门的群机系统,装有f o r e a t m c a r d s 和o p t i c a ls p l i t t e r ( 分光器) ,采集a t m 的数据流,使用c o r a l r e e f 根据一定 的规则集进行数据采集,并可使用p e f l 等语言对数据进行分析。a m p 系统使用 了完全连接的网络( 每台用于测试的监视设备与所有其它的监视设备连接) ,采 用p i n g 进行双向测量,主要是测量r t t ( r o u n dt r i pt i m e ) 、丢包率和拓扑等。 c a i d a l 2 5 1 ( c a i d a t h ec o o p e r a t i v ea s s o c i a t i o nf o ri n t e m e td a t aa n a l y s i s ) 组织 的c l a f f yk 等人利用了多种工具对计算机互联网( i n t e m e t ) 进行分析,展示出 了这一庞大复杂巨系统的概貌。他们用一种称为s k i t t e r 的工具对网络的拓扑结构 和数据包的传输路径和网络路由策略和行为等内容进行了分析,并且绘制了如不 同自治网络间的连接关系等反映网络行为的示意图。 l e l a n d ,w w f l l i n g e r 2 卸等人发现了网络业务流表现出完全不同于p o i s s o n 模 型的自相似性模型,之后在对大量的w a n 、l a n 、及v b k 业务、i s d n 中传输 的业务等多种业务的测量和研究表明,各种具有突发性的业务源都在一定的时间 2 网络流量行为的测量分析与预测 尺度下呈现出自相似的特征。这种自相似性业务流普遍存在干各种业务流中。这 种网络流量自相似性的行为由于严重影响到网络的传输性能和流量控制策略,因 而己经受到了更为普遍的关注,正期待着更进步的结果。 t a q q u m d l 讨论了网络流量的多重分形特征。随后,国内学者陈惠民、蔡弘 等人通过研究基于业务的排队仿真说明,在缓冲不太大以及对信元丢失率要求 不高时,采用自相似建模( 如分数布朗运动) 得到的等效带宽与实际业务应分配 的带宽之间存在较大差异,说明仅采用自相似模型对高速网络环境( 如a t m ) 下的连接接纳控制等问题不够精确。他们进一步利用高阶矩对真实业务数据进行 粗粒化的分析结果表明,大量突发业务具有明显的多重分形的特征。 还有其他学者通过分析一种计算机网络元胞自动机模型【l ”,对网络内部结点 的整体行为进行了探讨。研究表明,在负载守恒的传输过程中,各网络结点的吞 吐量和缓存区的排队长度在空间和时问上均呈现幂率分布,承受系统中局部负载 的结点数变化的功率谱呈现l f f 噪声的特点,网络结点的行为表现出自组织临界 现象。排队长度的分布呈现幂率,预示着较大的拥塞以较小的概率发生,吞吐量 在时间上的分布呈现幂率,这为业务量呈现自相似性提供了一种或许合理的解 释。 此外还有许多相关的文章提到了网络社会行为、t c p i p 的混沌特性等论题, 为网络行为的研究增色不少。 高校校园网可以看作是整个i n t e m e t 的一个缩影,随着网络传输速率的提高 和各种新型应用的积极的发展,校园网络的复杂度也同时发生变化。新的网络 传递技术、新的网络环境和新型的网络应用的产生,使得定量研究校园网中主要 物理现象的规律,为校园网络技术的改进提供可靠的理论依据,已经成为一个急 待解决的问题。 目前,大多数高校在校园网络流量管理方面,往往停留在用流量统计分析工 具通过s n m p 协议对网络通信设备进行流量监测和记录日志,对流量行为的规 律没有进行深入分析。并且由于以太网和其它高速网络技术的发展,对流量分组 进行全测量几乎不可能,同时,大量的流量目志也使流量行为分析相当困难。针 对种种问题,本课题进行了一系列的研究工作,希望通过对校园网网络流量行为 的测量和分析,为整个校园网的管理提供决策支持,并通过此冰山一隅折射出 网络流量行为的测量分析与预测 c e m e t 中的许多实际问题。这对实现行为理论与具体网络应用的同步和互动发展 具有一定的意义,主要反映在以下几个方面: ( 1 ) 为校园网的科学管理、有效控制和合理利用提供科学依据 为了使校园网能够更好地服务于高校的工作学习,首先就要对校园网的行为 有足够的理解。理解网络的行为是一个具有挑战性且敏感的问题。通过对网络的 全面测量和分析,就可以较好的掌握网络的运行状况和运行规律,并在此基础上 对网络的各种行为进行模型化。然后,利用模型对网络建立有效的控制机制,继 而对其提出优化策略。 ( 2 ) 为今后校园网的定期、持久、大规模的测量与分析和实时动态监控系统的 建立奠定基础 为了科学和合理地利用校园网,必须随时掌握整个网络的运行动态。而掌握 其运行动态的前提则是对网络的定期、持久和大规模的测量与分析,建立对网络 的实时动态监控系统。在这种情况下,测量指标和测量方法就成为实现上述目标 的基础。 ( 3 ) 是科学规划未来的校园网络结构的重要基础 随着高校用户对i n t e m e t 需求的不断增加,网络连接和网络设备的不断复杂, 目前的网络逐渐变得越来越脆弱,科学规划未来的校园网络结构已成为校园网络 管理的一个重要内容和方向。对校园网络流量的测量和分析则是我们了解目前网 络不合理之处、为未来的校园网的建设提供良好建议的重要手段。 ( 4 ) 增强对c e m e t 网络行为测量和分析的能力 目前省内高校在这方面的工作基础比较薄弱,在这方面开展研究工作的机构 和人员较少,多数只是在小范围内的部分测量,而未对整个c e m e t 范围内的网络 运行情况开展相应的研究工作,因此对c e r n e t 的运行状况了解较少。通过开展对 校园网络流量行为测量和分析的研究,可以有效地增强我们对整个c e m e t 行为测 量和分析的能力。 1 2 本论文的研究工作 本课题的任务主要是通过设计开发新的流量行为研究平台,应用网络理论和 方法,采集和分析校园网络的流量数据,对网络流量行为开展基础性的研究工作。 4 网络流量行为的测量分析与预测 其中涉及了对流量新型测量方法的研究,对流量特征的分析和建立流量的预测模 型,主要包括以下四方面: ( 1 ) 研究平台的搭建 为了长期进行网络流量行为的研究,本人设计并建立了一个网络流量行为研 究平台,开发了种新型的流量采集工具,将流量数据的监测采集功能和对流量 数据进行的分析建模功能融入了一个整体的环境,在流量数据的采集和数据分析 之间建立互动的关系,使得数据的分析和理论的应用更为方便灵活。 ( 2 ) 数据的采集整理 利用开发的研究平台采集流经校园网公网出口的网络流量数据,分析和存储 数据;结合网络流量测量理论和泊松抽样理论,研究了被动测量方法和抽样方法; 并在采集过程中应用r f c 2 3 3 0 提出的泊松抽样方法,对产生的抽样间隔序列是 否呈泊松分布进行了误差检验。 f 3 ) 样本数据分析和分析结果的图形化 对存储到数据库的流量样本进行统计分析,研究了整个校园网网络应用的时 间、地理、协议、端口分布情况,从中发现校园网的使用规律。并把分析的结果 图形化,为网络管理提供决策支持。 f 4 ) 流量预测模型的建立和应用 运用时间序列分析理论分析流量数据,建立了流量季节比例预测模型,并应 用到当日流量的预测,将预测结果与实际流量进行比较。 1 3 论文结构及章节安排 第二章介绍了网络流量和网络行为学的相关理论,如流量研究的现状、i p 数 据包的结构、网络流量的突发性和自相似性,以及网络行为学这门新兴学科的概 念、研究内容、研究方法、研究环境等。 第三章介绍了流量行为研究的基础网络测量的概念及该领域的主要研 究内容,如测量实体、测量尺度、测量方式分类、测量工具的选择等。另外介绍 了抽样技术在流量测量中的应用。 第四章介绍了流量行为的分析预测方法的分类,并重点描述了确定时间序列 分析预测方法和回归分析预测方法。确定时间序列分析方法包括趋势变动预测模 网络流量行为的测量分析与预测 型和季节变动预测模型,回归分析预测方法包括一元回归分析和多元回归分析。 第五章以校园网络流量为实例阐述了流量行为研究的整个过程。先描述了流 量行为分析平台的搭建,包括系统的总体结构的设计和相关理论技术在各模块中 的应用。然后分析了实验结果,主要包括流量数据的各种统计分析结果和在此基 础上的图形化,以及流量预测模型的建立和实际应用。 第六章总结了本课题的研究成果,提出了以待进一步研究的内容。 6 网络流量行为的测量分析与预测 第二章网络流量与网络行为学 i n t e r n e t 的运行机制和行为特征的错综复杂,使得对互联网络的控制难以实 旋,网络行为研究的重要性日益突出。而由于互联网络的这种复杂的动态特性可 以通过网络所承载的网络流量来充分反映,故而网络流量也成为设计和分析网络 体系架构及通过实旌合适的流量控制、调度、整形机制来提高和改进互联网络性 能,深入了解网络行为规律的切入点。 2 1 网络流量 从网络体系架构来说,网络流量是切研究的基础。所有的对网络的应用和 网络本身的行为特点的研究都可以通过对网络流量的研究来获得。通过分析和研 究网络上所运载的流量特性,有可能提供一条有效的探索网络内部运行机制的途 径。网络流量能直接反映网络性能的好坏。在网络中,如果网络所接受的流量超 过它实际的运载能力,就会引起网络性能下降。吞吐量是表征网络性能的重要标 志。一个理想的网络应该接受所有提供的流量,直到它的最大吞吐量限额。然而 在实际的网络中,如果对网络流量控肯4 得不好或发生网络拥塞,将会导致网络吞 吐量下降,网络性能降低。如图2 1 所示。因此,为了使网络性能进一步改善, 必须要对网络流量进行研究,从中抽取能刻画网络流量特征的参数,并通过对网 络流量建模、模拟和性能分析,寻找可调控的性能参数,进而对流量实旌有效的 控制,从而改进和优化网络性能。 晕大 图2 a 网络流量与吞吐量的关系 由于网络流量在网络体系结构中的地位,越来越多的研究者转向网络流量的 研究,流量理论也越来越受到重视,2 0 0 1 年网络领域的十大研究热点,其中就 警察v酬岂忡 网络流量行为的测重分析与预测 包括网络流量的测量和分析。 2 1 1 流量研究的现状 i p 协议看起来很简单,i n t e r n e t 中不计其数的数据包似乎都在随机的发送, 但整体上能正常运行而且具有很强的商业竞争力,背后一定有深刻的道理。网络 界学者对网络动力学行为的研究还很不深入。近两年,美国n s f 支持图灵奖获 得者r k a r p 等学者,从事i n t e m e t 基础理论研究。值得指出的是美国b a r a b a si 等物理学者近年来在s c i e n c e ,p h y s i c sr e v i e wl e t t e r 等顶级刊物上发表数十篇关 于i n t e m e t 结构与动力学基础研究的论文,引起学术界较大反响。最近的研究结 果表明,互联网与万维网的节点链接不符合泊松分布而符合帕累托分布,节点连 接数的分布与节点总数无关,因此称为s c a l e f r e e 网,并且互联网与万维网都是 个小世界。互联网与万维网的s c a l f r e e 及小世界特征是由其演进的动态规律形成 的( 新的节点倾向于与已有较多链接的节点相连) 。实际存在于人类社会和生物界 的许多复杂网络,例如蛋白质折叠、演艺圈、论文署名作者和引用等都具有与 i n t e m e t 相同的特征。s c a l e f r e e 网络具有很强的容错性,但比随机形成的网络更 易受攻击,连接最密集的节点成为最易受攻击而导致网络瘫痪的瓶颈。建立 i n t e m e t 的初衷包括应对攻击,但网络的演进出乎创造者的意料。2 1 世纪是复杂 性世纪,深入理解复杂性的2 个层次结构与动力学是要面对的严峻挑战。在考 虑下一代网络体系结构时,必须要重视有关网络结构与动力学的基础理论研究。 传统的对i n t e m e t 特征的研究主要集中在流量工程方面;包括网络的性能和 网络的优化。近年来随着对i n t e m e t 的各种现象和特性研究的深入,发现i n t e m e t 中许多的现象存在着不可逆性和随机性,即在相同的初始条件下,并不能得到相 同的演化过程和结果。这种现象与著名物理学家p r i g o g i n e 提出的“耗散结 构”( d i s s i p a c t i v es t r u c t u r e ) 十分相近。造成这种复杂性的原因主要是i n t e m e t 是有 庞大数量级的相互影响的元素,通过不同物理特性的网络介质,依据不同的网络 协议组合到一起。众多的控制和功能又被附加在网络上,如拥塞控制,差错控制, 路由管理,服务质量控制等等。尤其对于下一代的i n t e m e t ,这种复杂性将更加 突出。耗散学说和混沌学说( c h a o s ) 揭示了复杂系统的整体的稳定性( 可重复性) 和不稳定性( 不可预测性) 的统一。这种复杂性也为新一代的网络行为学的研究提 型塑婆苎堑塑塑型苎坌塑量堕型 供了机遇和挑战。 网络中业务流的自相似( s e l c s i r n j l 撕t y ) 特性是复杂系统一个明显特征。网络 业务流自相似性的发现,广域网业务流传输的多重分形( m u l t i f r a c t 扪特征, i n t e m e t 网络拓扑的幂率缩放性都对网络行为研究和控制带来了深远的影响。这 些对网络本质特性的研究都属于网络行为学的研究范畴。网络行为的研究已经不 仅仅局限于流量工程的范围,它已经成为下一代网络的体系结构、网络安全研究 的基础。 当然,由于i n t e m e t 的复杂性,网络流量的研究仍然处在起步阶段,需要更 新的研究方法和更新的思路。 2 1 1i p 数据包结构 i p 是网际协议,是t c p 1 p 协议的核心。因为它向其他运行在i n t c m e t 层中 或i n t e m e t 之上的协议提供了数据传输服务。t c p i p 网络中的i p 就如同邮政服 务中的“标准信封”,在这个基本的、有效的传送机制中、任何种类的数据都能插 入到该“标准信封”中。由于它负责在复杂的网络环境中数据包的传送交换,因此 包含了大量与数据内容和传输相关的有意义信息( 如图2 2 ) ,这些信息会直接或 间接地反映网络状态,因而对网络行为的研究是非常重要的。下面将对球首部 中所包含的信息作一个详细的介绍。 版本鲁都长度服釜娄型息长度字节) 标识标志馈罄量 生存时间协议首都橙验和 酒i p 地址 目标口地址 选项 数据 图2 2 i p 数据包结构 9 网络流量行为的测量分析与预测 目前的协议版本号是4 ,因此i p 有时也称作i p v 4 。首部长度指的是首部占 3 2b i t 字的数目,包括任何选项。由于它是一个4 比特字段,因此,首部最长为 6 0 个字节。普通i p 数据报( 没有任何选择项) 字段的值是5 。 服务类型( t o s ) 字段包括一个3b i t 的优先权子字段( 现在己被忽略) ,4b i t 的t o s 子字段和1b i t 未用位,但必须置0 。4b i t 的t o s 分别代表:最小时延、 最大吞吐量、最高可靠性和最小费用。4b i t 中只能置其中1b i t 0 如果所有4b i t 均为0 ,那么就意味着是一般服务。不同的t o s 对应不同需求的网络传输服务。 t e l n e t 和r l o g i n 这两个交互应用要求最小的传输时延交互数据。因t o s 为10 0 0 , 另一方面,f t p 文件传输则要求有最大的吞吐量,对应t o s 为0 1 0 0 。现在大多 数的t c p i p 实现都不支持t o s 特性,但是自4 3 b s dr e n o 以后的新版系统都对 它进行了设置。另外,新的路由协议如o s p f 和i s i s 都能根据这些字段的值进 行路由决策。 总长度字段是指整个i p 数据报的长度,以字节为单位。利用首部长度字段 和总长度字段,就可以知道口数据报中数据内容的起始位置和长度。由于该字 段长1 6 比特,所以i p 数据报最长可达6 5 5 3 5 字节。当数据报被分片时,该字段 的值也随着变化。尽管可以传送一个长达6 5 5 3 5 字节的i p 数据报,但是大多数 的链路层都会对它进行分片。而且,主机也要求不能接收超过5 7 6 字节的数据报。 由于t c p 把用户数据分成若干片,因此一般来说这个限制不会影晌t c p 。总长 度字段是i p 首部中必要的内容,因为一些数据链路( 如以太网) 需要填充一些 数据以达到最小长度。尽管以太网的最小帧长为4 6 字节,但是d 数据可能会更 短。如果没有总长度字段,那么口层就不知道4 6 字节中有多少是礤数据报的 内容。 标识字段唯一地标识主机发送的每一份数据报。通常每发送一份报文它的值 就会加1 。r f c7 9 1 认为标识字段应该由让i p 发送数据报的上层来选择。假设有 t t l ( t u n e t o 1 i v 生存时间字段设置了数据报可以经过的最多路由器数。它指定 了数据报的生存时间。t t l 的初始值由源主机设置( 通常为3 2 或6 4 ) ,一旦经过 一个处理它的路由器,它的值就减去1 。当该字段的值为0 时,数据报就被丢弃, 并发送i c m p 报文通知源主机。 协议字段被口用来对数据报进行分用。根据它可以识别是哪个协议向p 传 1 0 网络流量行为的测量分析与预测 送数据。 首部检验和字段是根据i p 首部计算的检验和码。它不对首部后面的数据进 行计算。i c m p , g m p , u d p 和t c p 在它们各自的首部中均含有同时覆盖首部和 数据检验和码。为了计算一份数据报的i p 检验和,首先把检验和字段置为o 。 然后。对首部中每个1 6b i t 进行二进制反码求和( 整个首部看成是由一串t 6b i t 的字组成) ,结果存在检验和字段中。当收到一份口数据报后,同样对首部中每 个1 6 b i t 进行二进制反码的求和。由于接收方在计算过程中包含了发送方存在首 部中的检验和,因此,如果首部在传输过程中没有发生任何差错,那么接收方计 算的结果应该为全1 。如果结果不是全1 ( 即检验和错误) ,那么i p 就丢弃收到的 数据报。但是不生成差错报文,由上层去发现丢失的数据报并进行重传。 每一份口数据报都包含源口地址和目的口地址,它们都是3 2 b i t 的值。指 明了数据包的出发主机及要到达主机的名称,而真正的主机地址包含在以太帧的 硬件地址中。 最后一个字段是任选项,是数据报中的一个可变长的可选信息。这些任选项 定义如下: _ 安全和处理限制( 用于军事领域) 记录路径( 让每个路由器都记下它的i p 地址) 一 时间戳( 让每个路由器都记下它的p 地址和时间) _宽松的源站选路( 为数据报指定一系列必须经过的口地址) - 严格的源站选路( 与宽松的源站选路类似,但是要求只能经过指定的这 些地址,不能经过其他的地址) 。 这些选项很少被使用,并非所有的主机和路由器都支持这些选项。 选项字段一直都是以3 2 b i t 作为界限,在必要的时捩插入值为0 的填充字节。 这样就保证i p 首部始终是3 2b i t 的整数倍( 这是首部长度字段所要求的) 。 2 1 , 2 网络流量的突发往 局域网或任何计算机通信网的主要任务是为用户设备和进程提供通信路径。 用户设备所提供的业务量即流量的性质是决定网络性能的主要因素。 不幸的是,业务量的变化极大并受很多因素的影响。s t u c k 列出了大约二十 网络流量行为的测量分析与预测 多种局域网的业务及其典型的数据率的峰值变化范围由告警系统的1 0 0 b s 到无 压缩形视频的3 0 m b s ,即使撇开这两个业务量的极端值也不会减小速率的范围。 文件服务器块传送的速率为2 0 m b s ,而光学字符读出器的速率为2 4 k b s 。这两 种设备是未来有可能与局域网相连接的典型用户设备。倘若由一个有1 0 0 个节点 构成的局域网与典型用户设备相连接,则可以设想网络业务量变化之大。任何 个设备有可能长时间不工作,然后要求在一瞬间内提供很高的数据率,最高和最 低数据率之间的差别己经在前面指出了。昼夜之间肯定会出现差别,在不同间隔 时间内,如几周、几天、几小时或几秒钟之内的业务量平均值都会有很大差别。 总而言之,定义典型网络业务量的稳态分布是一个难题。 我们可以通过一个终端用户和一个计算机之间的对话的设想来获得有关局 域网的业务量性质的概念。f u c h s 和j a c k s o 3 0 】在考虑这种对话时,把由接续到拆 线的过程分为6 种间隔时间:空闲时间、计算机突发时间、思考时间( 即:用户对 计算机信息做出反应的时间) 、用户突发时间、用户字符问的间隔时间以及计算 机字符间的间隔时间,这种分割法具有直观的意义,尽管细节部分并不重要,但 比特流或字符流具有某种随机性的特征,故其结构是复杂的。 s h o c k 和h u p p 33 】从连接了1 2 0 多个设备的以太网样机中确定了几种数值分 布:抽样间隔时间分别为6 分钟和1 秒钟的负载、分组长度的分布和分组到达时 间如图2 - 3 。图2 3 以太网负载( 业务量) 波动情况( a ) 典型的日负载( 抽样时间间隔 6 分钟) ( b ) 在4 分钟内观察到的负载( 抽样时间间隔1 秒钟) 图2 3 中的a 表示负载 在2 4 小时内变化的曲线、抽样时间间隔为6 分钟;b 为在4 分钟内负载变化的 曲线,抽样时间间隔为1 秒钟。注意,从2 4 小时的宏观基础上和从4 分钟的微 观基础上看,业务量的起伏在长时间内接近但低于平均值,然后在一瞬间突增并 大大超过平均值。注意图a 中的整个抽样范围代表图b 中的某一个抽样点a 用户 通常以断续的方式使用网络,分组到达的间隔时间往往远远超过用户的传输时 间。这种负载变化叫做突发性变化。常见于计算机网络中的大部分业务。 面对业务量在某一时刻或某一段时间内变化悬殊的事实,要想根据某一特定 的业务量模式来设计网络是困难的。但突发式业务量的模式却颇具代表性a 例如, 信道访问技术的选择往往受这种业务量的影响,因此网络通常是根据它的要求而 设计的。 网络流量行为的测量分析与预测 垒 煎 霎嬲 一 oi nl 对衙f 十对, 1“八。 。,一一 2j4 一一( 分坤) 鳓 图2 3 以太网负载( 业务量) 波动情况 ( a ) 典型的日负载( 抽样时间间隔6 分钟) 在4 分钟内观察酗的负载( 抽样时闯闻隔1 秒种) 2 1 3 网络流量的自相似性 近年来,在通信领域中,由于自相似( s e l f - s i m i l a r ) 模型作为一种新的网络业 务模型比传统的业务模型更精确地描述了高速网络上的网络业务的本质特性,因 而引起了越来越多的关注。 在传统通信网( 如电话网) 业务中,常假设业务到达过程为p o i s s o n 过程,到 达间隔服从指数分布。在最初研究a t m 网络等高速网络时,也曾采用过此模型, 并且随着研究的深入逐渐引入了各种推广的p o i s s o n 过程和其它较为复杂的随机 模型,如马尔柯夫链、泊松过程、f l u i d f l o w 模型、p a c k e t - t r a i n 模型、批到达马 尔柯夫过程等等。这些模型的共同特点是所描述的业务序列具有短时相关性 ( s h o r tr a n g e d e p e n d e n c e ) ,即业务序列的自相关函数随序列间隔增大呈指数衰减 趋势。当时间标度增加时,统计上单位时间内得到的数据包数将趋于自噪声,所 以这些模型所表示的业务流在不同的时间标度下具有不同的特性。 垒盘t 百分搴 网络流量行为的测量分析与预测 1 9 9 3 年美国b e l l 实验室的研究人员在经过了三年( 1 9 8 9 1 9 9 2 ) 的对高速以太 网业务的测量和分析后,发现其业务具有统计上的自相似特性。他们用分形的思 想研究了网络上的真实业务,证明了聚集的网络业务是具有h u r s t 参数h 0 5 的自相似过程,从而是长相关的,即s = o o ,而个别的源发出的业务有n o a h 效应 ( 具有无穷方差的重尾分布) 。此后国外研究人员对局域网、v b rf t p ,w w w 以 及大型数据库等不同网络业务的传输进行了研究,发现这些业务都具有自相似特 性。在本课题中对校园网的网络业务进行了测量与分析,发现同样具有自相似性。 ( a ) 1 7 日2 4 小时的抽样流量时间变化 十 热 。 j _ i , + _ 7 疑b j “矗t - ,一= 芦 i 彪, ;1。堇l一计 j : _ i j y 强- : 。矧 _ _ :; f :l ;第 。l f i ;: 订 o , 附 ,。 ( b ) 1 7 日1 0 :0 0 1 1 :0 0 一小时内抽样流量时间变化 图2 4 网络流量自相似性示意图 图2 4 是我们在实验中取得的抽样流量形状图,b 图反映的6 0 分钟流量是取 自a 图中2 4 小时流量中的- 4 , 部分。从中可以看出两者具有十分相似的特点, 符合了自相似的特征。 自相似过程与传统的p o i s s o n 或m a r k o v 业务模型相比具有许多不同的统计性 质,其中最主要的一点是它能够反映业务流量在任意时间范围内的长相关特性。 突发业务的统计自相似性在大量视频业务的传输过程中也十分明显,而且对未来 1 4 网络流量行为的测量分析与预测 高速网络( 如删) 中多媒体的传输和流量控制具有重要影响。通常突发业务流的 h u r s t 系数在o 5 到l 之间,表示业务具有正的相关结构,h u r s t 系数越大说明业 务的突发程度越剧烈。由于自相似业务下网络性能与传统模型的结论有较大差 异,使得自相似业务下的性能评价、网络管理、拥塞控制、业务监管、协议设计、 a t m 交换机设计等研究都需要深入进行。 2 2 网络行为学 2 2 1 网络行为学概念 网络系统是由各种因素相互作用的结果,而网络行为是网络系统的表现。网 络行为是网络上各个因素相互作用后网络状态的对外表现,如同社会行为并不是 指某个人的举手投足一样。网络行为的概念并不是指网络的一个特定元素的行 为,它是网络中运作的许多因素互相发生联系,而使网络在宏观尺度上表现出来 的一种行为,就好比社会行为正是处在社会中的人群相互交往所体现出来的一种 整体上的现象或结果。 网络行为并不是线性的,简单的现象在网络中也许一个简单的微小的网络 设备发生故障就有可能导致一整片网络的瘫痪,某个用户多传输一些信息就有可 能数倍地增加网络的通信量,这种突变、突发的现象在网络中是客观存在的。诸 多网络问题也是因为一些网络元素看似不显著的变化导致的。这使得网络行为呈 现出了一种非线性的特征。网络行为还具有社会特征,网络与社会有着许多相似 之处,由于网络的使用者是人,与社会行为一样网络包含了入的许多行为特征; 另外网络上的各种协议以及网络设备的许多策略带有了社会行为中的许多特点, 如竞争、让步、共享、优先占用等特点,这使得网络行为还具有社会哥亍为的特征。 同时,网络行为有生命周期现象,有着类似生命体的新陈代谢现象,比如网络的 数据包有其生存周期,局域网内的数据通信量也有起伏的周期变化。对网络行为 的研究是不可缺少的,尤其是当网络成为一个复杂系统后,我们必须通过研究网 络行为来了解网络系统的宏观特征。许多网络现象的解释和网络问题的解决必须 依靠我们对网络行为的理解认识。 网络行为学是很新的研究领域,到现在,并没有一个对网络行为学的公认的 网络流量行为的测量分析与预测 定义。很多研究机构和研究人员试图从很多不同的角度来衡量和解释网络行为 学。这里只是从一些相关的角度来介绍网络行为和网络行为学。 网络行为可以一般性地理解为网络运行的动态变化规律。网络行为学的研究 重点就是网络的动态行为特性。这些动态行为特性的描述是建立在对静态指标 ( 不光是流量、时延,吞吐量也是重要指标) 的准确测量的基础上的系统的动态 性能的建模工作,可以利用网络行为的动态行为模型来预测和指导网络系统的优 化工作。此外,网络在故障状态下的行为和网络在遭受安全攻击时的行为也备受 关注。网络行为学的研究目标就是希望提出一种面向性能的高速互联网络的网络 行为框架,为以测量方法为基础的网络运行性能研究提供理论依据,并为有效仿 真大规模网络提供基础。总之,网络行为学研究的网络特征要在不同程度、不同 层次上反映网络的性能,用这些性能特征描述网络的的综合性能,尤其是给出定 量的描述,在投入大量资金进行网络建设之前,帮助网络技术人员在对网络设计 和规划作进一步的调整。 2 2 2 研究内容 网络行为的范畴包含网络

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论