(运筹学与控制论专业论文)网络行为研究.pdf_第1页
(运筹学与控制论专业论文)网络行为研究.pdf_第2页
(运筹学与控制论专业论文)网络行为研究.pdf_第3页
(运筹学与控制论专业论文)网络行为研究.pdf_第4页
(运筹学与控制论专业论文)网络行为研究.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学位论文独创性声明 本人郑重声明: 1 、坚持以“求实、创新”的科学精神从事研究工作。 2 、本论文是我个人在导师指导下进行的研究工作和取得的研究 成果。 3 、本论文中除引文外,所有实验、数据和有关材料均是真实的。 4 、本论文中除引文和致谢的内容外,不包含其他人或其它机构 已经发表或撰写过的研究成果- 5 、其他同志对本研究所做的贡献均已在论文中作了声明并表示 了谢意。 作者签名:盍叁亟 日 期;麴! 主生驾 学位论文使用授权声明 本人完全了解南京师范大学有关保留、使用学位论文的规定,学 校有权保留学位论文并向国家主管部门或其指定机构送交论文的电 子版和纸质版:有权将学位论文用于非赢利目的的少量复制并允许论 文进入学校图书馆被查阅;有权将学位论文的内容编入有关数据库进 行检索;有权将学位论文的标题和摘要汇编出版。保密的学位论文在 解密后适用本规定。 作者签名:查茔莲 日期:地! 妄:芏2 1 摘要 随着网络的快速发展,应用范围的不断扩大,网络安全问题越来越严重, 这就需要人们从宏观上把握网络行为,预测网络运行的情况,从而发现网络行为 的运行规律,提高网络的安全和服务性能。 网络测量是研究网络行为的基础。本文分析了网络测量的性能度量、测量 的体系结构和研究现状、网络测量方法及测量工具。并且深入研究归纳了网络行 为分析的几种技术:如统计法、单光谱分析( s s a ) 法、网络层析法和模型法,并且 指出它们的优势和不足。本文根据网络行为受多种因素的影响和它们之间的耦台 程度,提出用多分布主体代理的径向基函数来分析网络行为,并通过实验仿真验 证了该方法的可行性。在此基础上研究了建立大规模网络行为测量平台需要注意 的几个关键问题,例如网络业务模型、最佳测试点选择理论、测量主机间时钟同 步技术等。提出了一个大规模的网络行为测量平台的通用框架,并且指出了大规 模理想网络行为测量平台应具有的特征。 最后,对本文的工作进行了总结并指出了以后的研究方向。 关键诃:网络测量、多分布主体代理、径向基函数、网络行为测量平台 a b s t r a c t a st h ei n t e r n e tg r o w si ns c a l ea n da p p l i c a t i o n si se n l a r g e dc o n t i n u e s n e t w o r ks e c u r i t y p r o b l e m sh a v em o r ea n dm o r es e v e r e d w h i c hr e q u i r e sp e o p l eh o l dn e t w o r kb e h a v i o ra sa w h o l e 。i nt h i sw a y s ,w ew i l lh a v eaa b i l i t yt of o r e c a s tt h ef u t u r en e t w o r kb e h a v i o ra n df i n d n e t w o r kr u l e si no r d e rt oi m p r o v en e t w o r ks e c u r i t ya n dq u a l i t yo f s e r v i c e s t h em e a s u r e m e n to f n e t w o r ki st h eb a s eo f t h es t u d yo f n e t w o r kb e h a v i o r , i nt h i sp a p e r , t h e d e t a i lo f n e t w o r km e a s u r e m e n ta r cd i s c u s s e d ,w h i c hi n c l u d em e t r i c 、m e t h o d s 、i n f r a s t r u c t o ma n d m e a s u r e m e n tt o o l s 。t h ep a p e rd i s c u s s e s d e e p l ys e v e r a lt e c h n o l o g i e so fa n a l 蜘n gn e t w o r k b e h a v i o r s ,s u c ha s :s t a t i s t i c a lm e t h o d 、s i n g u l a r - s p e c m a nm e t h o d 、n e t w o r kt o m o g r a p h ym e t h o d a n dn e t w o r km o d e l i n gm e t h o d ,i n v e s t i g a t e st h ec h a r a c t e r i s t i co ft h e s em e t h o d sa n dp o i n to u tt h e s t r o n g p o i n t sa n dt h ed i s a d v a n t a g e sr e s p e c t i v e l y 。b a s e do nm u l t i - d i s t r i b u t ea g e n tr a d i a lb a s i c f u n c t i o nn e u r a ln e tt h i sp a p e rp u t sf o r w m - dan g w w a yo f n e t w o r kb e h a v i o ra n a l y s i s 。f u r t h e r m o r e , t h i sp a p e rs t u d i e sh o wt oe s t a b l i s hal a r g e s c a l en e t w o r kb e h a v i o rm e a s u r e m e n tp l a t f o r ma n d s e v e r a lk e yi s s u e ss h o u l db er e e o g n i t i o n e d ,s u c ha s :m o d e l i n go ft r a f f i c 、c h o i c eo fm e a s u r i n g p o i n t s 、a n dr e m o v a lo f c l o c ks k e w a n d p r e s e n t a u n i v e r s a l f l a m e 。a t l a s t , t h ec h a r a c t e r i s t i c so f a l a r g e - s c a l en e t w o r kb e h a v i o rm e a s u r e m e n tp l a t f o r mi sp o i n t e do u t 。 i nt h ee n d ,t h i sp a p e rs u m m a r i z e st h ew o r ka n dp o i n t so u tt h ei n v e s t i g a t i o nd i r e c t i o no ft h e f u t u r e 。 k e y w o r d :n e t w o r km e a s u r e m e n t 、m u l t i - d i s t r i b u t ea g e m 、r a d i a lb a s i cf u n c t i o nn e u r a ln e t 、 l a r g e - s c a l en e t w o r kb e h a v i o rm e a s u r e m e n tp l a t f o r m 2 日u 吾 随着网络的飞速发展,网络己在经济、文化、政治、军事等方面对人类社 会产生了非常广泛深远的影响。用户与网络应用的飞速增长对网络性能提出了更 高的要求,而利用日新月异的网络技术构建更加安全高效和稳定的计算机网络是 必有之路。分析网络行为有助于了解网络的实际运行状态,而网络行为测量是分 析网络行为的前提和基础。国外在网络行为测量的方法、工具以及网络基础设施 框架和流量的测量模型等方面已构成框架,而国内刚刚起步。网络行为研究在这 种背景下应运而生,本论文课题受到“十五”“2 1 l 工程”重点学科项目“信息安 全保密技术与相关数学研究”支持,系该项目的阶段性研究成果。 以前大多数研究机构将重点停留在网络流量、网络风暴等网络局部行为的分 析与处理上,缺乏从宏观角度来分析把握网络运行实时状态、历史记录以及发展 趋势的手段、方法和模型。 现在安全网络解决方案已经将网络行为模型整合进去,不再拘泥于探测工具 的开发,网络行为模型将是目前亟待研究的重点。规模不同的网络具有不同类型 的常规行为、异常行为、和模糊行为,只有将这些典型网络结构和相应的各种类 型行为特征分析清楚,才能构造出高效相宜的网络行为模型。目前流量类型种类 繁多,但还没有成熟的网络行为综合模型。 本文首先介绍了网络测量的意义、国内外重要的测量体系结构、性能度量、 网络测量的方法和测量工具。并且深入研究归纳了网络行为分析的几种技术,如: 统计法、单光谱分析( s s a ) 法、网络层析法和模型法,其中单光谱分析( s s a ) 法、 网络层析法和模型法是本领域研究前沿动态方法,并且指出各种技术的优势和不 足。 本文根据网络行为受多种因素的影响和它们之间的耦合程度,提出用多分布 主体代理的径向基函数来分析网络行为。径向基函数神经网络r b f ( r a d i a lb a s i s f u n c t i o nn e u r a ln e t w o r k ) 产生具有很强的生物学背景。在人的大脑皮层区域中, 局部调节及交叠的感受域是人脑反应的特点。r b f 网络具有良好的逼近任意非线 性函数的能力及表达系统内在的难以解析的规律性的能力,并且具有极快的学习 收敛速度。r b f 神经网络具有很强的自我学习能力,系统可在学习过程中不断完善 自已,具有创新特点。 r b f 网络在结构上是一种三层前向网络;第l 层为输入层,第2 层为隐含层,第3 层为输出层。其中输入层和隐含层之间没有连接权,隐单元的变换函数是一种局 部分布的非负非线性函数,对中心点径向对称衰减其单元数由所描述问题的需要 确定隐含层输出函数用高斯基函数。网络的输出是隐单元输出的线性加权,因为 它是最常用的一种形式,比较简单,它实现由输入层到输出层的映射。r b f 网络的 训练过程采用基于梯度下降的误差纠正算法来监督学习方法去训练网络,调整 q 、4 和厶( 与o f 有关) ,当网络的最终输出误差满足精度要求时训练停止,即: :昙量e 。为辨识精度,删是 空间q 上一范数,p ( u ) 和p ( u ) 分别是实际系统和网络模型对于u 输出响应。定义 e = y ,通过辨识确定刍,使得:m i n = m i n y 。神经网络用于系统辨识的实 质就是选择一适当的神经网络模型来逼近实际系统,即s m 为神经网络模型 类,p es m 为神经网络。 2 l u ( t ) y d ( t ) 图4 1 神经网络识别原理 4 1 2 径向基函数神经网络识别结构 上 径向基函数神经网络产生具有很强的生物学背景。在人的大脑皮层区域中, 局部调节及交叠的感受域是人脑反应的特点。r b f 网络具有良好的逼近任意非线 性函数的能力及表达系统内在的难以解析的规律性的能力,并且具有极快的学习 收敛速度。r b f 神经网络具有很强的自我学习能力,系统可在学习过程中不断完 善自已,具有创新特点。 r b f 网络的学习过程为每次自动生成一个r b f 神经元和调整响应的网络权重, 这样不断的增加r b f 神经数目和调整全重,直至到达要求的误差指标和最大的训 练步数为止对于n 的输入和一个输出之间的映射关系为“ n f r = 九。+ 九;巾i i x c i ( 1 ) i - i 本文构造的r b f 网络在结构上是一种三层前向网络: 第1 层为输入层,输入层节点只传递输入信号到隐层,输入向量的各个分量 被无改变地传送到每一个隐层节点。 第2 层为隐含层,隐含层节点由高斯函数构成,本文隐含层输出函数用高斯 基函数的理由是: l 、表示形式简单,即使对于多变量输出也不增加太多的复杂性: 2 、径向对称; 3 、光滑性好,任意阶导数均存在; 4 、由于该基函数表示简单,解析性好,因而便于进行理论分析。 第3 层为输出层,网络的输出是隐单元输出的线性加权,因为它是最常用的 一种形式,比较简单,它实现由输入层到输出层的映射。 径向基函数神经网络为图4 2 示: 输入层隐含层 输出层 w m 图4 2 径向基函数神经网络 隐含层输出函数用高斯基函数r ( x ) ;e x p ( 一专| ! ( 2 ) 对于一个n 维输入m 个隐含层单元的网络,可以得出对于某个输入样本 x = f x l ,x 2 ,x n 】t 的网络输出为: a 。= r 。( x ) = r ;( - l l x c ;i | ,6 ;) ,i = 1 , 2 ,m ( 3 ) x 为输入样本,d j 为第i 个隐含层的中心向量。 6 l 是控制径向基函数宽度的规范化常量也是规划因子,决定着高斯函数的形状, 也决定了该中心点对应的基函数的作用范围。 f | | | 是范德蒙函数。 网络输出节点输出值为: 可:连接权 f = 面;旺j ( x ) 4 1 3 r b f 网络的训练过程 i = 1 ,m ( 4 ) r b f 网络的训练过程见文献1 ”,构造和训练一个r b f 爵络就是要使它通过学 习,确定出每个隐层神经元基函数的中心、宽度6 。以及隐层到输入层的权值面这 些参数的过程。 本文采用基于梯度下降的误差纠正算法来监督学习方法去训练网络1 引。 考虑网络为单变量输出,定义目标函数:= 导e : j i i ( 5 ) 式中n 为训练样本数,j 为误差信号; 由下式定义: e j = d 一巧( x ) ( 6 ) 求取网络的参数 1 隐含层到输出层的线性权m 器嘻e j ( n ) a i ( x ) ( 7 ) 州n + l 细( n “h 器i = 1 ,m ( 8 ) 2 基函数中心仃 器- 2 叫静n ) a i ( x 【x _ 删j ( 9 ) 。( + 1 ) 卸i ( n m 器 ( 1 0 ) = i n i 3 方差6 器一喇静蚋) q j ; ( 1 1 ) q i i = 【x 一仃i ( n ) l 【x o - i ( n ) 1 7( 1 2 ) 6 阳+ 1 ) = 6 i ( n ) - u 器 ( 1 3 ) 其中t 1 ,九是三个参数的学习步长,它们的取值是不同的。 用连续时间段内测量网络的带宽、平均时延、抖动、丢失率数据反童训练r b f 网络,调整q 、毒和i 1 ( 与巧有关) ,当网络的最终输出误差满足精度要求时训 练停止,即: = t s ( 1 4 ) - j = l 式中: 网络最终输出系统误差: n 网络测量的样本数; 系统误差允许值。 4 1 4 舳f 网络 f 程序初始化 i 读入训练后的网络结构 上 输入数据模式( 带宽、平均时延、抖动) 上 计算输出层的输出 上 计算误差 上 调节个层的权值、基函数中心、方差 n 人 结束 图4 3 r b f 网络流程图 4 1 5 本文r b f 网络存在的闯题及以后研究现状 虽然r b f 网络作为一种性能较好的前向型神经网络,具有全局逼近和最佳拟 合的性能,且不存在局部最优问题,但是还存在许多有待解决的问题,主要有: l 、含层神经元的激化函数,径向基函数的中心选取问题,r b f 的中心对于该 类神经网络至关重要,尤其在仿真应用中,它对网络的学习速度及性能影响较大, 对合理的中心选取问题还有待研究。 2 、如何有效地确定r b f 网络中的参数问题,这些参数包含隐含层的结点数 量、每个结点中激活函数、径向基函数的中心和宽度、以及隐含层结点到输出层 结点的连接权向量面。 3 、对神经网络进行监督训练的过程中,对每个训练样本赋予一个基函数,这 种方法对存储空间的需求量和参数的个数代价太高,并且可能导致过分训练情 况。 4 2 多主体代理框架 为了更好的提高算法的效率,可以采用分布式多主体技术,因为算法的组件 离信息源较远,算法会无数次的远程访问信息,这就导致了时延。而通过分布式算 法组件,就很大的提高了网络的效率。用这种方法,每个算法组件有效的存取本地 的信息源,并且算法组件联合起来通过有限系统相互通信共同解决全部问题。 根据这个原理,把庞大的复杂异构的网络结构分成几个子网络,在每个子网 络中设置代理,每个代理都运行统一的径向基函数神经网络( r b f ) 算法。用这种方 式方面可以减少径向基函数神经网络( r b f ) 算法的复杂性,另一方面可以提高 算法的性能。代理要考虑网络性能和它的结构,以及在隐含层神经网络元的数量 和每个径向基函数神经网络算法的参数。每个代理既是独立的单元,又可相互协 作,共同来宠成一项任务。例如把一个网络分成四个子网络,主体代理的结构为 图4 4 示。 永黾一和 4 3 代理的结构 璺4 4 主体代理的结构模型 接口模块:实施两个功能,一方面它在代理和用户之间起到一个媒介的作用, 另一方面在代理之间相互协调,来完成任务。 数据库模块:数据库模块是从本地子网络收集性能数据,数据库的优点是能 够通过一个查询命令检索任意一个数据子集,可以方便地生成那些组成训练集合 的数据。 规则库模块:是系统中保存和不断增添已发现的异常网络行为,它记录了各 种异常网络行为的特征。 协调模块:使不同模块间能够通信。 分析模块:是用径向基函数神经网络r b f 对本地数据库的信息源进行分析处 理,并且把分析处理的结果与规则库模块信息匹配,判断网络运行是否正常的。径 向基函数神经网络r b f 有学习的能力,它可以发现新的异常网络行为的特征,并 且及时的把它新发现的异常网络行为特征增添到规则库中。如图4 5 代理的结构 模型: 4 4 小结 圈4 5 代理的结构模型圈 本文提出了用多分布主体代理的径向基函数来分析网络行为。此模型的优点 是算法比较简单,具有智能自我学习和识别的作用,可以预测网络行为,从而可以 有效的控制网络拥塞,提高网络性能。 用多分布主体代理的径向基函数一方面提高算法的性能,另一方面提高了对 网络性能数据分析的速度,减少了径向基函数神经网络自我学习的时间,对网络 行为的判断精确度比较高。 第五章实验仿真 5 1 实验仿真的流程图 下面是本文实验仿真的整个流程图: 扶网络 采集样 本 输入数ll 样本归ii 用r b f 据预处r 叫一化处 _ 叫训练网 叫i 兰jl 5 2 测量数据的采集 模型训练结 果评价 参考文献“实验方法与环境选择往返延时作为测量对象可反映路径双向的 传输能力和在一定时间范围内路径平均阻塞状况,且不存在单向钡4 量由于主机时 钟不同步造成的测量偏差,往返测量的延时精度已经可以满足分析路径总体性能 和稳定性的要求。所以,这里选取中科院计算所( i c t ) 测量主机,经中科院 c s t n e t ,跨越中国高速互联研究实验网,到中国教育科研网c e r n e t l 3 个高校w w w 服务器的路径作为试验对象,路径跳数在1 3 1 7 之间,使用f p i n g 并发测量各路 径的每5 0 0 m s 往返延时。并在校园网中设置三个代理,从数据库中取出带宽、时 延、丢包、流量性能数据。把这些数据分为两组样本一组有3 0 个样本作为训练 r b f 神经网络另外一组有l o 个作为测试训练后的神经网络。 s 3 分析前的预处理 为了更好的了解分析网络的性能,应该建立规则库。它包含正常的网络行为 和异常的网络行为。与相同i p 地址的多个t e l n e t 会话不成功,在同一个i p 地址 内会话时延的提高,连续的p i n g 都跳到一个特定的i p 地址等都是网络的异常行 为。对规则库的描述离不开分析从网络上收集的网络性能数据。 把从网络上收集到的原始数据集应用于神经网络r b f 前,经过了二级预处理 2 0 1 第一级预处理从可得到的数据集中获取描述数据包的典型数据:协议标识、 源地址、目的地址、源端口号、目的端口号、和原始数据。同时计算数据包到达 时刻的主枫性能数据、网络带宽、时延和系统的利用率等。 由于许多网络行为是一段时间内连续作用的结果,因此第二级预处理进行统 计基于连续时间序列网络行为中的关联数据,并对连续网络行为进行实时化处 理。例如,统计从时刻t l 至时刻t 2 数据包的源地址是否相同,统计的结果作为 时刻数据保存。其中的统计时间窗口是一个可变滑动窗口。 5 4 样本数据的归一化 所谓归一化,就是将具有不同区间的样本向量的各个分量化到相同的区间, 从而使样本的各个分量具有相同的尺度,网络是通过调整各个权值的大小以保证 能学习到变量相对的重要性,若输入变量之间幅值相差很大,使得网络完成学习 时权值之间的大小相差亦很大。所以归一化在神经网络的训练中有重要的作用。 为了便于训练,需将样本的输入输出数据均限定在 0 ,1 区间内,x ? 为第i 个样本 第p 个单元的输入值,x i , m u ,x 佃。分别为第i 个样本输入的最大和最小值 x k 茎二垫! 1 1 啊n x “m i n ,规范化的输出值域仍在 0 ,1 之间但不包括。和l 。 5 5 用径向基函数神经网络工具仿真模型 输入层神经元数就是3 个,则网络的输入模式向量x i2 x t ,x :,x 。j i = l ,3 0 它们分别是带宽、时延、吞吐量,本文设置期望向量为l ,它反应 网络的服务性能是良好的。 i a t l a b 的神经网络工具箱为基函数网络的仿真提供了丰富的函数,取径向 基函数初始权值和阈值用m a t l a b 语言中的r a n d 0 函数随机赋值后的最大训练 次数为8 0 0 次,选取控制误差取为0 0 0 i 。 5 6 模型训练结果的评价 以s s e ( s u m - s q u a r e de r r o r ) 、识别率d r ( d i s c e r n i n gr a t e ) 平均相对误差 a e ( a v e r a g ee r r o r ) 作为训练评价标准。 1n = ( d e ( i ) ) 2 ( 5 6 ,1 ) i - - i n 为训练样本,d 为样本的期望输出,本文设置样本的期望输出为1 : 巧为第j 个样本的实际输出; 若满足相对误i ( d j - v ;) i d j i 1 0 0 0 , 0 d 0 ,t 哼,0 p 1 j 瞰) l _ 。 ( 2 ) ( 3 ) ( 4 ) 长相关进程的自相关函数p ( t ) 的绝对值,相对于短相关进程( s h o r t r a n g e d e p e n d e n c ep r o c e s s e s ) 不收敛的。 自相似网络流量平台时间序列的例子在图6 1 中展示,在图6 2 中展示自相 关函数在更大的时间转化t 2 2 1 并不收敛于零,例如,长相关进程中s t e mf r o m 被给 的测量。 l l 图6 1 长相关进程 总之,随着对网络业务的不断认识,网络业务模型,尤其是能够描述长相关 性的模型,不断被提出。尽管每个流量模型在今后的很长时间里,仍会被使用和 研究。今后的业务分析,会向兼顾网络业务模型的短相关性和长相关性两方面, 都需要对已有的模型改进或寻求新的模型。f a r i m a ( p ,d ,q ) 模型是具有这种能力的 模型之一,采用分形反滤波( 分数差分) 、后向预报和参数粗估计同参数精确估计 相结合的方法,对模型的拟和过程进行了简化,j 提高了网络业务的真实性和有效 性。缺点是比较复杂,计算量比较大。 6 1 1 2 自相似进程 图6 2 自相似进程 自相似首先意味着在不同的比例时间序列中的相似性2 4 t 2 引,另外相似性 也受限于时间序列分布的相似,网络流量平台被认为是第二种的自相似性如图 6 2 。 通过生成具有自相似性的业务进行仿真研究,是目前一种有效的研究方法, 它能更真实地描述网络业务特性。生成自相似业务的方法有很多种,例如基于分 形噪声和分形布朗运动的业务生成方法,g a r r e t t 等利用f a r i m a 模型产生渐进自 相似过程等。对于连续时间情况下平稳的自相似过程,可用f o n ( 分数高斯噪声, f r a c t i o n a lg a s s u i a nn o i s e ) 模型分析,它是马尔可夫型随机过程的改进。其特 点是自相似函数经过m 阶叠加后,相关函数结构上是非退化的。 缺点:当然,并非所有网络流在任何情况下都具有明显的自相似特征模型。由 于自相似问题的数学分析具有固有的难度,目前的研究仍以仿真、测量和数值方 法为主。 6 1 2 最佳测试点选择理论 主动测量需发送测试包,并根据测试包所携带的信息来推测网络的情况。如 发送太多的测试包,将会给网络造成很大的负担。如何选择路由器的数目及位置, 使测量行为信息的传递带给网络的额外负载较少? 这个问题就可以转化为最佳 测量点的选择问题。测量点选择的原则是尽量选择能够提供较大网络行为信息的 测量点,使测量路径代价最短,尽可能保证网络上每条链路的利用率较高。同时 还要考虑通往路径满足相关的时延限制,满足其它的服务质量请求。 在测量点建立数学模型时,可以用递推的方法不断地精炼候选空间,然后再 进一步指导测量。递推算法优点是算法较简单,缺点是计算量大。 也可用遗传算法来求解。遗传算法是一种基于自然选择和自然遗传等生物进 化机制的搜索算法,具有很强的鲁棒性、并行性。通过个体的复制、交叉和变异, 遗传算法能以较大的概率找到全局最优解。 6 1 3 测量主机间时钟同步技术 两端主机在测量初始时刻,时间不同且按不同的频率运行,即时钟不同步容 易产生时钟频率偏差。它是造成了网络行为测量有误差的主要来源之一。 例如:测量获得的时延为测得时延( m e a s u r e dd e l a y ) ,称实际的时延为真实 时延( t r u ed e l 8 y ) 。定义测量样点集为n 2 v t2 ( t l ,d i ) 2 l ,n ,其中,t l 是发 送主机在发送时刻为该数据包打上的时间戳,q i 为测得时延,即接受者接受时刻 减去发送时间戳,它不是真实时延。通常,两终端主机在测量初始时刻时间不同, 且按照不同的频率运行,称频率之差为时钟频率偏差( c l o c ks h e w ) 。如果两主机 的时钟完全同步( 初始时刻和频率都相同) ,则测得时延就等于真实时延。减少这 种时延误差可通过把测量数据分区处理,v e r np a x s o n 利用在一对节点之间进行 正向,反向时延测量来确定收发时钟的误差,包括相对偏移( r e l a t i v eo f f s e t ) 和频差( s k e w ) 。s u eb m o o n 等提出了基于线性规划的算法,线性规划算法比其 它的算法较稳定,易于实现“。 测量主机间时钟同步是端到端测量重要的技术基础,以往的时钟同步技术, 大都利用g p s 或p s t n 、c d m a 等网络借助外部时钟源来实现测量主机问同步。这 种技术精度高,但费用昂贵且在测量主机数量大时难于实现,无法满足大规模端 到端测量的需要。在广域网上,n t p 协议只能到达几十毫秒量级的精度,这个误差 利于时廷测量而言不可接受。主机时钟同步与单向时延测量研究密切相关,端到 端双向时延测量可通过环回时延r t t ( r o u n dt r i pt i m e ) 获得,但端到端单向时延 测量却需要两端主机测时钟同步。 6 。2 网络行为的建模环境的设计和实现 网络行为建模环境主要实现网络数据采集和网络行为理论分析两大功能。网 络数据监测采集功能:选择所研究的网络环境,从网络中采集并过滤原始信息存 储样板数据,数据后处理等。 网络行为理论分析功能:数据模型和形式转换,选择理论分析模型及算法, 建模及比较等。 这两大功能模块互相协调工作,通过理论分析的结论帮助确定或调整系统的 检测方法,同时通过检测到的样本数据确定分析的理论模型和算法。 大规模的网络测量主要依赖于网络测量工具和网络测量平台,是通过收集、 分配和分析性能数据或包轨迹来研究具体的网络和应用,后者为网络测量工具的 完整和有效性的利用提供了环境。以至于动态性质和可以用更加方便的方法开发 和分析大规模的网络规则和网络应用。 6 3 建立一个通用的网络行为模型平台的框架 尽管许多网络测量框架被提出,它可以根据为具体的测量工具和为大规模的 测量被分类。可以预测工具和网络测量平台在将来会提高并且功能更强大提出 个建立一个通用的网络行为测量平台的框架,这个通用的测量平台由测量模块、 数据管理模块、数据处理模块、数据库模块和可视化服务模块组成如图6 3 。 可视化服务模块 t 数据处理模块 下土 数据管理模块 测量模块 图6 3 通用的大规模的网络行为测量平台 ( 一) 测量模块中运行着许多测量工具,测量模块可以很容易根据网络的特点选择 合适的工具,用一种或几种工具从网络中采集数据,并这些数据放到数据管理模 块中。 ( 二) 数据管理模块的功能: l 、把这些数据分类处理,例如可以按照数据包的源或目的地址来分类。 2 、把分类的数据放到数据处理模块中,由数据处理模块来分析处理,并且接收从 数据处理模块中分析的结果,把它放到数据库模块中。 ( 三) 数据处理模块由许多网络行为的分析算法组成,数据处理模块首先对这些数 据进行分析,然后选择合适一个或者多个算法的结合对数据进行处理,并把分析 结果放到数据库中和数据管理模块中,并由数据管理模块把分析结果传送到用户 服务模块中。 ( 四) 可视化服务模块搜集经过分析处理的网络测量资源的状态信息,并把网络的 性能状况报告给用户,以用户很容易直观上做出判断的形式显示出来。这样当网 络性能状况下降时,管理员可以很容易纠正病态网络,并且尽快的提高网络性能。 ( 五) 数据库模块放着许多网络行为的规则。 6 4 大规模理想网络行为测量平台应具有特征 对理论做这么多的研究,最终目的是把理论应用到实践,根据用户不同的需 求建立模型平台。大规模网络测量平台将工作于一个具有松散耦合结构的环境, 大规模网络测量平台是基于网络的分布式应用系统,各个模块之间需要彼此的协 作和进行数据交换。这种模型平台可以有效实现计算和资源共享等问题。它的缺 点是结构比较复杂。大规模理想网络行为测量平台应具有以下特征: 1 、自治性:对自己的行为和内部状态有一定的控制权。 2 、主动性:传统的应用程序是受用户指令而被动执行的,而它的行为应该 是在感知周围环境的变化后的主动行为。 3 、推理陛:_ | 通过不断的自我学习,可根据已有的知识和经验,刺接触的 新的知识作出推理或推测。 从上述特征可以看到,网络行为测量平台在一定程度上模拟了人类的行为和 关系,具有一定的智能并能够自主运行和提供相应服务。由于其极大的灵活性和 适应性,它更加适合开放、动态的现实环境a 大型网络行为测量平台的智能作用可以通过几种模型来实现: 1 、基于规则的模型:这种模型主要是根据以往的经验,将其归纳成规则,并 通过规则推理来进行分析。这种方法速度较快,比较简单。缺点是规则知识的确 立比较困难,不适合复杂的异构网络。 2 、基于神经网络的模型:神经网络具有很强的自适应和学习能力、鲁棒性和 容错能力。b p 具备分析大量数据的能力,即使这些数据是非线性结构化的,不完 全或是含有噪音的。b p 神经网络对含噪数据和不完全数据的处理能力以及进行非 线性分析的能力比较强。它的缺点是算法复杂、收敛速度慢,在某些情况下还会 遇到“局部极小值”问题。对它的改进工作是模块化神经网络,它的思想就是用 多个相对简单的网络模块以一定的关系协同运作来处理一个大规模问题,这一策 略因其在应用中的有效性而越来越受到重视。 3 、基于机器学习的智能模型:智能系统的核心问题是它的学习能力。知识的 自动获取一直是智能行为测量系统中的难点。解决知识获取问题的途径是机器学 习,即让机器自身具有获取知识的能力,能在实际工作中不断总结成功和失败的 经验教训,对知识库中的知识自动进行调整和修改,以丰富和完善系统的知识。 “缺点是对模型的设计比较困难。 这几种模型各有其适用范围,存在许多问题有待解决和研究。 6 5 小结 研究了建立大规模的网络行为测量平台需要注意的几个问题,提出了通用的 网络行为测量框架,并指出了理想的智能的大规模的网络行为测量平台可以通过 规则模块、神经网络模块、机器学习的智能模块来实现。 4 0 结束 随着网络的飞速发展,网络已在经济、文化、政治、军事等方面对人类社会 产生了非常广泛深远的影响。网络已经越来越成为人类社会的一个非常重要的框 架,然而网络复杂的框架和个体n s p 内部利益的冲突阻碍了网络的进化,对整个 网络行为的研究对我们来讲是非常必要的。网络行为研究在这种背景下应运而 生。它已经成为人们了解网络、管理网络、更好的使用网络的重要手段,并正在 成为计算机网络领域的一个重要研究分枝。本论文课题受到“十五”“2 1 1 工程” 重点学科项目“信息安全保密技术与相关数学研究”支持,系该项目的阶段性研 究成果。 本文的主要工作和特点主要表现在以下几个方面: 1 、本文详细分析了网络测量意义、网络性能度量、国内外重用的测量体系 结构、测量方法和测量工具。 2 、深入研究归纳了网络行为分析的几种技术,如统计法、单光谱分析( s s a ) 法、网络层析法、模型法,并且指出各种技术的优势和不足。 3 、本文根据网络行为受多种因素的影响,它们之间的耦合又是那么紧密,提 出用多分布主体代理的径向基函数来分析网络行为。并通过实验仿真证明了实验 的可行性。 4 、并进一步的研究了建立大规模的网络行为模型平台,本文分析了网络行为 模型需要注意的几个关键问题像网络业务模型、最佳测试点选择理论、测量主机 间时钟同步技术。提出了一个大规模的网络行为模型平台的通用框架。 对后续工作的设想和改进工作 在做好基础研究的基础上借鉴和引入新的思想和新的方法,拓展思路,有效 地1 人识删控制计算机网络。基础研究包括种经网络算法、人工智能算法、免疫算 法等相关算法和数学模型,把他们容入大规模的网络行为测量中。 在建立大规模的网络行为测量平台中,使用户界面友好、具有可扩展性,各个 测量点独立又协同的工作模式以及完善的安全机制都是今后研究中必须要考虑 并且要深入研究的关键点。 4 l 参考文献 1 m a r k c o a t e s a l f r e d o ,h e r oi i i ,r o b e r t n o w a k a n db i nr ui n t e r n e t t o m o g r a p h y j i e e es i g n a lp r o c e s s i n gm a g a z i n e2 0 0 2 ,1 9 0 ) :4 7 - 6 5 2 b h a t t a e h a r t y a n e t w o r k m e a s u r e m e n t a n d m o n i t o r i n g :a s p r i n p e r s p e c t i v e t , i n t e m e t d m r , 3 k a l i d i n d is s u r v e y o ra l li n f r a s t r u c t u r ef o ri n t e m e tp e r f o r m a n c em e a s u r e m e n t e i e e ec o m i n u nc a t i o n sm a g a z i n e19 9 8 ,3 6 ( 5 ) 4 8 5 4 4 p a x s o nv m a h d a v ij , a d a r r sa ,e t a la na r c h i t e c t u r ef o r l a r g e - s c a l e i n t e r n e t m e a s u r e m e n t j 】i e e ec o m m u n i c a t i o n sm a g a z i n e ,1 9 9 8 ,3 6 ( 8 ) :4 5 5 4 【5 b a s us ,m u 】【】1 e r j e ea t u n es e r i e sm o d e l sf o ri n t e m e tf r a n c 册i n :p r o ci e e e i n f o c o m 9 6 c s a nf r a n c i s c o ,c 丸1 9 9 6 ,2 6 11 - 6 2 0 6 b r u c eb l o w e k a m pw i l l j a ma n dm a r yb r i a nt i e r n e yl b n ll e sc o n t t r e l l s l a c e n a b l i n gn e t w o r km e a s u r e m e n tp o r t a b i i i t yt h r o u g hah i e r a r c h yo f c h a r a c t e r i s t i c si e e e2 0 0 3 。 7 刘铮大规模豆联网测量研究 j 电子质量2 0 0 3 年0 2 期9 8 - 9 9 8 g a n gl i a n gb i ny u s i g n a lp r o c e s s i n g j i e e et r a n s a c t i o n so n s e ea l s o a c o u s t i c s ,s p e e c ha n ds i g n a lp r o c e s s i n gi e e et r a n s a c t i o n so n 】v o l u m e :51i s s u e 8 a u 9 2 0 0 3p a g e s 2 0 4 3 2 0 5 3 9 吴桦丁伟东基于奇异谱方法的网络行为分析 j 东南大学学报( 自然科学 版) 第3 2 卷第6 期2 0 0 2 年l1 月8 8 9 8 9 4 + 【1o m a r kc o a t e s a l f r e d 。h e r o 川,r o b e rn o w a r k ,n e t w o r kt o g o g r a p h yf j 】i e e e s i g n a lp r o c e s s i n gm a g a z i n e2 0 0 2m a y4 7 6 5 11 g m l gl i a n ga n db i ny u ,f e l l o w m a x i m u mp s e u d ol i k e l i h o o d e s t i m a t i o ni n n e t w o r k t o m o g r a p y h y j i e e ei l n s a c t i o n s o ns i g n a l p r o c e s s n g ,v o l ,51 n o8 ,a u g u s t2 0 0 32 0 4 3 2 0 5 3 1 2 y , v a x d i ,e t w o r kt o m o g r a p h y :e s t i m a t i n g j 】s o u r c e d e s t i n a t i o nt r a f f i ci n t e n s i t i e s f r o ml i n kd a t a ,j a m e r s t a t i s t a s s o c v o l9 1 p e 3 6 5 3 7 7 1 3 g a n gl i a n ga n db i ny u , f e l l o w , m a x i m u mp s e u d ol i k e l i h o o de s t i m a t i o ni n n e t w o r k t o m o g r a p y h y 啊 i e e et r a n s a c t i o n so ns i g n a l p r o c e s s i n r g ,v o l ,5 l , t o8 , a u ;g u s t 2 0 0 32 0 4 3 - 2 0 5 3 1 4 g j v a n d e r b e ia n dj i a n n o n e f a ne ma p p r o a c ht o o dm a 心i xe s t i m a t i o n p r i n c e t o nu n i v ,p r i n c e t o r h n j ,t e c h r e p s o r9 4 - 0 4 ,1 9 9 4 1 5 h t t p :t n i l e w p i e d u n s a n a l y s i s h t r n l 2 0 0 5 - l - 3 1 6 周继成人工神经网络 m 北京科学普及出版社

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论