(计算机应用技术专业论文)服务器监控系统的实现及其分布式设计.pdf_第1页
(计算机应用技术专业论文)服务器监控系统的实现及其分布式设计.pdf_第2页
(计算机应用技术专业论文)服务器监控系统的实现及其分布式设计.pdf_第3页
(计算机应用技术专业论文)服务器监控系统的实现及其分布式设计.pdf_第4页
(计算机应用技术专业论文)服务器监控系统的实现及其分布式设计.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(计算机应用技术专业论文)服务器监控系统的实现及其分布式设计.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 y6 3 5 3 0 9 服务器的监控是整个网络监控系统中的重要一环通过对服务器的监控可 以更好的掌握目前的网络运行状态,及时判断服务器在运行过程中出现的各种异 常,并为判断网络异常引发的原因提供重要的依据。本文旨在研究新的网管模型 和技术,设计出网络服务器监控系统的功能模块,通过对功能模块的拆分产生多 种部署策略,使设计的服务器监控系统能满足不同监控环境的要求。从郑州大学 网络中心自身的特点和网络中心服务器监控的具体要求出发,选用合适的部署策 略,设计一个网络服务器监控系统。 首先,分析并设计了基于c s 结构的服务器监控系统,给出了系统中三大模 块的具体实现方法及u m l 活动图表示: 整个系统针对服务器可能出现的异常对服务器采集相关的服务参数,通过采 集静态参数了解服务器的基本情况,通过采集动态数据并结合相应的算法以图形 化的方式表现服务器的运行状态,针对监控环境设计相应的部署策略,采用时间 定位策略来定位服务器异常所发生的具体时段。 本系统经试验运行效果良好,其中采集模块对所监控的服务器的静态动态参 数进行不问断的采集;数据库模块针对不同的参数设计相应的表单,存储采集模 块发来的数据和相关的时间信息:显示模块对管理员感兴趣的历史数据进行统 计,并以图形化的方式进行显示,按照时间定位策略查找峰值所出现的时段。 其次,针对服务器监控系统在运行阶段很容易出现的数据库庞大,流量统计 效率低f 这两个问题提出了相应的解决方案,提高了整个系统的稳定性和显示模 块的执行效率,并加强了系统在负荷不同的服务器监控环境下的适应能力。 以郑州大学网络中心服务器监控系统的设计及运行经验,提出了高可靠性, 高运行性商业化服务器监控系统的完整设计方案。 最后,本文对分布式服务器群的监控环境进行分析,设计出将采集模块拆分 的分布式部署策略对应的采集模块模型,来适应分布式多服务器状态下的监控要 求。 关键字:网络监控,服务器监控,u m l ,部署策略,分布式 a b s t r a c t s e r v e r s m o n i t o r i n g i sa n i m p o r t a n tp a r t o fw h o l en e t s m o n i t o r i n g b y m o n i t o r i n gs e r v e r sw e c a nk n o wn e t sr u n n i n gs t a t e ,f i n do u ts o m e a b n o r m i t yd u r i n g i t sr u n n i n g p r o c e s si nt i m e ,a n dp r o v i d ei m p o r t a n tp a r a m e t e r sf o rf i n d i n ga b n o n n i t y s r e a s o n t h i sp a p e ri sa i m e dt or e s e a r c ho na d v a n c e dn e t w o r km a n a g e m e n tm o d e l i n g a n d t e c h n o l o g y , d e s i g nf u n c t i o nm o d u l e s o faw h o l em o n i t o r s y s t e m t h e s em o d u l e s c a l lb ea n a l y z e da n dt h e nd i v i d e dt o d e s i g nd i f f e r e n td e p l o y i n gp o l i c y d i f f e r e n t d e p l o y i n gp o l i c ya d a p tt od i f f e r e n tm o n i t o r i n ge n v i r o n m e n t b a s e do nc h a r a c t e ra n d r e q u i r e m e n to fz h e n g z h o uu n i v e r s i t y sn e tc e n t e r , an e ts e r v e rm o n i t o r i n gs y s t e mh a s b e e n d e s i g n e d f i r s t l y , t h r o u 曲a n a l y z i n ga n dd e s i g n i n ga r c h i t e c t u r eo fm o n i t o r i n gs e r v e r s s y s t e m , t h ew h o l es y s t e mh a sb e e nd i v i d e di n t ot h r e em o d u l e sa n da n a l y z e db yu m l a c t i v i t y c h a r t t h es y s t e mc o l l e c t s e r v e r s p a r a m e t e r s a b o u ts i x p o s s i b l es e r v e r s a b n o r m i t y , c o l l e c t i n gs t a t i cp a r a m e t e rr e p r e s e n ts e r v e r s b a s i ci n f o r m a t i o n ,c o l l e c t i n gd y n a m i c p a r a m e t e ra n dc o m p u t i n gh i s t o r yd a t ar e p r e s e n ts e w e r s r u n n i n gs t a t eb yg r a p h i c s t h i ss y s t e ma d o p t sc o l l e c t i v ed e p l o y i n gp o l i c yb a s e do ni t sm o n i t o r i n ge n v i r o n m e n t , a n da d o p t st i m es e a r c h i n gp o l i c yt og u i d ea d m i n i s t r a t o r sf i n do u td a t aw h i c hh ei s i n t e r e s t e di n t h i s s y s t e m r u n se x c e l l e n t d u r i n gr u n n i n g - i n i n t h em o d u l eo fc o l l e c t i o n ,i t p r o v i d e sf u n c t i o n o fc o n t i n u o u s l yc o l l e c t i n gs e r v e r s p a r a m e t e r ;i nt h em o d u l eo f d a t a b a s e ,i ts t o r e sa l lt h ed a t aw h i c h w a ss e n d b yc o l l e c t i n gm o d u l e i nd i f f e r e n tt a b l e s ; i nt h em o d u l eo fd i s p l a y i n g ,i tc o m p u t eh i s t o r yd a t ab yo p t i m i z e da r i t h m e t i ca n d d i s p l a y r e s u l tb y g r a p h i c s s e c o n d l y , t h ec o m m o n l y d r a w b a c k so fs u c hm o n i t o r i n gs y s t e ma r eh u g ed a t a b a s e a n dl o wr a t ec o m p u t i n g e f f i c i e n c y t h e s ed r a w b a c k s h a v eb e e ns o l v e di nt h i ss y s t e m , s ot h i ss y s t e mh a v em o r e s t a b i l i t ya n de f f i c i e n c y b a s e do nt h i ss y s t e m ,t h i sp a p e rg i v e saw h o l es o l v i n gp r o j e c to fh i g hs t a b i l i t ya n d e f f i c i e n c ys y s t e m f i n a l l y , t h i sp a p e ra n a l y z ee n v i r o n m e n t o fd i s t r i b u t e ds e r v e r s c l u s t e r , a n ds u g g e s t as o l u t i o no f d i v i d i n gc o l l e c t i n g m o d u l et oa d a p tt ot h i sc o m p l e xe n v i r o n m e n t k e y w o r d :n e t w o r km o n i t o r i n g ,s e r v e r m o n i t o r i n g ,u m l ,d e p l o y i n gp o l i c y , d i s t r i b u t e d i i 第一章绪论 1 1 研究背景 计算机网络和通信规模的不断扩大以及网络结构的日益复杂和异构化,网络 监控也随之迅速发展。网络监控系统可以给网络管理员提供良好的信息来源,减 少网络故障概率,缩短失效时间。提供应用服务的中心设备一服务器,无论从提 供商还是使用者的角度看,其性能和稳定性都居于核心地位。而目前攻击目标主 机的技术变得越来越先进,渗透网络的切入点数量变得越来越多,仅仅对服务器 周边的中继设备实施监控己不能准确快速的表达服务器运行状态,此外分布式服 务群的存在,以及服务器集群、网络接口负载均衡、处理器负载均衡、超线程处 理器等等新技术的采用,使监控网络服务器的环境更加复杂。如何快速知晓网络 服务器的可靠性和稳定性,判断异常的发生,单靠监控通讯设备的网络参数已不 能满足目前复杂网络环境网络监控和管理的需要。 本课题旨在研究先进的网管模型和技术,从整个系统功能模型划分来设计部 署策略及其所适应的环境。针对郑州大学网络中心服务器群设计一个适应性强的 服务器监控系统,通过收集服务器工作参数及运行状态信息来对收集到的信息进 行归类和设计相关参数的统计算法,并将统计结果以可视化的方式呈现给网络管 理人员。采用图形化界面根据渐进式定位原理快速定位最大负荷出现的时段。利 用该系统提供的统计参数对服务器异常进行判断处理,并为服务器及其周边网络 设备的配置和升级提供重要的参考依据。根据此类系统运行中常出现的问题进行 进一一步的讨论,提出相应的解决方案。并设计了适应性更强的高可靠性、高运行 效率服务器监控系统方案,在减少带宽和提高运行效率方面提出更好设计。目前, 随着服务的数量增多,服务器数量也随之增长,出现了分布于各个网段的分布式 服务器族,本文最后对这种复杂环境下的监控系统进行了分析,并设计了分布式 服务器采集监控系统模型。 1 2 本论文主要完成的工作 本论文主要内容涉及了基于简单网络管理协议s n m p ( s i m p l en e t w o r k m a n a g e m e n tp r o t o c 0 1 ) ,通过对简单网络管理协议框架进行了分析和研究。得出 目前在此协议框架之上构建的传统的网络管理体系结构及协议运行机制。 根据s n m p 协议的运行机理对一般服务器监控系统进行功能模块的划分,并由 此设计出针对彳i 唰监控环境的部署策略。针对郑州大学网络中心服务器监控环境 选用合适的部署策略。对郑州大学网络中心服务器赜控系统过程中遇到的问题进 行分析解决,逐步实现了一个由收集、数据存储、显示三个模块组成的完整系统。 在已实现系统的基础上,提出高可靠性,高稳定性,高运行效率监控系统的完整 改进方案。并在此基础上对分布式服务器族的监控环境进行分析讨论,从而设计 出基于分布式的服务器监控系统采集模块模型。归纳如下: 1 ) 针对郑州大学网络中心服务器群,设计一个适应性强的服务器监控系统, 采集服务器工作参数及运行状态信息;通过对采集到的信息进行处理, 以可视化的方式将统计结果呈现给网络管理人员,利用图形化界面根据 渐进式定位原理快速定位最大负荷出现的时段。根据该系统提供的统计 数据对服务器异常进行判断处理,并为服务器及网络设备的配置和升级 提供重要的参考依据。 2 ) 根据该系统的运行中出现的问题进行进一步的讨论,分析问题并设计合 理的解决方案。 3 ) 成长为高可靠性,高运行效率监控系统应做的改进和优化方案。 4 ) 通过分布式多服务器族监控环境的分析,分析并设计在这种复杂环境下 的服务器监控系统采集模块模型。 在开发方式上,提出了基于u m l 活动图的操作建模和过程建模的开发方式。 主要内容如”f : 简单网络管理协议框架的研究与分析 研究分析t s n m p 协议框架的模型与三个组成部分,s n m p 三个版本的发展。 网络管理系统体系结构的研究与分析 分析了传统的三种网络管理体系结构,并指出其优缺点:合理的划分监控 系统不同的功能模块,设计在不同监控环境下的模块部署策略,并针对 网络中心实现相应的服务器监控部署模型。 服务器监控系统设计与实现 利用统一建模语言的活动图表示、分析其中所遇到的操作和过程,通过 对其建模来细化业务过程,从而设计出服务器监控的各个功能模块,并 由此生成相应的算法代码和处理代码。 运行过程的问题及解决 针对设计的系统在运行过程中出现的问题进行分析并设计合理的解决方 案。 本论文在分析s n m p 管理框架的基础上,实现了针对郑州大学网络中心服务器 监控系统的体系结构和设计方案,提出了实现高可靠性、高稳定性、高运行效率 商业化服务器监控系统的改进方案,并设计了分布式监控系统方案解决复杂环境 下的服务器监控。对于解决涉及服务器监控的分布式网络环境以及相关的网络管 理问题具有一定实际意义。 1 3 本论文的章节安排 本论文共分八章,1 为绪论部分,说明了本课题的研究背景及本论文主要完 成的工作2 为网络管理概述,介绍了网络管理的目的、基本原理,总结并扩展 了网络管理的功能定义并对目前流行的s n m p 网络管理协议作了重点阐述,最后 分析了网络管理系统结构的发展:3 服务器异常的分析及对应的相关s n m p 参数; 4 针对郑州大学网络中心的服务器监控系统设计及实现;5 设计的服务器监控 系统运行的结果分析;6 成为高可靠性、高运行效率监控系统的改进方案:7 分 布式服务器群监控环境的分析及其监控系统设计;8 为结论部分,对本论文的主 要内容进行了总结,并讨论了需要进一步探讨和深入研究的问题。 3 第二章网络管理概述 2 1 网络管理的基本原理 网络管理系统的重要任务是收集网络中各种设备,如服务器、路由器、交换 机等设备的工作参数、工作状态信息,并显示给管理员,同时接受管理员的指令 对它们进行处理或根据上述数据的处理结果向网络中的设备发出控制指令,以改 变工作状态或工作参数;监视指令的执行结果;保证网络设备按照网络管理系统 要求进行工作。网络管理系统从逻辑上可认为是由以下三个部分组成:管理对象、 管理进程、管理协议。其中: 1 管理对象是经过抽象的网络元素,对应于网络中具体可以操作的数据, 如设备的状态变量和工作参数。 2 管理进程是负责对网络中的设备进行全面管理和控制的软件,根据网络 中各个管理对象的变化来决定对不同的管理对象采取不同的操作,如调 整工作参数和控制工作状态的打开或关闭等。 管理信息库m i b 是管理进程的一部分,用于记录网络中管理对象的信 息,如状态类对象的状态代码,参数类管理对象的参数值等。它要与网 络设备中的实现状态和参数保持一致,能够真实、全面地反映网络设备 的情况。 3 管理协议负责在管理进程与管理对象之间传递操作命令,负责解释管理 操作命令。 2 2 网络管理功能定义及扩展 国际标准化组织( i n t e r n a t i o n a ls t a n d a r d so r g a n i z a t i o n ,i s o ) 将网络管 理的功能划分为五个管理功能域( m a n a g e m e n tf u n c t i o na r e a ,m f a ) ,分别完成 不同的网络管理功能。 1 性能管理 性能管理的功能包括:动态监视网络状态、收集网络动态信息、动态评价网 络性能,使网络性能达到最佳状态。性能管理活动持续地评测网络运行中的主要 性能指标,以检测网络服务是否达到预定的水平,找到己经发生或潜在的瓶颈, 报告网络性能的变化趋势,为网络管理决策提供依据“。性能变量有网络吞吐 量、用户响应时间和线路利用率等。根据国际网络服务组织( i n t e r n a t i o n a l n e t w o r ks e r v i c e ,i n s ) 在世界范围内统计的结果显示:性能管理己超过故障管 4 理,成为网络管理中最重要的功能和研究重点之一。 2 配置管理 网络配置是指网络中每个设备的功能、相互问的连接关系和工作参数,它反 映了网络的结构和状态。网络是经常变化的,如用,o 需求变化、资源设备调整、 规模扩大、设备线路故障引起的变化等,因此需要调整网络配嚣。网络配置管理 的目标是监视网络和系统配置信息,从而可以跟踪系统的硬件和软件操作。网络 配置管理还对网络设备进行初始化、设备命名、分配地址、设置参数以及规划网 络等。 3 故障管理 故障管理的功能是对网络故障进行识别、记录和报告,进而排除故障,以保 证网络的f 常运行。网络故障管理综合分析整个网络的运行状念,其目标是自动 地检测、记录网络故障并通知给用户,以便网络有效地运行,避免系统瘫痪。网 络故障管理的主要内容有: 检测管理对象的故障现象或接收管理对象的差错事件通报。 当存在冗余设备或迂回路由时,提供新的网络资源用于服务。 创建与维护差错日志库,对差错日志进行分析。 进行诊断测试,以跟踪并确定故障位置与故障性质。 通过对资源进行更换、维修或其它恢复措施,使其重新开始服务。 4 安全管理 安全管理的功能包括:支持安全策略、控制网络访问,主要是控制对网络资 源的访问。网络安全管理的目标是保护网络资源的安全,以保证网络不被侵害, 并保证重要的信息不被未授权的用户访问”1 。网络安全管理应包括对网络数据的 私有性、授权、访问控制、加密和密钥的管理,以及维护和检查安全日志。实现 网络安全管理的方法有:数据加密、身份鉴别和访问控制等。“。 5 计费管理 计费管理用于记录用户对网络的使用时间,统计网络的利用率与资源使用情 况,从而控制网络的操作费用。计费管理可以优化系统资源的使用,提高用户对 资源的利用程度,减少不必要的资源浪费。其目标是衡量网络的利用率和实现对 用户合理准确的收费。使一个或一组网络用户更有规则地利用网络资源,可使网 络故障减到最少,也可以使所有的用户对网络的访问更加公平。 在网络管理系统的具体实现过程中,并不是所有的网络管理软件都实现了这 五大功能。一个具体的网络管理系统可以只实现这一组管理功能的一个子集。因 此网络管理的五个管理功能域做到了与具体的网络管理系统和具体的被管网络 无关。 5 随着网络技术的飞速发展,网络管理的内容和职责也在刁i 断扩大,除了传统 的五大基本管理功能外,近年来网络管理中又增添了许多新的内容,包括: 远程控制:包括远程开机、关机、远程引导、操作系统的远程安装和配置, 使用远程计算机的资源等。 应用管理:管理用户的应用程序,实现软件安装、升级自动化。 服务管理:监视某项服务或应用程序的运行状态,确保重要的服务不被中 断。 资产管理:管理个人计算机及其组件。 病毒防治:保护网络主机重要的数据和应用程序不受病毒侵害。 数据备份和灾难恢复:及时备份重要数据,当系统陷于瘫痪时,能够使用 备份资源迅速恢复系统。 其它资源管理:包括数据库、存储设备、家用电子设备及电子邮件等的管 坪。 2 3s n m p 网络管理协议 s n m p 是网络管理普遍采用的协议,是为基干t c p i p 的多厂。商异构巨连网的管 理而设计的。它作为工业标准投入使用,已被广泛接受,现在几乎所有的网络产 品,包括交换机、路由器、h u b ,u p s ,m o d e m 等硬件以及许多软件均支持s n m p 。 s n m p 标准主要由三部分组成:简单网络管理协议( s n m p ) 、管理信息结构( s m i ) 和管理信息库( m i b ) 。 2 3 1 简单网络管理协议( 8 n m p ) s n m p 协议全称是s a m p l en e t w o r km a n a g e m e n tp r o t o c o l ( 简单网络管理协议) 其作用是在网络构件问提供并传输管理信息。 2 3 1 1s n m p 的体系结构的组成 s n m p 采用集中式的管理方案,其体系结构如图2 2 所示。由图2 2 可知, s n m p 的体系结构主要由管理进程( m a n a g e r ) 、管理代理( a g e n t ) 、受管对象 ( m a n a g e do b j e c t ) 和描述受管对象状态的管理信息库( m i b ) 以及s n m p 协议组成。 6 n m s g e t r e q u e s t ? g e t n e x t m a n a g e do b j e c t il r e q u e s t _ 1 一 1 b e t r e s p o n s e s n m pm a n a g e r m i b s n m pa g e n t 图2 2s n m p 体系结构图 管理进程( m a n a g e r ) 运行于网络管理站上,能够对代理进行查询、接收代理的应答,并采用s n m p 命令设置变量。m a n a g e r 是整个网管系统的控制中心,它通过各管理代理对网络 内的各种设备、设旋和资源进行监测和控制,并完成各种管理功能。此外,m a n a g e r 通常配有人机界面,并对收集到的受管对象的信息和数据进行存档、分析和处理。 代理( a g e n t ) a g e n t 运行在受管对象上,存储管理数据并对管理者的查询进行应答。每个 a g e n t 维护一个本地的m i b 。a g e n t 负责收集有关本地的受管对象的信息并具有 以下几项基本功能:设置和修改m i b 中的各种变量值;读取m i b 中的信息并传回 m a n a g e r ;执行管理进程的管理操作。 管理信息库m i b 管理信息库m i b ( m a n a g e m e n t i n f o r m a t i o nb a s e ) 。“是有关被管理目标对象 的数据库。被管理目标对象( m a n a g e do b j e c t ) 是经过抽象的网络元素,它对应于 网络中具体可以操作的数据,如记录设备各工作状态的变量、设备内的工作参数 等,也可指某些具体的设备。m i b 是一个概念上的数据库,是关于受管对象的状 态信息集。a g e n t 通过m i b 来实现对受管对象的操作。s n m p 的m i b 结构严格符合 i n t e r n e t 的管理信息结构( s m i ) ,m i b 根据o s i 注册层次规定,为被管理目标确 定一相应对象用a s n 1 格式来描述。对m i b 的操作是通过s n m p 来完成的。 s n m p 协议 s n m p 是一个应用级的协议,它工作于u d p 之上,管理器通过u d p 与被管代 理进行通信,网络管理器和每个被管代理均要求实现s n m p 、u d p 和i p 。网络管 理器与被管代理之问采用c s 方式。由于s n m p 是依赖于u d p 的,所以s n m p 自身 是连接的,管理器与被管代理之间没有保持连接。作为应用层协议概括了在网络 设备之间进行通信的结构,包括通信方式、消息格式和含义。 作为t c p i p 的网络管理协议,s n m p 由一系列r f c 文件正式定义。附件2 中 列出了在t c p i p 领域作为所有管理标准的现有r f c 的总结。 2 3 1 2 s n m p 的管理机制 s n m p 管理主要采用通过m a n a g e r 轮询a g e n t ,设置一些关键字和监视一些 网络事件来达到网络管理的目的。m a n a g e r 和a g e n t 之问,a g e n t 和本地m i b 之 间,都是通过s n m p 管理协议进行通信的。s n m p 的操作很简单,它通过定义的5 类管理操作实现对网络设备的管理。 m a n a g e r 利用g e t 和g e t n e x t 操作来提取各m i b 的信息,进而获得网络当前 的综合状态信息。在必要时,m a n a g e r 可以通过s e t 操作间接设置或修改m i b 中 的某些信息,以达到控制的目的。s n m p 是t c p i p 协议集的一个应用层协议,工 作在u d p 协议上。m a n a g e r 周期地通过发送请求报文来轮询各个a g e n t ,获取各 个m i b 中的管理信息,如有关t c p i p 的统计数据、地址表信息( 地址转换表、网 络接口表、i p 地址表、路由表) 等。同时,每当网络发生严重的异常事件时,a g e n t 就通过t r a p 操作主动向m a n a g e r 报告事件,m a n a g e r 将接收到的各个a g e n t 发 来的t r a p 报文记录在一个数据文件中。网络管理员可以通过专用工具从m a n a g e r 上查看各个a g e n t 提供的管理信息。从而大大改善了网络管理的时效性能。 另一方面,各个节点的a g e n t 程序驻留在工作站内存中,负责收集被管对象 的网络状态信息。当a g e n t 接收到m a n a g e r 的请求报文后,a g e n t 将根据请求的 内容从本地m i b 中提取所需信息,并以响应报文方式将结果回送给m a n a g e r 。具 体地,它一方面在u d p 的1 6 1 端口上循环侦听m a n a g e r 的请求报文,并作出相应 的响应,读取或修改m i b 中的变量值,将结果返回给m a n a g e r :另一方面,将不 断地检查本地的状态,适当地发送t r a p 报文。 从系统安全性角度,a g e n t 可以设置c o m m n i t y 参数及相应的访问权限( 只 读或读写) ,并要求m a n a g e r 在发送报文时填写c o m m u n i t y 域。只有在c o m m u n i t y 相同且相应访问权限相符的情况下,a g e n t 才按该报文所规定的操作,回送相应 报史。 2 3 2 管理信息结构( s m i ) 在定义和标志m i b 变量时有一组原则,称为管理信息结构s m i ( s t r u c t u r eo f m a n a g e m e n ti n f o r m a t i o n ) “8 3 “”。规范( r f c l l 5 5 ) 详细定义了m i b 库的组成结构, 规定了定义和标识m i b 变量的一组规则。s m i 对m i b 中允许的变量类型加以限制, 对那些变量命名规定了若干原则,还对定义变量类别建立了若干原则。它规定所 有m i b 变量必须用a n s 1 来定义,每个m i b 变量都要用一个对象标识符( o b j e c t i d e n t i f i e r ) 来标识,对象标识符的相互关联,构成了一个树型的分层结构,对 象标识符的命名由专门的机构负责。 8 2 3 3m i b 库 刚络管理信息库( m i b 库) 是网络管理的重要组成部分。具体的讲,m i b 是网 络管理数据的标准。此标准详细的规定了网络元素的标准( 如r f c l 2 1 3 2 0 ) ,规 定了网络元素必须保存的数据项目、数据类型,以及每个数据项目中允许的操作。 通过对这些网络元素的m i b 库数据项目的存取访问,即可得到对这些网络元素的 所有统计内容,对这些统计内容的综合分析,即可实现基本的网络管理。如图 2 6 所示,mib 被划分为若干个组,如s y s t e m 、i n t e r f a c e s 、a t ( 地址转换) 和 i p 组等。 r o o t ,一7 7l c c i t t ( o )s o ( 1 )j o i n t i s o c c i t t ( 2 ) i o r g ( 3 ) 图2 6 管理信息库的对象标识 2 4 网络管理系统结构的发展 在过去的十几年间,网络管理系统的结构随着计算机网络系统规模、复杂性 的提高和技术进步得到了快速发展,经历了集中式、层次式以及分布式等管理模 式的变迁p 1 。 2 4 1 集中式网络管理模式 集中式网络管理模式是目前网络管理系统中最普遍、最常用的一种。在这种 模式下,设置单一的管理节点,负责收集和控制整个网络的信息,其结构如图 2 7 所示。管理者负责处理与被管理网络节点代理之间的通信,将全网所有需要 管理的数据都集中存储在一个数据库中,并提供集中的决策和控制,以及对该数 据库的统一管理和维护“。 州络管理者 州络 r 代理 ;m i bi l网络管理者 薯 ! 蠢i 呵络 图2 7 集。p 式网络管理模式图2 8 基于平台的集中式网络管理模式 集中式网络管理模式的优点是,网管结构简单:网络管理系统的职能高度集 中;易于作出全面判断;网管系统软件和设备升级时仅需处理集中点。由于所有 数据均连接到统一的中央数据库,所以,易于管理、维护和扩充。这种结构的缺 点也是显而易见的,主要表现在: ( 1 ) 可靠性差 依靠各代理逐级解决网络故障,网络管理系统旦出现故障,无法及时作出 全局性调控,势必导致全网瘫痪。 ( 2 ) 管理功能固定,系统可扩展性差 出于管理信息库i b ) 中的数据和控制功能在设计m i b 时确定,因此网络管 理系统不能随着网络的规模和复杂度变化而伸缩。 ( 3 ) 网络资源开销大,实时性差 由于网络管理逻辑在管理工作站上进行计算,因此需要大量的带宽完成设备 数据的传输,网管控制功能的有效性差。网络管理系统使用被管理网络本身完成 与代理方的通信,加重了网络的运行负担和资源消耗。集中式网络管理模式的一 种变形是基于平台的网络管理模式,其结构如图2 8 所示“。单一的管理节点被 分成两部分,管理平台和管理应用。管理平台负责信息收集和计算,为应用隐藏 所提供的管理协议,提供管理功能的抽象视图。管理应用使用管理平台所提供的 服务,完成各种系统管理任务、处理决策支持等较高级的功能。这种基于平台的 管理结构更易于维护和扩展,能够简化基于异构的、多供应商的、多协议环境下 的集成应用系统的开发。网络系统的异构性和协议的复杂性则由平台层处理,对 应用程序透明。然而,当应用程序的数量增加时,网管平台可能成为提高运行效 率的瓶颈。 1 0 ( 、 2 4 2 层次式网络管理模式 层次式网络管理模式采用“管理者之管理者”( m a n a g e ro fm a n a g e r ,m o m ) 的概念。它以域为单位,每个域设置一个管理者,因此,又称为域管理概念,它 们之间的通信由上层m o m 控制而不直接进行通信,其结构如图2 9 所示。 采用m o m ,这种结构的优点在于: ( 1 ) 分散了网络资源( n e t w o r k r e s o u r c e ) 的负荷,使得各个网络管理者可 更接近被管单元,降低了总体网络管理工作需收集传送的数据量。 ( 2 ) 这种管理模式相对来说具有一定的伸缩性:通过增加一级m o m ,层次口丁 进一步加深,而且可以较容易地丌发综合应用程序。从多个域( 可以是异构的) 获取管理信息“。 ( 3 ) 该管理模式比集中式结构更可靠。 图2 9 层次式网络管理模式 2 4 3 分布式网络管理模式 分布式网络管理模式与管理域( d o m a i n ) 概念密切相关,它是一种端对端 ( p e e rt op e e r ) 的管理模式。采用分布式网络管理模式,在一个网络系统中可以 有多个管理者,几个对等的管理者可以同时在网络系统中运行,每个管理者负责 管理网络系统中的一个特定域,管理者之间可以相互通信,或者通过高层管理者 进行协调,其结构如图2 1 0 所示。由于采用了每个域设置一个管理者的思想, 比较适合于多域的大型网络系统。当需要另一个域的管理信息时,管理者通过与 同级的系统通信来获取。 分布式网络管理模式的优点在于:第一,完全分散了网络资源 ( n e t w o r k r e s o u r c e ) 的负荷,网络管理系统的规模大小可按需要来任意调整; 第二,分布式网络管理模式将管理者分布在网络的儿个工作站上,增加了管理的 可靠性和健壮性,同时,通信方面的要求【l 有所降低。因此这是一种崭新的并f 在迅速发展和广泛应用的网络管理技术。 分布式网管作为未来网络管理的一个发展方向已成为当前国内外的研究热 点。从研究内容上分析,当前主要热点集中在应用远程过程调用( r e m o t e p r o c e d u r ec a i ,r p c ) ,分布式计算环境分布式管理环境( d i s t r i b u t e d c o m p u t i n ge n v i r o n m e n t d i s t r i b u t e dm a n a g e m e n te n v i r o n m e n t ,d c e d m e ) 、分 布式组件对象模型( d i s t r i b u t e dc o m m o no b j e c tm o d e l ,d c o m ) 、通用对象请求 代理体系结构( c o m m o no b j e c tr e q u e s tb r o k e ra r c h i t e c t u r e ,c o r b a ) 等分布式 计算按术来构建网管系统【1 4 1 。目前,国际上对分布式网管技术进行研究的计划 有:美国密歇根大学的d b b ( d i s t r i b u t e db i g b r o t n e r ) 计划| 1 ”,o s f ( o p e i l s o f t w a r ef o u n d a t i o n ) 的d m e 计划d 6 ,以及美国哥伦比亚大学的 m b d ( m a n a g e m e n tb yd e le g a t io n ) 计划1 1 7 j 。 2 5 本章小结 本章介绍了网络管理的定义及其内涵,s n m p ( 简单网络管理协议) 的基础 架构和一些重要术语。着重介绍了目前流行的网络管理模式,这也是本文所设计 部署策略理论基础。 1 2 第三章服务器的异常分析及其s n m p 参数定义 3 1 引言 简单网络管理协议对主机参数的采集非常广泛,一个完善的监控系统部可能 对其所有的相关m i b 库进行遍历采集。本文所设计的服务器监控系统主要监控服 务器在运行过程中的网络接口状态和服务器内部处理器负荷状态,相关的服务器 静态信息也是采集的目标。定义所取得参数主要从服务器提供网络服务的过程中 所可能出现的异常来决定是否进行采集。本章就是分析网络服务器在运行过程中 可能出现的异常,并定义要采集的针对异常的相关0 i d 信息。 3 2 服务器常见的异常分析 服务器的使用非常复杂,应用也非常广泛,甚至可以作为网络设备,如中继、 防火墙、路由。其位置大多处于网络应用的核心,异常所表现出来的现象也千差 万别。归结起来有以下六种: 1 ,服务器连通性异常。 2 ,到服务器的路由异常。 3 ,服务器进出流量异常。 4 ,服务器c p u 负载异常。 5 ,服务器缓存导致的阻塞异常。 6 ,服务器网络接口异常。 服务器连通性异常通常发生在服务器网络接口,防火墙的错误配置也可能导 致合法用户无法访问服务器;服务器路由异常发生在用户到服务器的中继线路 上,在用户端和连通性异常的表现方式是一样的一都是不能到达目的服务器。 但原凼是中继设备出现故障或错误配置导致的,一个完善的监控系统应该能确定 网络t 哪一段故障是服务器不可达的原因。 服务器进出流量异常出现的原因很复杂,可能的有以下几种:1 、病毒攻击 是其一个比较主要的方面2 、系统漏洞被利用服务器演变成攻击者的肉鸡或跳板 3 、攻击者对该服务器进行的洪泛攻击4 、正常使用时用户数量段时间内激增等 因索。 服务器c p u 负载异常引发的原因也很复杂,服务器受到病毒感染负载会据高 不下,利用操作系统后1 7 开启的服务也会引发c p u 负载的异常。 服务器在收到大量请求信息队列时,队列缓存满的状态下会将大量无错的刚 络数据包丢弃:同时由_ - 服务器网络接u 不稳定或其中继链路设备不稳定,尽管 服务器还能在网络环境下勉强运行,但会产生大量封装错误的包。 服务器异常的引发形式非常复杂,由以上的分析可以看出,尽管利用一个完 善的服务器监控系统可以发现服务器出现的异常,但要准确的判断异常引发的原 因和涉及的相关网络硬件设备,仍需要大量周边设备的监控参数作为辅助。也就 是说,本文所完成的服务器监控监控系统只是整个网络监控系统中的一个组成部 分,也是很重要得一个组成部分。 3 2 1 基于s n m p 和i c m p 协议的监控系统针对异常的监控归类 s n m p 采集和响应是建立在管理站和代理站之间链路无连通性异常的 前提下。 图3 1 简化的s n m p 采集和响应模式 在服务器的s n m p 协议参数采集前,应具备以下三个条件: 1 采集端到服务器端的物理链路正常。 2 服务器端( 包括l i n u x 平台) 的s n m p 服务器开启并正确的设置了 r e a d c o m m u n it y 。 3 链路上的防火墙配置正确:采集端的i p 的制可以通过防火墙,相应 的端口t 6 1 开启。 所以在采集前应该先进行链路连通性检查,即利用i c m p 协议的p i n g 命令。 一个单纯的p i n g 并不能准确说明连通性的故障到底发生在服务器接口还是某个 链路上的路由器接口。设计的系统必须能确切的定位连通错误具体发生在链路上 的那个中继接口,对到服务器之间的路由检查就是应用t r a e e p i n g 的返回值来逐 1 4 步获得中继站点的可达信息。该协议在服务器的监控中主要对连通性异常进行蠊 控。对到服务器之间的路山检查就是应用t t l 的值来逐步获得中继站点的可达信 息。在向目的服务器发送i c m p 请求报文时先将t t l 值发为1 ,路径上的第一个 路由器接到该分组后将t t i 值减去1 ,这样t t l 值将变为0 ,该分组在第一个路 由器被废除,路由器同时返回给站点一个t t l 超时报文,承载该报文的数据报源 地址就代表路径上的第一个中继站点;然后发送t t l 值为2 的分组,得到第二个 中继站点;这样一值进行直到到达目的服务器或收到目的不可达报文为止。由此 可以得到一张从源站点到目的站点的路由表。由此达到监测到服务器中继链路的 目的。 幽3 2t r a c e p i n g 的协议机制 由以上的描述可以得出s n m p 协议和i c m p 协议在所设计的该系统中的功能是 不同的。i c m p 主要监控的是到所监控服务器的链路连通性信息,s n m p 则采集和 服务器运行过程中可能出现的网络接口及处理器异常相关的0 i d 参数。这些参数 尽管是$ n m p 针对主机参数中非常小的一部分,但这些参数确实能够代表服务器 的运行状态信息,其值得变化幅度将是判断服务器是否出现异常的根据。通过对 这些参数的采集也能为网络服务器的配置和升级提供重要的依据。 下图是基于s n m p 和 c m p 协议的监控系统针对异常的监控归类,图示如下: i 鐾i 兰c m pfi i 操作,返回结果( 或一_ f 组值) - 所用协议一| 凰务器实时收到的_ _ _ _ 一 c 最。厦务器宴时输出的 字节羲 所用协议一s 硼p l 麓鏊鏊等等8 丝。一1 t # 吨蜘雌女# t 蓠= 二i i _ 一 _ 黼i 端嚣最一。1 。 _ 箜 图3 3 基于s n m p 和i c m p 的监捏系统针对异常的协议监控归类 3 3 s n m p 参数的选择及其r f c 定义 除了采集与服务器六种异常相关的参数,作为辅助参数还应知晓所监控服务 器的软硬件基本情况、系统的名称、网络管理员的姓名,服务器所处的物理位嚣 描述以及服务器物理内存大小。这些参数并不经常变化,在监控系统系统设计中 可以认为是静态参数。 采集的s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论