已阅读5页,还剩63页未读, 继续免费阅读
(计算机软件与理论专业论文)基于事件机制的网管系统中的网元监控规划.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
中文摘要 本文针对n e t o o o l 系列网管产品在i c b c 网管升级项目中的实施,提出了基于 n e t c o o l 事件机制的网元监控规划思想,简化了网管产品的实施部署难度,减轻了 网管监控人员的定制负担,并且将n c t c o o l 系列产品强大的s y s l o g 采集功能,s n m p 监控功能和事件丰富,事件关联功能有机地结合在一起,整个网管产品系列以网 元规划为单位的有机整合 本文对一套低耦合的网管系列平台进行统一的网元管理,将网管系统对专业 知识的要求,简化为网管系统对网络人员网络架构熟悉程度,对网络监控类别的 归纳。并由此将网管系统的基础信息来源做到与网管人员无关;将定制网管采集 规划与网管信息实时监控区分开来,明确监控人员和产品定制人员的角色定位。 在此基础上,本文详细介绍了n c c 配置工具对n e t c o o l 产品各个模块的整合过程, 并以工商银行网管升级优化项目为背景,介绍了网元监控规划,在实际项目中的 应用情况。 关键词:n c t c o o l ,网元,规划,监控,n c c 分类号:t p 3 9 3 0 7 a b s t r a c t t h ep a p e ri na l l u s i o nt ot h en e t c o o ls e r i a sn e t w o r km a n a g e m e n tp r o d u c ti nt h e i m p l e m e n t a t i o no fi c b cn e t w o r km a n a g e m e n tl l l ,f a d ep r o j e c t , b r i n g sf o r w a r da p l a n n i n go f n e t w o r k - e l e m e n tm o n i t o r i n ga n dc o n t r o l l i n gb a s e do ne v e n tm e c h a n i s m , p r e d i g a s t s t h ed i f l i c i l l t yo fn e t w o r km a n a g e m e n tp r o d u c t i m p l e m e n t ,l i g h t e n c u s t o m i z a t i o nb u r d e no f t h en e t w o r km a n a g e r a n da l s oc o m b i n e st h ep o w e r f u ln e t c o o l m - i a sp r o d u c t , s y s l o gp r 0 1 ) e ,s n m pm o n i t o ra n de v e n te n r i c h m e n ta n de v e n ta s s o c i a t e 眦m a k a st h ew h o l en e t w o r km a n a g e m e n ts y s t e mo r g a n i cu n i t e db a s e do n n e t w o r k - e l e m e n tc o n t r o l l i n 舀 t h i se s s a ya i m st o u n i f o r m l ym a n a g eb yn e t w o r ke l e m e n to n - s e r i e so f 量 l o w - c o u p l e dn e t w o r km a n a g e m e n t , s i m p l i f i e st h ep r o f 黜s i o n a lr e q u i r e m e n ta 5f o r n e t w o r km a n a g e m e n ts y s t e ma sf o l l o w :t h ee x t e n to ft h en e t o w o r km a n a g e m e n ts y s t e m b e i n g 锄a w a r eo ft h en e t w o r ks t u f fa sw e l la sn e t w o r k 赶c h i t e c t u r e , t h es m m n a r ya n d c l a s s i f i c a t i o no ft h en e t w o r km o m t o rc a t e g o r y t t h ea u t h o rt r i e st om a k et h eb a s i c i n f o r m a t i o ns o u r c 燧o f n e t w o r km a n a g e m e n ts y s t e mi nd e p e n d e n to f t h en e t w o r ks t u t 霹, t os e p a r a t et h en e t w o r km a n a g ec o l l e c t i o np l a nw i t l lt h er e a lt i m em o n i t o r i n go f n e t w o r k i n f o r m a t i o na n dt h u st oc l m f yt h ed i f f e r e n tr o l e so ft h em o n i t o r sa n dt h ep e r s o ni n c h a r g eo ft h ep r o d u c tc u s t o m i z e o nt h i sb a s i s ,t h i se s s a ye l a b o r a t e st h ew h o l ep i o c 地s $ i n t e g r a t e db yt h en c c t o o l sf o re a c hm o d u l eo f n e t e n o lp r o d u c t , m e a n w h i l et a k i n gt h e u p r i n ga n do p t i m i z i n gp r o j e c to fi c b cn e t w o r km a n a g e m e n ta se x a m p l e ;t h e m o n i t o r i n gp l a no fn e t w o r ke l e m e n ta sw e l la st h ea p p l i c a t i o ni np r a c t i c a lp r o j e c th a v e b e e ni n t r o d u c e d k e y w o r d s :n e t c o o l ,n e t w o r k - e l e m e n t , c o n t r o l l i n g ,m o n i t o r i n g ,n c c 致谢 本论文的工作是在我的导师韩臻教授的悉心指导下完成的,韩臻教授严谨的 治学态度和科学的工作方法给了我极大的帮助和影响在此衷心感谢三年来韩臻 老师对我的关心和指导 刘吉强老师悉心指导我们完成了实验室的科研工作,在学习上和生活上都给 予了我很大的关心和帮助,在此向刘吉强老师表示衷心的谢意。 在实验室工作及撰写论文期间,彭馥、王爱兵、王凯、毕斐等同学对我论文 中的i m p a c t ,w c b t o p 等方面的研究工作给予了热情帮助,在此向他们表达我的感 激之情。 另外也感谢家人和朋友,他们的理解和支持使我能够在学校专心完成我的学 业 1 1 研究背景 1 引言 随着网络规模越来越大,许多企业和部门不得不付出极大的人力、物力对网 络进行管理如果采用传统的人工分散管理方式,发现一个问题解决一个问题, 不仅成本高,而且处理故障的周期特别长于是,网管软件应运而生 网管系统是面向全网根据对网络资源集中监控,集中维护和集中管理思想设 计开发的网络管理系统。网管系统也是全网络操作的运营系统,是用户及运营者 的使用、操作运营网络系统界面,充当了全网络系统基本用户功能与用户、运营 者所需管理功能之问的接口它主要面向运营者,为整个网络提供操作、使用和 运营解决方案,保障全网络基本服务功能正常运行,在此基础上还可以进一步提 供相关的基于事务模型的业务分析决策支持手段随着网络管理相关技术逐步成 熟,各类网络管理技术和需求逐步的规范化和标准化,以及各类网络各级管理系 统逐步实施和推广,综合网络管理系统的雏形和国内市场空间开始渐渐显现,国 际市场前景也应该看好网络管理系统作为应用系统,不同于一般应用系统,它 有着比一般应用系统更加广阔的应用前景和市场前景,而综合网络管理系统尤其 如此。【l 】 国外大型网管厂商主要有m mt i v o l i 、h t ) o p e n v i e w 和c au n i c e n t e r , m i c r o m u s e 的n c c o l 系列产品等本文所基于的m i c z o m u s c 公司的n e t c o o l 系列 产品,其旗舰产品n e t c 0 0 1 ,o m n l b u s 应用软件是一个电信运营级的服务与业务保 障系统。这个系统支持实时的收集并整理来自网络运行环境中的网络运行事件和 报警信息,并以确定,直观和简洁的方式将这些信息呈现给用户 大型网管系统的特点是功能强大,覆盖网络管理的计费、认证、配置、性能 和故障的各个方面。缺点是需要专业化的技术团队进行管理,可以称之为“网管 软件的网管”,具有投入大、实施周期长的特点,而且运营和维护非常麻烦。 n e t c o o l 系列产品进入中国短短5 年时间,已经占领了相当部分的金融和电信 网管市场,笔者在参与n e t c o o l 系列产品在i c b c 网管升级优化项目的实施过程中, 发现n e t c o o l 系列产品平台性强,耦合性低,缺乏专业网管知识的普通网络管理员 很难对其所有产品现有深入的了解和准确的应用,因此需要一套完善的网元监控 规划体系,对其进行有机整合。 1 2 网管系统概述 网管系统,其本质是运维支持系统,也可称为行为支持系统,即通过此工具 来支持行为,提高行为工作效率。网管软件是专门为运维人员设计的,帮助运维 人员进行自动化的网络监测和管理,最终目的是减少故障,从而提高盯效率。网 管软件作为有效的网络运维工具,当其部署于整个网络系统,作为网络运转的一 个有效组成部分,并形成完善的信息采集、输入、输出等体系时,就成为真正意 义上的网管系统。网管系统可以帮助运维人员提高工作效率,保障网络7 * 2 4 持续、 稳定运行。网管系统的作用可以从以下三个方面来理解,即:网络监管自动化, 复杂工作简单化,工作流程标准化p l 从大的方面来说,凡是网络存在的地方、有服务器或应用的地方都需要网络 管理,网管软件就是应用在这些领域。从实际运用来看,网管软件主要应用于电 信、银行、金融、石油石化等各个行业,主要是对其网络中的网络设备、服务器、 中闻件、数据库、电子邮件、w e b 系统、d n s 电子商务等进行监测和管理管理。 按照网管软件管理的对象,它可以分为系统管理软件和设备管理软件。系统管理 软件是对整个网络进行全面、深入监测管理的软件,它管理的对象包括服务器、 网络设备和应用系统,管理的技术和方法更加专业、精深 1 3 本课题国内外研究现状 对于大型的金融,证券行业的用户来说,由于其数据业务的运作已经由分散 向集中式演迸,许多已经建立了其全国性,地区性的数据中心,集中的处理其业 务集中式的数据中心对其网络的可靠性要求极高,而复杂的网络结构和不同的 业务流向使得网络的故障寻找交得非常困难,传统的网管使用辩眦p 轮i i im i b 库 的报警方式不但周期长,而且会报出相当多的无关紧要的信息,增加网管人员的 排障负担。用户迫切需要一个能够智能发现故障根源,能够智能压缩报警信息的 故障管理工具。各个网管厂家纷纷提出了自己的解决方案:如惠普公司的o e m f 思想,提出了由h po p e n v i e w 网管系统+ 服务支持专家团队+ 核心设备的一套解决 方案。阿尔卡特o m n i v i s t a 网管解决方案和阿尔卡特o m n i t o u e h 统一通信应用套 件,提出了一体化信息处理和实时协作功能的思想。 随着人们对网络服务重要性的认识日益提高,电信服务提供商为了保持其自 身的竞争力,由此产生了服务水平管理( s e r v i c el e v e lm a n a g e m e n t ) 的概念。该 理念的主要推广的是如下思想:软件必须能够即刻安装和迅速部署;必须具备易 于阅读的图形用户界面;必须能够让操作员迅速查找到网络的“事件”和“故障”; 2 必须能够实时地从网络的任何地方收集网络的事件和故障信息;必须是高度开放 的,作为事件管理的核心,不仅要和网络中原有的网管软件集成,而且要提供广 泛的集成选择性,以适应网络未来发展的要求;必须能够灵活地监视任何网络设 备的可用状态,而不管网络的基本平台和管理系统是如何的复杂;必须能实时地 适应网络基础设施的变化;必须能够跟随网络基础设施的扩展而变化m i c r o m u s e 公司的n e t c o o l 系列产品,从服务水平理念上,解决了这个国内外众多厂商研究的 课题 n e t c o o l 系列网管产品对于大多数中国人而言,是一个比较陌生的名词,但在 国外,n e t c o o l 系列网管产品拥有许多成功的实施案例。如最初的英国电信的成功 实施,以及在美国最大的电信运营商a t & t 上的成功实旌,为n e t c o o l 系列品牌打 下了坚实的基础。2 0 0 2 年,n e t c o o l 产品与香港电讯盈科公司合作,建立起预警式 管理系统使网络管理系统从报警式向预警式成功地跨越近年来n e t c o o l 在中国 市场飞速的发展,占领了大量的金融和电信领域的大型网管项目,本次作者参与 的i c b ct 行网管升级优化项目,正是因为甲方人员对当前网络管理的发展趋势, 进行了充分的分析,决定将其现有的网管产品进行优化升级,用n e t c o o l 系列网管 产品,取代原先的l i p o p e n v i e w 网管产品可见,以n e t c o o l 系列为代表的事件网 管,是当今网管系统发展的一个趋势 基于n e t c o o l 产品事件机制的网元监控规划,是国内诸多n e t c o o l 产品集成商 所共同需要面对的问题,目前尚未有非常完善的能够将n e t c o o l 系列,i s mm o n i t o r , s y s l o gp r o b e s 以及i m p a c t 系列产品结合在一起的集中规划产品本文基于此机制 所提出的n c c 产品,将应用在今后的网管产品实施规划中 1 4 本文工作 本文的主要工作是,分析大型网管系统中管理困难的根本原因,并提出网元 规划,对大型网管系统管理的重要性,由此,本文在基于n e t c o o l 系列网管产品的 基础上,提出并开发了n c c ( n e t c o o l 配置工具) 这样一个辅助开发工具,对网元 进行有效的规划,并且对网元的分散监控,改为n c c 集中监控,n c c 产品,是一 个网管产品的桥梁模块,很多大型网管软件都忽略了用户这样一个最终决定因素, 只是单纯的注重网管产品的先进性和功能性,网管最终是一个以人为本的服务体 系,需要关注的,恰恰是网络人员的维护难度,和网络人员的维护强度。n c c 在 这一方面,很大程度上弥补了n e t c o o l 产品的不足 本文的目标定位在,将网管系统对专业知识的要求,简化为网管系统对网络 人员网络架构熟悉程度,对网络监控类别的归纳。并由此将网管系统的基础信息 3 来源做到与网管人员无关;将定制网管采集规划与网管信息实时监控区分开来, 明确监控人员和产品定制人员的角色定位 本文针对n e t c o o l 系列网管产品在i c b c 网管升级项目中的实施,提出了基于 n e t c o o l 事件机制的网元监控规划思想,简化了网管产品的实施部署难度,减轻了 网管监控人员的定制负担,并且将n e t c o o l 系列产品强大的s y s l o g 采集功能,s n m p 监控功能和事件丰富,事件关联功能有机地结合在一起,整个网管产品系列以网 元规划为单位的有机整合 4 2 基于事件机制的n e t c o o l 系列网管产品介绍 2 1n e t c o o l 系列网管产品架构 图2 1 t c o o l 系列网管产品核心组件o m n i 即s 体系结构 n e t c o o l 系列网管产品主要分三个层面: 采集层: 采集层的产品主要负责对各个网元的各项数据的监控,主要的采集层产品有 s y s l o gp r o b e :系统日志采集探针,负责将网络设备所产生的系统日志,经 过探针的归一化处理,传输至o b j e c t s e r v e r 日志数据库 i s mm o n i t o r :i s m ( i n t e r n e ts e r v i c e sm o n i t o r ) 主要负责对网络设备的常规 服务质量进行监控,如网络设各的连通性( p i n g ,t c p p o r tm o n i t o r ) ,网络设备的 c p i j ,内存使用情况,网络设备的端口带宽利用率( s n m pm o n i t o r ) 核心层: o m n i b u s 核心层的核心模块,是基于内存数据库技术的o b j e c t s e r v e r 数据库。 o m n i b u s 是整个m i c r o m u s e n e t c o o l 系列网管产品的核心部件,从结构上讲o m n i b u s 处于事件的处理层,称n e t e o o l 系列网管产品为基于事件机制的网管产品,正因 5 为n e t c o o l 网管,将网络设备的各项指标,统一成拥有不同的级别的事件,并统 一的存放在o b j e c t s e r v e r ( o m n i b u s 核心数据库) 事件数据库中,事件机制有效 地将网络人员从大量的网管数据中解放出来,使得网络的管理和维护变得简单。 从纯粹的设备导向,故障导向,转化成事件导向 事件呈现和事件丰富: 事件呈现主要是由n e t c o o le v e n tl i s t ,以及基于w e b 模式的w e b t o p ,基于 c s 模式的d e s k t o p ,性能采集报表产品由蹦r e p o r t e r 实现。以上组件直观地反 映了当前网络状况 事件丰富组件i m p a c t 。是将事件信息进一步与外部环境关联的有效工具,如 将具体的网络设备,与具体的负责人挂钩,并可以通过事件告警机制,使网络管 理人员在第一时问内除了了解故障原因之外,还能及时通知相应的负责人加以解 决,加快故障的排除速度 此外n e t c o o l 系列网管产品还有一系列外围的产品,如拓扑发现产品 p r e c i s i o n ,门户产品p o r t a l 等等。 2 2核心模块o m n i b u s 2 2 1o m n i b u s 概述 如图2 1 所示o m n i b u s 是整个m i c r o m u s en e t c o o l 系列网管产品的核心部件, 从结构上讲o m n i b u s 处于事件的处理层,称n e t c o o l 系列网管产品为基于事件机 制的网管产品,正因为n e t c o o l 网管,将网络设备的各项指标,统一成拥有不同 的级别的事件,并统一的存放在o b j e c t s e r v e r ( o m n i b u s 核心数据库) 事件数据 库中,事件机制有效地将网络人员从大量的网管数据中解放出来,使得网络的管 理和维护变得简单,从纯粹的设备导向,故障导向,转化成事件导向。 由上面n e t c o o lo m n i b u s 的部署拓扑结构我们不难看出o b j e c t s e r v e r 位于整 个系统的核心,其下层,连接着各种p r o b e 和m o n i t o r ( 负责事件采集的组件) , 其上,连接着n e t c o o l 网管系统的呈现模块( e v e n tl i s t ,w e b t o p ,d e s k t o p 等等) , 而其外部,不但可以与相同的o b j e c t 做f a i l o v e r ( 错误跳转备份) ,并可以通过 不同的g a t e w a y 与,外部的数据库和事件丰富模块( i m p a c t ) 相关联 o m n i b u s 在整个n e t c o o l 系统中的地位相当于系统的心脏,其从下层接受到的 事件并非简单地接收,而是经过一定的事件过滤,事件合并规则,通过网管实施 和客户化定制人员的规则制定,我们能清楚地对需要关注的事件进行有效的管理。 6 2 2 2 网管事件的定义 所谓网管事件,是指网管所管理的网元的运行状态的一个描述,之所以用事 件而不是实际数据来监控网元,事件有其几方面的优势; l ,单纯的数据,往往无法说明当前网络的运行状态,如某服务器的i c m p 值, 无法正确地描述该服务器的当前网络状态,往往只有将该i c m p 值和系统定义的可 接受的i c m p 范围与i c m p 历史值加以对比,才能正确地判断运行是否正常以及峰 值的状况。 2 ,事件所描述的状态往往是经过丰富和加工的这一点是单纯的数据所无法 比拟的单纯的网管数据,仅仅是某台主机上的某一个或一类数据。而事件的引 入,可以将描述进行扩充,引入事件,就必然有与该事件匹配的外部数据库,将 事件产生的网员的具体物理位置,维护网管人员,甚至包括所需拨打电话,以及 事件的可能解决方案进行准确的描述。 3 ,事件的引入,有助于将网络中出现的问题进行严重程度划分,按照n e t c o o l 系列网管产品,以及当前国际上流行的故障严重级别划分方法,一般情况下, o m n i b u s 的事件分为6 个级别,分别是,无故障,2 级故障,3 级故障,6 级 故障。按照事件的严重程度,故障级别越高的事件拥有更高的处理优先级以及更 加显眼的显示 4 。引入事件,可以将网管人员从繁琐的数据处理和故障排查中,适当地解放 出来,我们知道,网络的维护困难度,随着网络的规模的增大,其难度的增大并 非线性地增长的,而是呈几何级数的增加。而网管人员在大型,特大型网络中的 角色尤为关键,对于网络中存在的问题,必须按照严重程度,分主次轻重地解决 而往往,很多问题所引发的潜在问题,也是由于网络规模的庞大而无法直观地发 现,更无从排除引入事件机制,可以让网管人员在日常的维护中通过对事件的 不断熟悉,总结出问题的根源,并通过事件的丰富性加以快速有效的排除。 以上几点充分说明了,基于事件机制的网管系统,并不是简单意义上的名词 变更,而是彻底上的一种网管革命,换句话说,传统的依靠数据导向的网管方式, 已经无法适应当前巨型网络环境和海量的网络数据所带来的工作量。自动的,智 能的,事件化的网管机制,已经在很大程度上取代传统的网管方式 2 2 3o m n i b u s 的体系结构 o m n i b u s 核心数据库o b j e c t s e r v e r 是一个内存态的数据库,基于内存态的数 据库拥有如下优点:运行速度快,因为内存访问的运行速度要远远大于外存访问, 7 因为网管数据的海量性,所以必须用更快的数据库存储方式来支撑。数据实时性, 网管数据一般需要即时处理,而无须永久性存储,所以大部分事件在内存数据库 刷新之前都应该被解决 但是对于报表类数据之类的需要存放一定时间的数据,则o m n i b u s 数据库需 要外部永久数据库或者外部呈现模块中的存储单元支撑。 o b j e c t s e r v e r 的特性还包括冗余数据处理( d e d u p l i c a t i o n ) 和自动化 ( a u t o m a t i o n ) 功能冗余数据处理用于对同一设备在不同时态下所产生的相似 事件进行合并,我们知道在网络系统中,网元出现故障的概率要远远小于正常运 行的概率,所以大部分情况下,网元产生的数据都是正常的无须单独声明的,冗 余处理能使网管内存数据库时刻处于优化运行的状态,而不会因为垃圾事件造成 对内存空间和性能的损耗自动化用于网元事件之间的关联,网络是一个互相关 联丽并非独立的系统,网元之间是存在相互依赖相互制约的关系的,比如,当某 条线路出现中断故障的时候该线路终端的服务器也应该同样出现无法访问的故 障,这时候,由于并非所有的事件采集机制都是主动采集,可能出现服务器故障 而无法向o m n i b u s 传送相关的事件的情况,这时候,就必须从线路故障来得出服 务器故障这个结论,这就是自动化功能所实现的 探针( p r o b e s ) ,探针属于事件采集模块,其主要功能是将服务器或网络设备 中网络相关的日志经过规则文件处理传送到o b j e c t s e r v e r 中,常用的p r o b e s 包 括s y s l o gp r o b e s 和t r a c ep r o b e s 此类采集属于被动采集即只有网元支持并产 生该类数据p r o b e s 才能获取相关信息,而当网元出现故障并无法产生日志信息的 时候,探针将不起作用。 监视( m o n i t o r s ) ,与探针类似,m o n i t o r s 属于事件采集模块,它与探针的主 要区别是此采集属于主动采集即通过各种网络协议( i c m p ,s n n p ,t c p p o t 等等) ,主 动向受监控网元发送数据包,并通过反馈的信息形成事件。n e t c o o l 的常用m o n i t o r 有i n t e r n e ts e r v e r sm o n i t o r 因特网服务监控,s s m 数据流监控 网关( g a t w a y ) ,网关是o m n i b u s 的外部接口,通过网关o m n i b u s 能够与备份 o m n i b u s 进行灾难备份工作,并且通过网关o m n i b u s 能够连接第三方的应用或者数 据库,为事件的丰富和存储提供接口。常见的网关有通往i m p a c t 模块、通往o r a c l e 数据库模块等等。 o m n i b u s 的呈现模块包括基于桌面的事件呈现模块d e s k t o p 和用于管理员维护 的a d m i n i s t r a t i o nt o o l s 2 3性能采集模块i s m 8 2 3 1i s m 模块概述 i s m 作为n e t c o o l 系列产品非核心模块( 与产品历史有关,i s m 为m i c r o m u s e 公司收购的产品) 中最常用的产品模块,有着不可代替的作用。i s m 模块主要提供 网元的主动采集功能,对被监控对象提供基于各种协议的性能采集,从最基本的 连通性测试( 1 0 4 p ) 到各种性能数据的采集( s n m p ) ,以至于对各种应用服务的性 能采集( t c p - p o r t ) ,都提供了良好的支持,而i s m 由于是后期购入的产品,与 o m n i b u s 产品间的接口会显得比较复杂,其除了提供o m n i b u s 事件这一数据数据流 向之外更提供了一共三种针对不同应用的数据流向,以下是各种数据流向的简单 说明 2 3 2i s mm o n i t o r 三种数据流向介绍 图2 2 性能事件数据流向结构图 m o n i t o r 定时对需监控的系统对象做p o l l 轮询,网络设备返回设备监控所需 要的数值,m o n i t o r 将结果传输给i s mb r i d g e ,b r i d g e 将数据发往三个方向,i s m s e r v e r ,s mr e p o r t e r ,以及o b j e c t s e r v e r 中,i s m 用于控制m o n i t o r 的属性配置, o b j e c t s e r v e r 接收性能事件,s mr e p o r t e r 对性能数据产生报表。 9 北塞交通去堂硒圭堂僮论塞一基王室佳扭劐的m ! q q ! 丕到圆萱亡晶盒缉 1 ,o b j e c t s e r v e r 模块 o b j e c t s e r v e r 模块将m o n i t o r 数据通过r u l e s 文件传送到o b j e c t s e r v e r 中, 启用0 s 模块需要在b r i d g e p r o p s 中将0 s 模块的m o d u l e 打开 2 ,d a t a l o g 模块 d a t a l o g 模块,将m o n i t o r 采集的性能数据,封装成x m l 格式存放在指定的路 径中,我们在i s ms e r v e r 的w e b 界面中看到的性能数据,就是从d a t a l o g 模块中 传输过来的d a t a l o g 模块的m o d u l e 在b r i d g e p r o p s 中是默认打开的 3 ,d a t a b a s e 模块 d a t a b a s e 模块是i s gm o n i t o r 与外部数据库通信的接口,i s m 利用t i b c ob u s 总线协议,将m o n i t o r 采集的性能数据,封装并广播到指定端口的t i b c o 总线上, 数据封装的格式由i s m b r i d g e m a p 文件所决定 i s m b r i d g e m a p 文件是性能数据到数据库的一个映射标准,它决定了数据库的 表结构,以及数据库表中各字段所对应的性能参数的映射,i s m b r i d g e m a p 文件存 放在$ o 删i h o m e m o n i t o r s l i n u x 2 x 8 6 中,在i s ms e r v e r 与s mr e p o r t e r 的数据传 输中,我们必须编辑和修改i s m b r i d g e m a p 文件 2 4 事件日志采集模块p r o b e p r o b e 模块是n e t c o o lo m n i b u s 体系结构中的采集层 n e t c o o l p r o b e 模块进行实时采集,其“被动式”采集模式决定了对网络资源 消耗极低,并且支持设备类型非常广泛,几乎可以采集所有种类的网络设备故障 以及各种系统、数据库、存储及应用的故障信息,并可灵活定制采集策略使其可 用于采集自行开发的特殊应用的故障信息。 p r o b e 由于属于m i c r o m u s e 公司自行开发产品,所以在产品接口上,比i s m 模 块要简单一些,主要的借口是p r o b e 通过r u l e s 文件,将事件,经过r u l e s 处理 之后送达o b j e c t s e r v e r 服务器,此处r u l e s 文件的作用为,为各类网元( 包括网 元的设备类型,厂商等,n e t c o o l 提供了大量的主流设备p r o b e 供用户选择) 中包 含的各种信息,经过一定的归纳总结,最后统一成o b j e c t s e r v e r 数据库中的各字 段值。 2 5 拓扑发现模块p r e c i s i o n p r e c i s i o n 是一个相对独立的模块,同样,它也是在n e t c o o l 核心模块之外的, 1 0 其作用是对i p 网络进行有效的拓扑发现,p r e c i s i o n 通过各种不同的协议,能够 准确地找寻网络中有效的节点,不管是二层协议还是三层协议,都能提供很好的 支持,这在一般的网络产品中是不多见的,这里提这个模块是有另外一层含义。 首先,一个大型网管系统中的网元统计是一个相当繁琐的过程,就拿作者实 际参与的项目而言,某台设备上线或者下线,因为种种原因,很可能没有在设备 数据库中备案,造成某些网元无法被管理,或者某些无效网元被管理,造成垃圾 事件的产生。p r e c i s i o n 由于是实时发现,可以从很大程度上避免这种情况发生, 让网络管理更加地有效率,定期的拓扑发现,是有效的网元规划管理的一个重要 辅助手段。 2 6 事件丰富模块i m p a c t i m p a c t 的英文含义是冲击,影响,而其在n e t c o o l 系列产品中,起到的作用, 正如它的名字一样,他能对事件产生实质上的冲击和改变事件之所以重要是由 于其可读性和可操作性,而i m p a c t 无疑是锦上添花的作品,其将事件与项目的实 际情况结合,让网管人员可以更加清晰地定位故障比如,若某台服务器暂时停 止工作,网管人员通过经i m p a c t 丰富过的事件,不仅能准确地定位到发生故障的 服务器的具体物理位置,还可以通过事件,知道这个故障应该由谁负责,由谁管 理,给谁打电话,并且,有可能的话,i m p a c t 还能得出故障的大致解决方案。 i m p a c t 是网元规划管理中的丰富模块,p r e c i s i o n 模块处于整个流程的第一 步,而经i m p a c t 模块丰富出来的事件,则是整个网元规划管理的最终效果。 3n e t c o o lc o n f i g u r a t i o nc e n t r e 网元规划系统 3 1网元规划管理在网管系统中的重要性 建设综合网管系统的难点就是对各种关键业务的理解和监控手段的实现。同 时需要指出的是,由于各种关键业务总是处于不断的改进、调整、变化中,因此, 要求综合网管系统的业务应用监控部分能够快速随之调整和修正根据了解,目 前绝大多数网管系统只能实现对基础架构的管理,对于各种业务应用的管理或者 无能为力,或者只是松散集成应用厂商提供的简单监控工具,还有些厂家提供的 应用监控软件与平台监控软件从底层完全拆离,实际上是两张皮的方式 其次,在业务层面,不同的电信运营商有着大同小异的业务支撑系统例如 中国移动的b o s s 系统、中国联通的综合电信业务支撑系统、电信和网通的9 7 工 程十计费系统等,同时同一个电信运营商内部又有多个关键业务系统,例如,对于 联通来说,除了综合营账之外,还有1 0 0 1 客服系统,增值业务中的w a p 、短信、 b r e w ,定位等:对于电信来说,除了9 7 和计费之外,还有1 1 2 、1 0 0 0 0 以及数据 局的各种专线接入、宽带接入、a d s l 、d d n 、邮件等关键业务应该说,建设综合 网管的目标决不是仅仅针对i t 基础架构,真正能够帮助维护人员解决问题的是针 对各种关键业务中的i ( b p ( 关键业务点) 和k p i ( 关键性能指标) 的监控才是综合网管 系统的价值所在。 所谓网元监控规划,即对被管设备( 网元) 的管理方式,以及事件呈现级别, 进行有效的预设计和管理,单从此描述不足以建立有效的概念,下面举几个体现 网元监控规划的必要性的例子: 首先,一台网络设备,往往需要多种数据的采集,需要使用多套n e t c o o l 产 品组件,或者使用一个产品的多个模块,这必将使配置出现不一致和异步等问题, 并且使配置变得复杂和繁琐。如何将网元高效地进行监控规划,是该大型金融企 业网管项目一个重要的问题。 其次,同样类型的网络事件,由于设备重要性,线路重要性等因素,会呈现 不同的事件级别,统一的事件规则无法实现对不同设备和线路的级别区分,单独 地配置则会使工程实施变得异常复杂。如何将事件级别的定义与不同类型设备和 线路有机的结合,是该大型金融企业网管项目另一个重要问题。 基于以上两点,一个符合实际项目要求的网元监控规划系统的提出有重大的 1 2 现实意义。 3 2大型网管系统中的监控元素 大型网管系统的常见监控元素有: 1 ,线路,指网络中网元问的通信线路,线路的连通性决定了网络的正常工作。 常见的线路监控方式有:i c m p 线路端点,以及网络拓扑发现。 2 ,网络设备,指网络中路由器,交换机,中继器等支撑网络运营的核心和边 缘设备。 常见的网络设备监控方式有:i c m p ,s n m p 网络设备性能采集,s y s l o g 网络日 志分析。 3 ,网络设备端口监控,网络设备还往往包括网络设备的端口监控,端口监控 的数量,往往是单纯网络设备监控的若干倍 常见的端口监控方式有;i c m p ,s n m p 端口性能流量分析 4 ,服务器设备,指网络中提供各种服务的相应服务器,如m c u 控制口,经 营分析数据库,w e b 标准服务器等 。 常见的服务器设备监控方式有:1 0 4 p ,s n m p 服务器性能采集,t c p p o r t 服务 器服务端口性能采集。 作为一个大型网管系统而言,是否能够对以上各类网元进行监控,是一个网 管系统的成败所在。n e t c o o l 拥有强大的事件机制,但同样需要管理众多的网元, 目前尚未有非常完善的能够将n e t c o o l 系列,i s mm o n i t o r ,s y s l o gp r o b e s 以及 i m p a c t 系列产品结合在一起的集中规划产品。 监控元素除了按照设备类型划分,还需要按照网络拓扑位置进行划分: 如在i c b c 项目中,所监控网元还有按照地市行设备和核心设备进行划分。下 面是i c b c 某分行的部分监控网元( 其中i p 仅供参考,并不代表真实情况) 表3 1 监控网元示意表 营业部监控端口其他监控信息 q l n f 7 5 0 l鲫16 乱l 全部 l i n l f y 7 5 0 29 9 1 6 3 2全部 蛳州s - 0 l16 3 2 1 没有 i 哪舶29 9 16 3 2 2没有 分行1监控端n 其他监控信息 眦y 7 5 0 19 9 3 2 3 1全都 1 3 眦y 7 5 0 29 9 3 2 3 2全部 删l y 4 0 0 l9 9 3 2 3 2 1没有 l 札y 4 0 0 29 9 3 2 3 2 2 没有 m l l l f l l o l 9 9 3 2 o 1 2 6 全部外同防火墙 分行2监控端口其他监控信息 删】0 【7 5 0 1 9 9 4 0 3 1 全部 蜘q ) 疆7 5 0 24 0 3 2全部 | 科) 口【4 0 0 l9 9 4 0 3 2 1没有 肼x x 4 0 舵4 0 3 2 2没有 瑚q 呵o l4 0 0 2 4 0全部外同防火墙 分行3监控端口其他监控信息 唧聍7 5 0 l 鲫船3 1 全部 i m 盯7 5 0 2驰4 8 3 2全部 删盯4 l鲫4 8 3 2 l没有 豫哐刚岫0 24 8 3 2 2没有 埘咿f 肿l4 8 o o1 1 6全部外网防火墙 分行4监控端日其他监控信息 i 州) 【c 7 5 0 1帕5 6 3 1 全部 i 眦7 5 0 29 9 5 & 3 2全部 哪) 【c 4 5 0 1鹎5 6 3 2 l没有 加哪4 5 0 2姻5 6 3 2 2 没有 唧x ( :f 0 l9 9 5 6 o 1 2 6全部 外网防火墙 3 3监控元素基于事件严重性级别的划分粒度分析 事件严重性级别,是指某事件对网络的影响程度,在网管项目中,出现网络 故障时有发生,但是,对于大型网管而言,网络故障的严重程度,取决于出故障 的设备的物理位置和作用,其决定因素是物理位置是否为骨干线路,其作用是否 为核心作用。作为网元监控的一个重要指标,事件级别划分的完整程度,对网络 人员的维护拥有指导性意义,可以让网络人员从大量的网络事件中分析总结出需 要优先解决的事件类型。 对于事件严重性级别,应该考虑到具体的项目要求,但是通常情况下,如, 在i c b c 项目中,对事件严重性级别的划分依据是: l ,i 级事件:全国骨干网瘫痪 2 ,2 级事件:某省行骨干网点瘫痪,或核心业务瘫痪 3 ,3 级事件:某省行地市行网点瘫痪 4 ,4 级事件:某拥有双机热备份的核心业务瘫痪,或拥有双线路的网络单点 5 ,5 级事件:某非核心业务服务器瘫痪 6 ,6 级事件:不影响业务的其他事件。 7 ,1 0 0 级事件:正常事件。 3 4解决方案- n c c 系统的提出和原理 为了解决上述两个项目实麓的难点问题,我们在设计中使用了n e c k 配置工具 系统,使上述两个问题得到有效地解决 该系统的中心思想有三点: 1 ,将网元从一个统一的平台进行导入,避免单独配置出现的网元缺漏现象。 2 ,将网元的各项监控纳入到统一的配置界面中,使得在项目中使用的各种 p r o b e 和m o n i t o r 安装后无需二次配置。 3 ,将事件级别的定义,转化为监控策略的定义,拥有相同监控属性的设备, 用相同的监控策略进行定义,并最后按照监控策略,生成n e t c o o l 产品赖以识别 的外表 1 5 整个配置工具的运行流程如下: 重 图3 1 配置工具设计运行流程 如上图,资源管理中体现了网元的标准化导入,一般情况下,从p r e c i s i o n 拓扑发现的结果导入所需要监控的网元全集,并通过系统内置的s n m p 探针,丰富 被导入网元的具体信息。 监控策
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 大班电脑活动教案(2025-2026学年)
- 专题抛物线其性质年中职数学对口升学考试专题复习精讲教案
- 幼儿园小班综合《母亲节》教案
- 不等式不等式组经典教案(2025-2026学年)
- 名校联盟河南省洛阳市下峪镇初级中学八年级语文上册阿长与山海经第一课时教案
- 幼儿园小班环保教案我们的朋友水
- 苏教版六年级下册石灰吟语文教案
- 2025年超星尔雅学习通《数据可视化工具应用案例分享》考试备考题库及答案解析
- 2025年超星尔雅学习通《品牌推广成功案例分享》考试备考题库及答案解析
- 2025年下学期高二化学基于守恒思想的计算试题
- GB/T 46634-2025冲模导柱固定座
- 2025年大学《海洋渔业科学与技术-渔业资源学》考试备考题库及答案解析
- 敬畏生命安全班会课件
- 完整版国企钢结构施工工艺指导手册
- 债券交易员知识培训课件
- 冶金物理化学期末辅导(北科考研)课件
- 协调制度与归类总规则课件
- 定量药理学发展及其在新药研制与临床合理用药中应用课件
- DB32/T 4400-2022《饮用水次氯酸钠消毒技术规程》-(高清正版)
- 黑布林-Peter-Pan-中英双语阅读
- 宿舍楼安全安全评价
评论
0/150
提交评论