(计算机应用技术专业论文)网络故障管理专家系统的研究与实现.pdf_第1页
(计算机应用技术专业论文)网络故障管理专家系统的研究与实现.pdf_第2页
(计算机应用技术专业论文)网络故障管理专家系统的研究与实现.pdf_第3页
(计算机应用技术专业论文)网络故障管理专家系统的研究与实现.pdf_第4页
(计算机应用技术专业论文)网络故障管理专家系统的研究与实现.pdf_第5页
已阅读5页,还剩52页未读 继续免费阅读

(计算机应用技术专业论文)网络故障管理专家系统的研究与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着计算机技术与通信技术的飞速发展,计算机网络技术在现代社会中的金 融、政府、商业、交通、通信、制造业、服务业等各个领域,正发挥着越来越重 要的作用。在网络规模不断扩大,复杂性不断增加,网络的异构性越来越高的情 况下,实时保障网络的通畅、可靠也就显得极为重要。这除了要依靠网络设备本 身和网络架构的可靠性之外,网络故障管理是一个关键环节,它管理的好坏直接 影响着网络的运行质量。从公司维护的政务专网来讲,市政府各部门、各区县政 府的各部门之间通过政务专网开展每天的业务工作,通过网络传递业务数据,发 布政策措施和动态信息,共享资源,召开视频会议等等,这些业务都需要稳定、 可靠的网络环境。由此可见,政务专网网络的稳定运行,关系到各政府部门之间 的业务能否正常开展,其重要性不言而喻。因此,如何减少网络中断、减少网络 故障,如何快速解决网络故障成为越来越迫切需要解决的问题。 本论文从网络管理和网络故障管理出发,研究了专家系统的结构,就专家系 统的结构提出符合网络运维需求的网络故障管理专家系统架构。以这个架构为基 础,研究了网络故障获取,网络故障知识库的设计与实现,网络综合数据库的设 计与实现,推理机设计与实现,人机界面设计等5 个方面。其中推理机的研究借 鉴了规则理论和规则引擎原理,利用r e t e 算法进行设计,实现了故障匹配设计 的创新性研究。 关键词网络故障管理;专家系统;规则引擎;r e t e 算法 a b s t r a c t 曼鼍詈毫! ! 詈皇鼍皇! ! ! ! 鼍皇! 鼍曼詈! 曼詈皇曼鼍詈鼍i | 。ii i 鼍皇詈鼍皇! 皇詈詈! 鼍 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fc o m p u t e rt e c h n o l o g ya n dc o m m u n i c a t i o n t e c h n o l o g y , c o m p u t e rn e t w o r kt e c h n o l o g ya r ea p p l i e di nm o d e ms o c i e t y , i n c l u d i n g f i n a n c e ,g o v e r n m e n t ,b u s i n e s s ,t r a f f i c ,c o m m u n i c a t i o n ,m a n u f a c t u r i n g ,s e r v i c i n g b u s i n e s s ,i t p l a y a l lm o r e i m p o r t a n tr o l e w i t ht h ee n l a r g i n gn e t w o r k s c a l e ,i m p r o v i n go ff l e x i b i l i t ya n dd i f f e r e n tn e t w o r ka r c h i t e c t u r e i ti 8v e r yi m p o r t a n t t om a k et h en e t w o r ks m o o t ha n dr e l i a b l e e x c e p tf o rt h er e l i a b i l i t yo fn e t w o r kd e v i c e s a n da r c h i t e c t u r e , t h ef a u l tm a n a g e m e n ti sa ni m p o r t a n ts t e p ,i ti m p a c tt h eq u a l i t yo ft h e n e t w o r kw h e t h e ri t s g o o d o r n o t a c c o r d i n g t ot h e g o v e r n m e n ts p e c i a l n e t w o r k , b e t w e e ne v e r yd e p a r t m e n ti nm u n i c i p a lg o v e r n m e n ta n de v e r y d e p a r t m e n ti n e v e r yc o u n t yg o v e r n m e n t , e v e r y d a yg o v e r n m e n ta f f a i r sa r ec a r d e do u tt h r o u g ht h e g o v e r n m e n ts p e c i a ln e t w o r k t h r o u g ht h en e t w o r k ,p e o p l ec a nt r a n s m i tb u s i n e s sd a t a , i s s u ep o l i c i e sa n di n f o r m a t i o n , s h a r er e s o l l r o e $ ,h o l dv i d e oc o n f e r e n c e s ,e t c a l lt h e s e o p e r a t i o n sn e e das t e a d ya n dr e l i a b l en e t w o r ke n v i r o n m e n t s ot h es t e a d yo p e r a t i n go f g o v e r n m e n ts p e c i a ln e t w o r ki sc l o s e l yr e l a t e dt ot h en o r m a lr u no ft h ea f f a i r sb e t w e e n e v e r yd e p a r t m e n ti ng o v e r n m e n t , w h i c hm a k e si t ss i g n i f i c a n c es e l f - e v i d e n t t h e r e f o r e , i ti sm o r ea n dm o r eu r g e n tt os o l v et h ep r o b l e m so fh o wt or e d u c et h ea m o u n t so f i n t e r r u p t e de x c e p t i o n si nn e t w o r ka n dn e t w o r kf a u l t sa n dh o wt os o l v et h ef a u l t s q u i c k l y a c c o r d i n gt on e t w o r km a n a g e m e n ta n dn e t w o r kf a u l tm a n a g e m e n ti nt h i sp a p e r , d oar e s e a r c ho nt h ea r c h i t e c t u r eo fe x p e r ts y s t e m , t h e np r o v i d eaa r c h i t e c t u r eo f n e t w o r kf a u l tm a n a g e m e n ts u i tf o rt h ed e p a r t m e n to fn e t w o r km a i n t e n a n c e t h e a r c h i t e c t u r ei st h es t a r tp o 硫f o r r e s e a r c h ,i n c l u d i n go b t a i n i n gt h ef a u l to fn e t w o r k , d e s i g n i n gt h ek n o w l e d g eb a s e 、i n t e g r a t e dk n o w l e d g eb a s e 、i n f e r e n c ee n g i n ea n dt h e i n t e r f a c e t h ei n f e r e n c ee n g i n ea r er e f e r e n c e df r o mr u l et h e o r ya n dr u l ee n g i n e , u s i n g r e t ea l g o r i t h mt oi m p l e m e n t i t sac r e a t i v er e s e a r c ho ff a u l t m a t c h i n g k e yw o r d sn e t w o r kf a u l tm a n a g e m e n t :e x p e r ts y s t e m :r u l ee n g i n e ; r e t ea l g o r i t h m n i 独创性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他 人已经发表或撰写过的研究成果,也不包含为获得北京工业大学或其它教育机构 的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均 已在论文中作了明确的说明并表示了谢意。 签名: r - l - h l旁孓1i:i 口删:二: 。 关于论文使用授权的说明 本人完全了解北京工业大学有关保留、使用学位论文的规定,即:学校有权 保留送交论文的复印件,允许论文被查阅和借阅;学校可以公布论文的全部或部 分内容,可以采用影印、缩印或其他复制手段保存论文。 ( 保密的论文在解密后应遵守此规定) 签名:衄导师签名:- i 蝉日期:塑:兰塑 第1 章绪论 皇皇皇皇鼍曼! 皇m rw, ! ! 曼鼍! 鼍詈鼍曼! 苎! ! ! ! ! ! ! 曼! ! ! ! ! 曼! 曼苎! ! ! ! ! ! ! 鼍! ! 詈曼鼍! ! ! ! ! 鼍曼鼍曼! 曼鼍皇曼詈 1 1 引言 第1 章绪论 随着通信技术和计算机技术的飞速发展,计算机网络在金融、政府、商业、 交通、通信、制造业、服务业等社会生活的各个领域,正发挥着越来越重要的作 用。而以a p r n e t 为原型,以t c p i p 体系结构和协议标准为基础建立的因特网 ( i n t e m e t ) 是目前国际上规模最大的计算机网络系统,大约有上亿台的计算机联接 在因特网上。现代计算机网络的发展呈现以下特点:网络规模不断扩大,复杂性 不断增加,网络的异构性越来越高【1 1 。一个网络往往由若干大大小小的子网组成, 集成了多种d o s 平台【2 1 ,包括不同厂家、公司的网络设备和通信设备等。同时, 网络中还有许多网络软件提供各种服务。随着用户对网络的性能要求越来越高。 如果没有一个高效的网络管理系统对网络系统进行管理,那么很难保证为广大用 户提供令人满意的服务【3 1 。 故障管理是网络管理系统中最基本的功能之一,是网管中心注视全网的“眼 睛刀,对网络管理系统的发展有着很大的影响,并已成为现代信息网络中最重要 的问题。它的重要性已经在各方面得到体现,并为越来越多的人所认识,如果网 络服务意外中止,将会对生产、生活造成很大影响。网络的崩溃可能意味着生意 或日常生活的崩溃或巨额损失,表1 1 是来自世界著名的统计公司g a r m c r 的一 组网络中断对各个行业带来的损失的调查数据: 表1 - 1 网络失效引起的损失 t a b l e l ie x p e n s eo f n e t w o r kl a p s e 行业经营活动网络中断损失( 美元,j 、时) 金融服务业股票交易 6 ,0 0 0 ,0 0 0 金融服务业信用卡远程汇总交易2 ,4 0 0 ,0 0 0 媒体业 按观看次数付费1 5 0 ,0 0 0 零售业家庭购物( t v ) 1 0 0 ,0 0 0 零售业邮购目录 8 0 0 0 0 旅游业 预定航班8 2 ,0 0 0 运输业运送包裹 2 5 ,0 0 0 数据来源:a t & t g a r t n e r 集团 北京t 业大学t 学硕十学位论文 从上面数据中我们可以看出,网络的稳定性对各个行业都非常重要,几个小 时的网络失效会带来上千万甚至上亿美元的损失。 为了更好的提高网络故障管理水平,降低现代通信网络管理与维护的成本, 必须引入人工智能技术,实现一套科学的故障管理策略。对于网络运维来讲,如 何把网络故障问题处理好,是关系到企业为客户提供良好服务,保障客户网络稳 定的关键,也是企业生存的命脉。 1 2 课题来源和研究意义 1 2 1 课题来源 系首都信息发展股份有限公司( c a p i n f oc o m p a n yl i m i t e d ) 网络运行维护部 承担的首都信息政务专网运行支撑系统,项目的近期和中期目标是以自用为主, 在此基础上,远景目标是形成网络管理产品,提高网络维护人员的工作效率,更 好的解决网络故障的处理任务。资金来源属于公司战略投资。 1 2 2 研究意义 运行支撑系统对政务专网的运营质量起着关键作用,而政务专网的稳定运行 对提高政府在市民中的形象会起到积极作用。通过开发网络管理软件,逐渐形成 网络管理产品,已被确定为公司的战略发展方向。提高公司在网络故障管理方面 的智能化和自动化,减轻维护人员的工作压力,提高工作效率,使网络故障能够 得到及时的解决,才能满足客户日益增长的对网络服务的期望,为客户提供高性 能、高可用性、安全的i t 服务,如: ( 1 ) 保证网络的正常运行; ( 2 ) 快速、高效解决网络故障; ( 3 ) 提出有价值的信息化建议; ( 4 ) 保持合理成本。 为了给予客户稳定的网络环境,提高公司的运行服务质量,网络管理的有效 性和及时性就变得越发的重要,尤其是在故障管理方面。因此,如何快速、准确 的报告网络故障,如何准确的分析网络故障,如何及时地解决网络故障是故障管 理的重点,也是网络管理的重点。网络故障管理专家系统的提出,实现了一种智 能化的网络故障管理方案,更好的帮助运维人员提高解决故障的效率,更好的保 证客户网络无故障运行。只有使客户满意,甚至满意度超过客户预期,才能够使 企业平稳、快速的发展。 第1 章绪论 1 3 国内外相关研究发展状况及分析 故障管理作为网络管理的重要功能之一,是保证网络可靠性和可用性的重要 措施。故障管理包括从故障的检测、定位、诊断到故障排除的全过程h 1 。在 i n t e r n e t 的早期,网络规模不大,为用户提供的服务也不多,网络管理人员可 以通过简单的网络监视系统了解网络的运行情况。随着互联网的发展,特别是进 入9 0 年代以来,w w w 的兴起使得互联网用户数量迅速扩大,网络的规模急剧膨胀, 异构性更加突出,引起网络故障的因素也在增加。在故障管理领域,管理和网络 规模的矛盾日益突出,表现在需要处理的网络事件数量迅速增长,这是因为网络 是互相连接的,个别地方个别系统出现的故障必然会对网络其它部分的通信造成 直接或间接的影响,并以不同的网络事件反映出来。因此,仅仅能够报告管理对 象状态变化的简单的轮询监视系统障1 已不能满足网络管理的需要。面对日益增多 的网络事件,真正重要的故障信息往往被淹没在大量次要甚至无关的事件里,网 络管理人员希望故障管理系统能够提供更高的过滤和关联能力,帮助管理人员进 行准确的故障定位,以利于尽快排除故障。 现有网络管理方案面临的另一个问题是缺乏统一的管理流程,包括功能流程 和业务流程1 。从功能流程的方面来说,现有的网络管理方案大多只是定义了单 个管理操作和这些操作的对象,比如o s i 管理定义了g e t 和s e t 应该怎样执行, 但是并没有指出这些操作应该按照什么顺序执行以解决特定的管理问题;又比如 i n t e r n e t 管理定义了大量管理变量,但是并没有指出什么时候、在什么情况下、 为解决什么问题应访问( 读或写) 什么变量。同样地,基于o s i 或i n t e r n e t 管 理方案实现的网络管理系统口1 也没有告诉网络运行管理人员在什么情况下应启 动什么网络管理功能。缺乏统一的网络管理流程严重制约了网管系统功能的有效 发挥,因为许多情况下,网络管理人员必需根据自己的经验去尝试、“挖掘”网 管系统的功能。随着网络规模的扩大,缺乏定义良好的网络管理流程的网管系统 将很难有所作为。网络故障管理对于网络管理流程尤其重要,因此对网络管理流 程,尤其是故障管理流程进行全面的研究是十分迫切的。 在国外,许多电话运营公司从8 0 年代初就开始研究电话网的智能化管理系 统【8 1 。根据当时人工智能的发展水平,他们的智能管理系统大都采用了人工智能 中的专家系统技术,如b e l l 中a u t o m a t e dc a b l ee x p e r t i s e ( a c e ) s y s t e m m 】, g t e 的c e n t r a lo f f i c em a i n t e n a n c ep r i n t o u ta n a l y s i s s u g g e s t i o ns y s t e m ( c o m p a s s ) 0 0 ,a t & t 的n e t w o r km a n a g e m e n te x p e r ts y s t e m ( n e m e s y s ) 【i l 】,这 些系统在实际应用中都取得了很好的效果。这些良好的研究成果为现在提出的网 络故障管理专家系统起到了一定借鉴作用。 北京t 业大学工学硕十学位论文 在国内,网络发展同比国外相对较晚,网络管理的研究也是随着国内 i n t e r n e t 的普及才发展起来的,因此开始时的研究以网元层【1 2 】的管理和网络的 状态监视为主要研究方向l l3 1 。目前很多企业的网络管理已经从建设阶段进入运行 维护阶段,因此在服务效率和服务质量方面提出了更高的要求,前期网络管理系 统存在的不足也逐渐暴露出来。网络管理需求不明确,前期的网络管理产品大多 与网络应用同步建设,较少考虑到网络管理的需求,从而造成建设与实际应用要 求脱节,管理系统缺乏整体规划。各种管理产品的无计划性采购,造成各厂商的 管理界面不统一、数据无法互通、缺乏协同工作,简单的一个业务处理过程往往 要开好几个窗口来寻找设置的菜单。管理上更无法从整个i t 架构系统视角来进 行,基层运维人员也无法在同一管理平台进行管理。随着网络规模的迅速扩大, 网络管理的研究开始受到重视,智能化的网络故障管理成为网络管理的一个发展 方向。目前国内也提出了一些智能网络故障管理模型,如基于s n m p 的故障管理 模型、基于贝叶斯分类的分布式故障管理模型1 1 4 】。这些故障管理模型为智能化故 障管理的实现提供了很好的思路。 在首信公司的网络运行维护部内,网络运维人员在处理网络故障时主要依靠 人工进行网络故障的诊断和排除,平时处理网络故障的事例也没有很好的进行记 录和积累。并且运维部已经有了一些网络管理和测试工具,但还没有对已经处理 的网络故障进行专家系统的记录,以及应用专家系统解决故障问题,在出现同一 客户出现同一问题时,还要从新开始分析故障成因,不能马上给出处理方法。假 如记录了客户出现的某一个问题,当此问题再次出现时,可以马上给出客户建议, 这样才有了专家系统构思,而且可以告诉客户什么时间该客户出现同样的故障问 题,使客户的满意度超过客户的预期。 1 4 主要研究内容和论文组织结构 1 4 1 主要研究内容 通过对当前国内外发展现状、政务专网网络结构和公司网络管理状况的分 析,提出适合政务专网的故障管理专家系统模型,这个模型主要是为了提高网络 运维人员的工作效率。 依据此模型,借助n n m 系统以规则理论为基础,由删依据s n m p 协议获得 告警信息,将告警信息输入故障知识库,将故障现象和原因作成规则放入网络故 障综合数据库,规则推理机利用r e t e 算法匹配故障与原因,借鉴规则引擎原理 进行设计。 第1 章绪论 1 4 2 论文组织结构 本论文共分为4 章。 第1 章,对论文的课题背景和主要内容进行了简明概要的阐述,包括:课题 来源和研究意义,国内外相关研究发展状况及分析,本论文的主要内容。 第2 章,介绍了论文的理论背景,网络管理和故障管理的理论,网络管理包 括网络管理的功能,s n m p 体系及其具体知识:故障管理包括故障概述和网络告 警,以及二者的关系,还有网络故障处理总体工作流程。 第3 章,介绍了网络故障管理专家系统的架构,内容起于专家系统概述,介 绍专家系统概念、结构、特点;网络故障管理专家系统需求分析包括政务专网简 介、系统可行性、可控和非可控因素,以及系统的整体架构的提出。 第4 章,是专家系统的实现部分,是核心。网络故障信息采集模块包括网络 拓扑结构获取和故障获取,网络故障知识库包括设计原则和具体实现,网络故障 综合数据库包括设计原则和具体实现,规则推理机包括规则设计、规则引擎、 r e t e 算法及实现,人机界面表现了本系统的对外门户。 第2 章网络管理和故障管理理论 第2 章网络管理和故障管理理论 2 1 网络管理 2 1 1 网络管理简介 随着计算机技术和i n t e r n e t 的发展,企业和政府部门开始大规模的建立网 络来推动电子商务和政务的发展,伴随着网络的业务和应用的丰富,对计算机网 络的管理与维护也就变得至关重要。人们普遍认为,网络管理是计算机网络的关 键技术之一,尤其在大型计算机网络中更是如此。网络管理就是指监督、组织和 控制网络通信服务以及信息处理所必需的各种活动的总称。其目标是确保计算机 网络的持续正常运行,并在计算机网络运行出现异常时能及时响应和排除故障。 一般来说,网络管理就是通过某种方式对网络进行管理,使网络能正常高效 地运行。其目的很明确,就是使网络中的资源得到更加有效的利用。它应维护网 络的正常运行,当网络出现故障时能及时报告和处理,并协调、保持网络系统的 高效运行等。国际标准化组织( i s o ) 在i s 0 i e c 7 4 9 8 4 中定义并描述了开放系 统互连( o s i ) 管理的术语和概念,提出了一个o s i 管理的结构并描述了o s i 管 理应有的行为【1 5 】。它认为,开放系统互连管理是指这样一些功能,它们控制、协 调、监视o s i 环境下的一些资源,这些资源保证o s i 环境下的通信。通常对一个 网络管理系统需要定义以下内容: ( 1 ) 系统的功能 即一个网络管理系统应具有哪些功能。 ( 2 ) 网络资源的表示 网络管理很大一部分是对网络中资源的管理。网络中的资源就是指网络中的 硬件、软件以及所提供的服务等。而一个网络管理系统必须在系统中将它们表示 出来,才能对其进行管理。 ( 3 ) 网络管理信息的表示 网络管理系统对网络的管理主要靠系统中网络管理信息的传递来实现。网络 管理信息应如何表示、怎样传递、传送的协议是什么? 这都是一个网络管理系统 必须考虑的问题。 ( 4 ) 系统的结构 即网络管理系统的结构是怎样的。 2 1 2 网络管理功能 事实上,网络管理技术是伴随着计算机、网络和通信技术的发展而发展的, 二者相辅相成。从网络管理范畴来看,可分为对网“路 的管理。即针对交换机、 路由器等主干网络进行管理;对接入设备的管理,即对内部p c 、服务器、交换 机等进行管理;对行为的管理,即针对用户的使用进行管理;对资产的管理,即 统计i t 软硬件的信息等。根据国际标准化组织定义网络管理有五大功能:故障 管理、配置管理、性能管理、安全管理、计费管理【1 6 1 。下面来介绍一下网络故障 管理、网络配置管理、网络性能管理、网络计费管理和网络安全管理五个方面网 络管理功能: ( 1 ) 网络故障管理 计算机网络服务发生意外中断是常见的,这种意外中断在某些重要的时候可 能会对社会或生产带来很大的影响。但是,与单计算机系统不同的是,在大型计 算机网络中,当发生失效故障时,往往不能轻易、具体地确定故障所在的准确位 置,而需要相关技术上的支持。因此,需要有一个故障管理系统,科学地管理网 络发生的所有故障,并记录每个故障的产生及相关信息,最后确定并改正那些故 障,保证网络能提供连续可靠的服务。 ( 2 ) 网络配置管理 一个实现中使用的计算机网络是由多个厂家提供的产品、设备相互连接而成 的,因此各设备需要相互了解和适应与其发生关系的其它设备的参数、状态等信 息,否则就不能有效甚至正常工作。尤其是网络系统常常是动态变化的,如网络 系统本身要随着用户的增减、设备的维修或更新来调整网络的配置。因此需要有 足够的技术手段支持这种调整或改变,使网络能更有效地工作。 ( 3 ) 网络性能管理 由于网络资源的有限性,因此最理想的是在使用最少的网络资源和具有最小 通信费用的前提下,网络提供持续、可靠的通信能力,并使网络资源的使用达到 最优化的程度。 ( 4 ) 网络计费管理 当计算机网络系统中的信息资源是有偿使用的情况下,需要能够记录和统计 哪些用户利用哪条通信线路传输了多少信息,以及做的是什么工作等。在非商业 化的网络上,仍然需要统计各条线路工作的繁闲情况和不同资源的利用情况,以 供决策参考。 ( 5 ) 网络安全管理 计算机网络系统的特点决定了网络本身安全的固有脆弱性,因此要确保网络 第2 章网络管理和故障管理理论 资源不被非法使用,确保网络管理系统本身不被未经授权的访问,以及网络管理 信息的机密性和完整性。随着互联网技术的迅猛发展和企业技术信息在网络的广 泛应用,网络安全管理日益变得重要且必不可少,安全问题不仅关系一个企业的 核心竞争力,甚至和一个国家的国防息息相关。 2 1 3s n m p 体系 2 1 3 1s n m p 简介s n m p 是英文“s i m p l en e t w o r km a n a g e m e n tp r o t o c o l 的 缩写,中文意思是“简单网络管理协议。s n m p 首先是由i n t e r n e t 工程任务组 织( i n t e r n e te n g i n e e r i n gt a s kf o r c e ,即i e t f ) 的研究小组为了解决i n t e r n e t 上的路由器管理问题而提出的【1 7 1 。s n m p 是目前最常用的环境管理协议。s n m p 被 设计成与协议无关,所以它可以在i p ,i p x ,a p p l e t a l k ,o s i 以及其他用到的传 输协议上被使用。s n m p 是一系列协议组和规范,它们提供了一种从网络上的设 备中收集网络管理信息的方法。s n m p 也为设备向网络管理工作站报告问题和错 误提供了一种方法。 以s n m p 为技术的网络管理系统( n m s ) m 】中,管理工作站利用s n m p 进行 远程监控管理网络上的所有支持这种协议的设备( 如计算机工作站、终端、路由 器、h u b 、网络打印机等) ,主要负责监视设备状态、修改设备配置、接受事件警 告等。 2 1 3 2s n m p 消息在o s i 模型中,传输层的数据单元也称为数据包( p a c k e t s ) 。 s n m p 采用的是u d p ( 用户数据报协议) 作为其传输层协谢1 9 1 ,并为s n m p 提供网 络服务,u d p 协议的数据单元称为数据报( d a t a g r a m s ) 。因为u d p 是一种不可靠 的数据报服务,所以并不能保证u d p 数据报一定能达到目的,但是掉包问题并 不对网络管理产生大的影响。s n m p 消息包含两个部分:s n m p 报头和协议数据 单元p d u ( p r o t o c o ld a t au n i t ) t 2 0 j ,其中s n m p 报头包括s n m p 版本号和团体名。 s n m p 版本号目前有三种:v e r s i o n l 、v e r s i o n 2 、v e r s i o n 3 。团体标识可以作为s n m p 消息的口令,缺省值为 p u b l i c ”。 s n m p 消息有五种类型: ( 1 ) g e t r e q u c s t :m a n a g e r 端向a g e n t 端发送读取信息的请求; ( 2 ) g e tn e x t _ r e q u e s t :m a n a g e r 端向a g e n t 端发送读取信息的请求; ( 3 ) g e t _ r e s p o n s e :a g e n t 端对m a n a g e r 端请求的响应; ( 4 ) s e t _ r e q u e s t :m a n a g e r 端向a g e n t 端发送设备设置信息,a g e n t 端可根据 设置信息来改变设备状态; ( 5 ) t r a p :当a g e n t 端发生某些事件时,a g e n t 端主动向m a n a g e r 端发送陷阱 信息,如关机事件。 北京工业火学t 学硕十学位论文 具体的s n m p 的这5 种报文操作见图2 1 。 s h m p 管理程序 s n m p 代理程序 g e t - 唧s t g e t r e s p o n s e 7 i i ) p 端口1 6 1 g e t - n e x t - 聆q m 乱 珊p 端口1 6 1 r g e t - z e s l o o n s e 鼬t - l e q u e s t p 藕口1 6 1 一 g e t r e s l o o 墙e trap 珊p 端口1 6 , 2 图2 - 1s 璩伊的5 种报文操作 f i g u r e2 - 1 f i v em e s s a g eo p e r a t i o n so fs n m p 封装成u d p 数据报的5 种操作的s n m p 报文格式见图2 - 2 。 ,啊翔】 v j h 嚣聊臣 一 2 字节8 字节。靳r i 咿掭文- n 首都p 苕毒 公荑铺m 首葡i 洲首都 变量绑定 , l 滕 翟l 篙紫l 篙矧名h 名什 i co , l 一一 。| , 1 絮矬l 舞l 慧 话定时问名 i 鼍名 d 。 代码 弦 i 一 - m - a i - - 图2 - 2s n 肝报文格式 f i g u r e2 - 2 t h ea r c h i t e c t u r eo fs n i v i pm e s s a g e 2 1 3 3 s n m p 网络管理模型在s n m 管理模型中有三个基本组成部分【2 i 】:管 理者( m a n a g e r ) ,被管代理( a g e n t ) 和管理信息库( m i b ) 。具体的s n m p 管理 模型如图2 3 所示。 第2 章网络管理和故障管理理论 8 n mp 管理代壤 圈申数字? 卜边t r e q u 鹳t 加嘲t xt r e q u 始t 争呐t r a t l u 铭t 吨t r e 8 p o t m e 争一t r a p 图2 - 3s n m p 管理模型 f i g u r e2 - 3m o d e lo fs n m pm a n a g e m e n t 管理站【2 2 】一般是一个单机设备或一个共享网络中的一员,它是网络管理员和 网络管理系统的接口,能将网络管理员的命令转换成对远程网络元素的监视和控 制,同时从网上所有被管实体的m i b ( 管理信息库) 中提取出信息数据。作为管理 站,它还必须拥有能进行数据分析、故障发现等管理应用软件。整个管理站的管 理工作是通过轮询代理来完成的。管理者可以通过s n m p 操作直接与管理代理 通信,获得即时的设备信息,对网络设备进行远程配置管理或者操作;也可以通 过对数据库的访问获得网络设备的历史信息,以决定网络配置变化等操作。 s n m p 管理代理田】指的是用于跟踪监测被管理设备状态的特殊软件或硬件, 每个代理都拥有自己本地的m i b 。实际上,s n m p 的管理任务是移交给管理代 理来执行的。代理翻译来自管理站的请求,验证操作的可执行性,通过直接与相 应的功能实体通信来执行信息处理任务,同时向管理站返回响应信息。 主机、网桥、路由器及集线器均可作为管理代理工作。网络管理代理是驻留 在网络设备中的软件模块,这里的设备可以是u n i x 工作站、网络打印机,也可 以是其它的网络设备。管理代理软件可以获得本地设备的运转状态、设备特性、 系统配置等相关信息。管理代理软件就像是每个被管理设备的信息经纪人,它们 完成网络管理员布置的采集信息的任务。管理代理软件所起的作用是,充当管理 系统与管理代理软件驻留设备之间的中介,通过控制设备的管理信息数据 北京丁业大学t 学硕十学位论文 ( m a n a g e m e n ti n f o r m a t i o nb a s e ) 中的信息来管理该设备。管理代理软件可以把 网络管理员发出的命令按照标准的网络格式进行转化,收集所需的信息,之后返 回正确的响应。在某些情况下,管理员也可以通过设置某个m i b 对象的值来命令 系统进行某种操作。 管理信息数据库( m i b ) 【2 4 】定义了一种数据对象,它可以被网络管理系统控 制。m i b 是一个信息存储库,这里包括了数千个数据对象,网络管理员可以通过 直接控制这些数据对象去控制、配置或监控网络设备。简单网络管理就是通过对 m i b 各种变量的访问,统计,分析,从而对网络进行管理。对m i b 变量的访问是 实现网络管理各功能的基础。所以m i b 库在s n m p 中占有核心位置,如图2 4 所 示。 图2 4m i b 库地位 f i g u r e2 - 4 t h ep o s i t i o no fm i b 蘧者 网络管理系统可以通过网络管理代理软件来控制m i b 数据对象。不管到底有 多少个m i b 数据对象,管理代理都需要维持它们的一致性,这也是管理代理软件 的任务之一。现在已经定义的有几种通用的标准管理信息数据库,这些数据库中 包括了必须在网络设备中支持的特殊对象,所以这几种m i b 可以支持简单网络管 理协议( s n m p ) 。使用最广泛、最通用的m i b 是m i b i i 。为了利用不同的网络 组件和技术,又开发了一些其它种类的m i b ,它们在r f c ( r e q u e s tf o rc o m m e n t s ) 中有所记录。 m i b 采用树形结构,即对象命名树( o b j e c t n a m i n g t r e e ) ,给出了一个网络 中所有可能的被管理对象的集合的数据结构。网络或互联网中的每个系统( 工作 站、服务器、路由器等) 都维护一个可以反映被管理资源在系统中的状态的m i b 。 通过读取m i b 中对象的值,网络管理状态可以监视系统中的资源,也能够通过 修改这些值来控制系统中的资源。它的根在最上面,根没有名字。 第2 章月管目和障管4 4 论 m i b 对象组示例如图2 - 5 所示 * 。j 高, ,。;i i i :;:i - 、:i :i ;i _ i :i ;i 蕊。 一 尹7 【 m m l _ = 赢一一“ 。蛹蔷尹磊盖孓嘉萨蒜轴删 。m k 2 ( 1 ) 卜一1 , 3 6 1 - 2 :1 k 啊p 扭e 牡 1 3 0 1 4 1 。二乡,震蔫蔷蔫謇毒蓦善嘉 i i j l j i j l 图2 - 5m i b 对象组 f i g u r e2 - 5m i b o b j t g r o u p 对象命名树的项级对象有三个,即i s o 、i t u t 和这两个组织的联合体。在 i s o 的下面有4 个结点,其中的饿一个( 标号3 ) 是被标识的组织。在其下藤有 一个美国国防部( d e p a r t m e n to f d e f e m e ) 的子树( 标号是6 ) 再下面就是i n t e r n e t ( 标号是1 ) 。在只讨论i n t o n e r 中的对象时,可只画出i n t e m e t 以下的子树( 图 中带阴影的虚线方框) ,并在i n t a c t 结点旁边标注上 1 3 6 1 j 即可。 在i n t e m e t 结点下面的第二个结点是m g m t ( 管理) ,标号是2 。再下面是管 理信息库,原先的结点名是m i b 。1 9 9 1 年定义了新的版本m m 一阁,敲结点名 现改为m i b 一2 ,其标识为 1 3 6 12 1 ,或 i n t e m e t ( i ) 2 1 ) 。这种标识为对象标识 符。最初的结点m i b 将其所管理的信息分为8 个类别,见表2 一l 。现在的m i b 2 所包含的信息类别已超过4 0 个。 应当指出,m i b 的定义与具体的网络管理协议无关,这对于厂商和用户都 有利。厂商可以在产品( 如路由器) 中包含s n m p 代理软件并保证在定义新 的m i b 项目后该软件仍遵守标准。用户可以使用同一网络管理客户软件来管理 具有不同版本的m 的多个路由器。当然,一个没有新的m m 项目的路由器不 能提供这些项目的信息。 北京工业大学工学硕士学位论文 表2 1最初的结点m i b 管理的信息类别 t a b l e 2 - l t h eo r i g i n a ln o d eo fm i bm a n a g e m e n ti n f o r m a t i o n 类别标号所包含的信息 s y s t e m( 1 ) 主机或路由器的操作系统 i n t e r f a c e s ( 2 ) 各种网络接口及它们的测定通信量 a d d r e s st r a n s l a t i o n ( 3 ) 地址转换( 例如a r p 映射) l p( 4 ) i n t e m e t 软件( i p 分组统计) l e t u p( 5 ) i c m p 软件( 已收到i c m p 消息的统计) t o p( 6 ) t c p 软件( 算法、参数和统计) u d v ( 7 ) u d p 软件( u 】d p 通信量统计) e g p( 8 ) e g p 软件( 外部网关协议通信量统计) 这里要提一下m i b 中的对象 1 3 6 1 4 1 ) ,即e n t e r p r i s e s ( 企业) ,其所 属结点数已超过3 0 0 0 。例如i b m 为 1 3 6 1 4 1 2 ) ,c i s c o 为 1 3 6 1 4 1 9 ) , n o v e l l 为 1 3 6 1 4 1 2 3 等。世界上任何一个公司、学校只要用电子邮件发 往i a n a - m i b i s i e d u 进行申请即可获得一个结点名。这样各厂家就可以定义自 己的产品的被管理对象名,使它能用s n m p 进行管理。 2 2 网络故障管理 2 2 1 网络故障概述 网络故障是指被管理网络硬件或软件发生的紊乱,或某一物理单元处于不能 实现其功能的持续状态。网络是一个很复杂,牵涉很多方面的东西。硬件的问题、 软件的漏洞、病毒的侵入等等都可以引起网络的故障。网络故障有广义和狭义之 分。广义的网络故障包括网络中的所有硬件或软件发生的异常现象,包括主机( 端 用户、服务器) 故障、通信设备故障、线路故障等。而狭义的网络故障只包括构 成网络所必须的通信设备和线路故障,不包括主机故障。 为了降低设计的复杂性,增强通用性和兼容性,计算机网络都设计成层次结 构。这种分层体系使多种不同硬件系统和软件系统能够方便地连接到网络。目前 广泛使用的t c p i p 协议将网络分成5 个层次,每一层完成各自的功能并对上一 层提供服务。产生网络故障的原因就能分布在其中的任意一层内,每一层的故障 有每一层的解决方法。我们参考t c p i p 协议对网络故障按照5 个层次进行了分 类: 第2 章网络管理和故障管理理论 物理层故障 产生这类故障的原因有:线路问题( 断裂) 、接口卡坏、线路介质不匹配等, 对双绞线来说,还有线路干扰过大、e t h e r n e t 网线过长等,对于光纤来说,还 有光收发器故障、耦合器连接故障等。 数据链路层故障 产生这类故障的原因有:协议绑定错误、速率设置不匹配、端口管理性关闭、 v l a n 不一致、v t p 陷阱等。 网络层故障 产生这类故障的原因有:路由表未设置、路由表未激活、路由协议配置不匹 配、路由表中丢失路由、自制区号设置错误、网络i p 地址不正确、网络拥塞等。 传输层故障 产生这类故障的原因有:访问列表配置有误、过滤限制了服务连接等。 应用层故障 产生这类故障的原因有:应用服务未开启、服务器( 客户端) 配置不合理、 服务器资源( c p u 、内存、缓冲区大小) 配置限制等。 将网络节点故障分层可以为判断节点故障提供方便。网络节点不能正常工作 的原因可能是上述任何一层的故障引起的,而且低层的故障会引发高层的故障发 生,如物理层和数据链路层的故障会促使网络层出现故障。因此,系统程序也相 应的逐层对产生故障的原因进行检测。 同时计算机网络可分为通信设备和主机设备。对一个规模较大的城域网来 说,通信设备通常由通信线路和节点设备( 接入设备、转发设备) 组成;主机设 备通常由网络服务器和用户主机组成。网络的各种设备按照其功能和作用可划分 为不同的种类,不同种类的网络设备又涉及到不同层次的网络故障。 通信设备: 传输介质,涉及到物理故障; 集线器,涉及到物理层

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论