(计算机应用技术专业论文)移动智能网网管告警系统的设计与实现.pdf_第1页
(计算机应用技术专业论文)移动智能网网管告警系统的设计与实现.pdf_第2页
(计算机应用技术专业论文)移动智能网网管告警系统的设计与实现.pdf_第3页
(计算机应用技术专业论文)移动智能网网管告警系统的设计与实现.pdf_第4页
(计算机应用技术专业论文)移动智能网网管告警系统的设计与实现.pdf_第5页
已阅读5页,还剩62页未读 继续免费阅读

(计算机应用技术专业论文)移动智能网网管告警系统的设计与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

北京邮电大学硕士学位论文移动智能嘲阿管告警系统的设计与实现 移动智能网网管告警系统的设计与实现 摘要 告警系统在整个网络管理系统中处于核心地位,它是保证网络资 源有效运行的关键部分。本文从系统架构和具体应用出发,提出了一 个网管告警系统的设计与实现方案。 本文第一部分从介绍移动智能网网管系统功能划分入手,总结了 网管告警系统的设计原则和需要实现的主要功能。 本文第二部分重点介绍了告警系统的设计方案。告警系统的设计 方案主要涵盖了系统架构设计、通信机制设计和关键算法设计三个方 面。 告警系统的架构设计依据高可靠性、高性能的原则,采用集群架 构,向外提供统一的告警上报点,集群内部则运用负载均衡算法将告 警的处理平均分配到所有处理服务器上,该系统架构在高可用性、可 伸缩性和可管理性上具有很大优势。 告警系统中涉及到的消息通信主要有设备告警上报和告警系统 集群内部通信两个方面。在设备与告警系统通信机制设计中,通过对 比t c p 和u d p 方式的优缺点,根据告警具有突发性和能瞬间形成告 警风暴的特点,采取无连接的u d p 方式作为设备告警上报机制;集 群通信采用消息中间件作为基础通信设施,屏蔽了互异系统的物理差 异,极大提高了系统的可扩展性。 告警系统中涉及到的关键算法主要有负载均衡策略和基于r a t 的告警关联算法。负载均衡策略由放置策略,信息策略和传送策略三 个部分组成,本文详细讨论了策略的设计思路和在系统中的应用流 程;告警关联算法通过测试故障发生前告警事件发展趋势,将关联的 活跃告警事件提取出来,辅助维护人员进行故障分析,本文详细描述 了算法的设计和验证过程。 本文第三部分介绍了告警系统的具体实现,着重讨论了系统并发 模型和通用组件的实现方案。 北京邮电大学硕士学位论文 移动智能嗍嘲管告警系统的设计与实现 关键词:告警系统集群架构负载均衡消息中间件告警关联 r a t 测试r e a c t o r 模式b o s s w o r k e r s 模式 b e l j i n bu n i v e 晤i t yo fp o s t sa n dt e t e c o m m u n i c a t i o n s d e s i g na n di m p l e m e n t a t l o no fa l a r m m l 气n a g e m e n ts y s t e mf o rm o b i l ei n t e l l i g e n t n e t w o r k a b s t r a c t a l a r mm a n a g e m e n ts y s t e m ( _ 气m s ) ,w h i c he n s u r e st h ee f f i c i e n t o p e r a t i o n o fn e t w o r kr e s o b r c e s ,i sas i g n i f i c a n t c o m p o n e n to ft h e n e t w o r km a n a g e m e n ts y s t e m ( n m s ) b a s e do ns y s t e ma r c h i t e c t u r ea n d c o n c r e t ef u n c t i o n a l i t y , t h e d e s i g n a n di m p l e m e n t a t i o no fa m si s i n t r o d u c e db yt h r e ep a r t si nt h i sp a p e r b yi n t r o d u c i n gn m sf u n c t i o n a lp a r t i t i o n i n g ,t h ed e s i g np r i n c i p l e a n dm a i nf u n c t i o n a l i t yo f a m sa r ea n a l y z e di np a r ti p a r ti ig i v e st h ed e s c r i p t i o no fa m sd e s i g nf r o mt h r e ea s p e c t s , w h i c ha r ea r c h i t e c t u r ed e s i g n ,c o m m u n i c a t i o nm e c h a n i s md e s i g na n dk e y a l g o r i t h md e s i g n t oa c h i e v et h ed e s i g np r i n c i p l e so fh i g hr e l i a b i l i t ya n dh i g h p e r f o r m a n c e ,a m sa d o p t sc l u s t e ra r c h i t e c t u r e ,w h i c hp r o v i d e sas i n g l e a l a r ma c c e s s i n gp o i n to u t s i d ea n du s e sl o a db a l a n c i n gs t r a t e g yt ob a l a n c e s e r v e r s w o r k1 0 a di n s i d e c o m m u n i c a t i o nm e c h a n i s mi sd i v i d e di n t ot w op a r t s :a l a r mr e p o r t m e c h a n i s m , c o n s i d e r i n gt h ec h a r a c t e r i s t i co fa l a r mr e p o r t ,u s e su s e r d a t a g r a mp r o t o c o l ( u d p ) t o t r a n s f e r a l a r m s ;t h ei n s i d e - c l u s t e r c o m m u n i c a t i o ni m p l e m e n t st h em e s s a g e o r i e n t e dm i d d l e w a r et oa c h i e v e h i g hs c a l a b i l i t y k e ya l g o r i t h md e s i g ni n c l u d e st w of a c e t s :t h el o a db a l a n c e s t r a t e g y , w h i c hi sc o m p o s e do fd i s p a t c hs t r a t e g y , l o a dd e s c r i p t i o n s t r a t e g ya n dl o a dr e p o r ts t r a t e g y ;t h ea l a r mc o r r e l a t i o na n a l y s i s a l g o r i t h m ,b a s e do ns t a t i s t i c a lt e s t i n gt h e o r y , a n a l y z e sa l lt h ec o r r e l a t e d a c t i v ea l a r me v e n t sw h e naf a i l u r eo c c u r s t h et h e o r yh a sb e e nw i d e l y u s e dt op r e d i c tt h et r e n do f p o s s i b l ef u t u r ef a i l u r e si nm a n ya p p l i c a t i o n s t h ef i n a lp a r to ft h ep a p e rf o c u s e so nt h ec o n c u r r e n c yp a t t e r n d e s i g na n dg e n e r a lc o m p o n e n ti m p l c r n e n t a t i o n k e yw o r d s :a l a r mm a n a g e m e n ts y s t e m ,c l u s t e ra r c h i t e c t u r e , l o a db a l a n c e ,m e s s a g e o r i e n t e dm i d d l e w a r e ,a l a r mc o r r e l a t i o na n a l y s i s , r e v e r s ea r r a n g e m e n tt e s t i n g ,r e a c t o rp a t t e m ,b o s s w o r k e r sp a t t e r n 独创性( 或创新性) 声明 本人声明所呈交的论文是本人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果,也不包含为获得北京邮电大学或其他 教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任 何贡献均已在论文中作了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:越塑睦兰坠 日期: 逆2 :丝尘 关于论文使用授权的说明 学位论文作者完全了解北京邮电大学有关保留和使用学位论文的规定,即: 研究生在校攻读学位期间论文工作的知识产权单位属北京邮电大学。学校有权保 留并向国家有关部门或机构送交论文的复印件和磁盘,允许学位论文被查阅和借 阅;学校可以公布学位论文的全部或部分内容,可以允许采用影印、缩印或其它 复制手段保存、汇编学位论文。( 保密的学位论文在解密后遵守此规定) 北京邮电大学硕士学位论文 移动智能网阿管告警系统的设计与实现 第一章移动智能网网管技术概述 1 1 智能网简介 智能网( i n :i n t e l l i g e n tn e t w o r k ) 是从2 0 世纪8 0 年代发展起来的一个通信 网业务控制体系结构,其实质是一个在现有电信网上附加的网络结构,用于快速、 有效、经济和方便地生产和提供新业务。 智能网的基本设计思想是把智能业务逻辑从基础网络中分离出来,即将传统 交换机的交换功能和业务控制功能相分离,并增加一些新的功能部件,新增加的 功能部件与原有的交换机相互配合,从而灵活方便的实现新业务。 智能网概念模型( i n c m :i n t e l l i g e n tn e t w o r kc o n c e p t u a lm o d e l ) 【1 】是智能网 技术的核心概念,是智能网结构能够适应不断增长的业务需求和不断出现的新技 术的保证。i n c m 采用层次化、结构化及面向对象等原理和技术,将智能网用一 个四层平面模型来表示,这四个层面从上到下依次为:业务层、全局功能层、分 布功能层和物理层,如图1 1 所示: 图1 - 1 智能网概念模型 北京邮电大学网络与交换技术国家重点实验室 北京邮电大学硕士学位论文移动智能网网管告警系统的设计与实现 业务层( s p :s e r v i c ep l a n e ) 是最上面的一层。业务层是从业务用户和业务 提供者的角度出发面向业务的视图。每种业务由一个或多个业务特征( s f :s e r v i c e f e a t u r e ) 构成。 全局功能层( g f p :g l o b a lf u n c t i o n a lp l a n e ) 面向业务的设计者,呈现出智 能网网络平台的开放性。智能网在该层中引入业务无关的构件s i b ( s e r v i c e i n d e p e n d e n tb u i l d i n gb l o c k ) ,业务开发人员利用s i b 进行业务开发。 分布功能层( d f p :d i s t r i b u t e df u n c t i o n a lp l a n e ) 面向智能网的设计与实现 者,呈现智能网内部各功能实体( f e :f u n c t i o n a le n t i t y ) 的划分及其实现,并 定义了功能实体的实现模型和规定功能实体间的消息流( :i n f o r m a t i o nf l o w ) 。 物理平面( p h p :p h y s i c a lp l a n e ) 是最下面的一层。物理平面面向网络运营 者和设备提供者,它模拟智能网结构的物理内容,识别那些可存在于实际智能网 结构中的不同物理实体( p e :p h y s i c a le n t i t y ) 和规程,说明哪个功能实体在哪 个物理实体中实现。 1 2 移动智能网简介 g s m ( g i o b a ls y s t e mf o rm o b i l ec o m m u n i c a t i o n s ) 移动智能网( 下文中,g s m 移动智能网简称为移动智能网) 是叠加在g s m 移动网上的智能网。 在g s m 移动网中。移动智能网的建设是在现有网络基础上增加业务交换点 ( s s p :s e r v i c es w i t c hp o i n t ) 、智能外设( i p :i n t e l l i g e n tp e r i p h e r a l ) 、业务控制 点( s c p :s e r v i c ec o n 缸 o lp o i n t ) 、充值中心( v c :v o u c h e rc e n t e r ) 、业务生成环 境( s c e :s e r v i c ec r e a t i o ne n v i r o n m e n t ) 、业务管理点( s m p - s e r v i c em a n a g e m e n t p o i n t ) 、业务管理接入点( s m a p :s e r v i c em a n a g e m e n ta c c e s sp o i n t ) 等物理实 体而实现的【z l ,如图1 - 2 所示。 2北京邮电大学罔络与交换技术国家重点实验室 北京邮电大学硕士学位论文 移动智能嘲网管告警系统的设计与实现 图1 - 2 移动智能网的体系结构 业务交换点具有业务交换功能( s s f :s e r v i c es w i t c hf u n c t i o n ) 用于识别智 能业务,悬置需要特殊处理的呼叫,请求s c p 中业务逻辑的支持,然后根据s c p 的指令完成相应的动作。 业务控制点具有业务控制功能( s c f :s e r v i c ec o n t r o lf u n c t i o n ) 和业务数据 功能( s d f :s e r v i c ed a t af u n c t i o n ) ,是智能网的关键设备。它根据运行的业务 逻辑指示业务交换点完成相应的动作。 智能外设提供特殊资源功能( s r f :s p e c i a lr e s o u r c ef u n c t i o n ) ,负责提供语 音指示、接受用户拨号等特殊资源。 充值中心具有业务数据功能,保存充值卡等信息。 业务管理点具有业务管理功能( s m f :s e r v i c em a n a g e m e n tf u n c t i o n ) 和业 务管理接入功能( s e r v i c em a n a g e m e n t a c c e s sf u n c t i o n ) 。通常用于对智能网的m 、 s c p 和v c 进行管理。管理功能包括业务管理、故障管理、配置管理、计费管理、 性能管理和安全管理。 业务生成环境具有业务生成环境功能( s c e f :s e r v i c ec r e a t i o ne n v i r o n m e n t f u n c t i o n ) ,用于设计开发新的业务。 目前,r r u t 没有对业务管理系统和业务生成环境的功能和接口进行详细的 规范。 北京邮电大学网络与交换技术国家重点实验室 北京邮电大学硕士学位论文移动智能刚刚管告警系统的设计与实现 1 3 移动智能网网管功能简介 智能网网络管理域作为t m n ( t e l c w , o m m u n i c a t i o nm a n a g e m e n tn e t w o r k ) 管 理框架下的1 3 个网络管理域之一【列,具有独特的网络管理单元。对移动智能网 的管理,包括对移动智能网中的智能网设备、设备上驻留的功能实体及所支持的 移动智能业务等的管理,所涉及的管理功能包括拓扑管理、配置管理、故障管理、 性能管理及操作维护。 移动智能网中需要被管理的智能网设备有:s c p 、s m p 、v c s d p 、i p 及s s p 。 移动智能网中需要被管理的功能实体有:s c f 、s m f 、s r f 、s s f 。 移动智能网的建设是在现有g s m 网基础上增加s s p 、s c p 、s c e p 、s m p 、 s m a p 、充值中心等功能实体而实现的。因此,移动智能网网管系统也纳入g s m 网管系统中去。 移动智能网网管系统组网结构图: 4 图1 - 3 移动智能网网管系统组网结构图 移动智能网网管功能一般具有以下几个部分: 1 ) 拓扑管理 网络管理系统通过配置文件或人机界面的输入来获取拓扑信息,以拓扑图、 北京邮电大学网络与交换技术国家重点实验室 北京邮电大学硕士学位论文 移动智能网网管告警系统的设计与实现 地理树状图等多种表现方式反映管辖范围内移动智能网设备的设置、网络结构和 拓扑连接。 2 l 配置管理 可通过多种方式,如基于拓扑图、地理树状图等,查询本省范围内的移动智 能网设备、设备上驻留的功能实体及在网上开展的移动智能业务的相关配置信 息; 当移动智能网的设备、功能实体或所开展的移动智能业务发生配置改变时, 网管系统会获得相应的配置改变信息,实现管理信息的自动更新。网管系统有以 下两种方法获得上述配置改变信息:a ) 通过被管设备主动上报的通知消息;b ) 通过网管系统的配置文件或网管系统的人机界面输入; 网管系统提供事件上报控制机制,可要求被管设备只上报满足控制条件的事 件,控制条件可根据事件发生时间、产生事件的设备、事件类别等进行组合; 通过网管系统可查询网络配置变化记录。 3 ) 告警管理 网管系统能够实时地反映移动智能网中的告警。网管系统能够支持告警风暴 控制,故障分析定位。网管系统能够支持对当前及历史告警信息的查询,并以标 准的格式向用户提供告警的相关信息。 支持对告警上报条件的设置,可要求被管系统只上报满足告警上报条件的告 警。告警上报条件可根据发出事件的被管理实体的类型、被管理实体、事件类型、 告警严重程度、告警原因及它们的组合来确定。 4 l 性能管理 通过网管系统能够开启或取消对移动智能网设备的c p u 、硬盘、信令链路、 信令链路组、以及s c f 、s s f 、s r f 等功能实体的性能采集。性能数据采集周期 应不小于3 0 分钟。 通过网管系统可以允许和屏蔽性能数据的上报; 可查询历史性能数据。可根据一定的查询条件查询用户所关心的性能数据。 查询条件可根据产生性能数据的网元或实体、性能数据产生时间、性能参数等来 定义。 可对c p u 负荷、硬盘剩余空间百分数、信令链路负荷及信令链路组不可用 北京邮电大学网络与交换技术国家重点实验室5 北京邮电大学硕士学位论文 移动智能嘲刚管告警系统的设计与实现 率设置门限值,当性能数据越门限时,网管系统能够接收到性能告警,并实时反 映性能告警。 5 ) 操作维护管理 应用软件日志查询,日志备份,日志删除;各模块的进程级操作维护;系统 启动功能:包括启动、停止和主备切换;开启禁止信令链路、信令配置、信令监 视等;特定应用的管理,包括:业务管理,运行管理,数据管理,呼叫管理,用 户管理,统计管理,局数据维护,流量控制等。 北京邮电大学阿络与交换技术国家重点实验室 北京邮电大学硕士学位论文 移动智能嘲网管告警系统的设计与实现 第二章移动智能网网管告警系统概述 2 1 告警系统设计原则 随着网络运行维护的不断改革,不断发展,各级维护部门和职能部门对网管 平台的要求越来越高,为了能够及时发现网络中存在的问题,希望能够对网络告 警、性能进行集中监控和分析,并能实现维护的自动调度,这就要求告警系统必 须能够提供对全省网络的集中监控,以及能够支持预警和故障分析功能,从而使 网管系统为网络监控和网络分析提供更好的支撑。 因此这对告警系统的实时性、准确性、可靠性、灵活性和可扩展性都有很高 的要求,系统设计需要遵循一定的原则: 高实时性。这是由告警系统本身功能特点决定的,作为全网集中监控的 告警系统需要处理网络中成千上万的告警事件,而且需要及时将这些告 警事件呈现给维护部门,因此必须具有很高告警吞吐率和处理能力 夺高可靠性。由于告警系统关系到全网安全,所以必须具有电信级的可靠 性,保证7 2 4 小时的不间断运行,在架构设计上必考虑系统整体的容灾 能力,确保系统可靠运行。 高可扩展性。告警系统的模块设计需考虑到通用性和扩展性,将公共功 能模块组件化,增加软件复用性;告警系统的通信机制也必须考虑到灵 活系统扩展需要,采用消息中间件,分布式部署,支持新功能实体插件 式的增加方式。 高可维护性。告警系统具有较高可维护性,提供完善的命令操作维护工 具和接入方法,保证系统在线维护和升级。 2 2 告警系统主要功能 网管告警系统所涉及的功能包括: 网管告警系统可动态根据设备负载情况,将告警分配给不同处理服务器 处理,平衡系统处理负载。 网管告警系统能够动态实时地反映及处理移动智能网中的告警,支持告 警实时上报。 北京邮电大学网络与交换技术国家重点实验室7 北京邮电大学硕士学位论文移动智能删嘲管告警系统的设计与实现 8 夺支持告警过滤,对符合告警过滤条件在底层及高层进行过滤。告警过滤 条件可根据发出告警的被管理实体的类型、被管理实体个体、告警类型、 告警严重程度等组合确定。 夺支持告警关联,将与故障相关联的告警事件整理汇报给维护人员,辅助 维护人员分析解决故障。 支持告警预警规则设置和触发,维护人员将重要的告警事件配置成预警 规则,告警系统在接收到与规则相匹配的告警事件时,可采用多种形式 触发预警,如短信,图形界面等。 除处理设备端告警外,告警模块要实现对网管主机自身的监控,包括网 管主机对外链路的通断,网管主机自身c p u 、内存、硬盘、数据库占用 率是否超标等。 支持告警实时广播功能,提供网管对外接口,具有鉴权、重连和同步机 制。 支持命令接入维护功能,可实时查看和分析处理服务器运行情况。 北京邮电大学同络与交换技术国家重点实验室 北京邮电大学硕士学位论文 移动智能喇嘲管告警系统的设计与实现 第三章移动智能网网管告警系统设计 移动智能网网管告警系统设计主要从三个方面进行讨论:整体架构设计,通 信机制设计和关键算法设计。 3 1 节主要讨论告警系统架构设计,根据三种架构设计方案的对比,选择适 合的架构体系。 3 2 节根据选择的架构设计,讨论相应的通信机制,保证系统的可扩展性。 3 3 节讨论了系统中的关键算法设计,主要涉及到与系统架构相关和系统应 用相关的两个方面关键算法设计。 3 1 告警系统架构设计 本节重点讨论单主机单进程系统架构、单主机多线程系统架构和集群系统架 构的优缺点,并从中选择合适的架构体系。 3 1 1 单主机单进程系统架构 单主机单进程系统架构,结构简单,易于实现,具有清晰明了的处理流程: 告警系统进程阻塞等待告警事件的到来,当告警系统进程接收到被管设备n e ( n e t w o r ke l e m e n t ) 的一个告警事件后,阻塞调用返回,对这个告警事件处理后, 在数据库中进行保存,然后又阻塞等待下一个事件到来。 图3 _ 1 单主机单进程系统架构图 如图3 1 所示,单主机单进程系统架构的优点是: 北京邮电大学网络与交换技术国家重点实验室9 北京邮电大学硕士学位论文 移动智能嘲阿管告警系统的设计与实现 夺对每个n e 来说实现上很简单,只需配置告警服务器口地址,就可以进 行告警实时上报。 对告警服务器来说,只需对接收到的消息逐条按逻辑进行处理就可以 了,程序设计和实现比较简单。 然而该架构却无法在实际中应用,这是因为告警的实际处理逻辑比较复杂, 如果设备并发发送大量告警,并持续一段时间,那么基本上告警服务器不久后会 陷入瘫痪状态。对告警系统来说,它的主要职责是及时地将告警事件通知给用户, 所以对告警事件处理的最大时延是有严格的要求,这也是衡量告警系统处理能力 的关键指标。 根据工程实施的经验,现网需要监控的设备数目比较多,大约可以达到几百 台主机的规模,每天上报的告警事件数量可达到1 0 万多条,每个特定时间段内 连续发出的告警数量总体不超过4 0 0 0 条,以下列出了告警服务器收到的告警事 件数量和单进程服务器最大处理时延关系的测试数据: 表3 - 1 单主机单进程服务器处理性能统计表 接收告警事件数量单进程服务器平均处理单进程服务器最大处理时 时延( s )延( s ) 1 0 0 01 9 4 2 63 8 8 5 1 2 0 0 03 8 8 7 17 7 7 4 4 0 0 0 7 7 7 6 11 5 5 5 2 2 由表3 1 统计数据表明,告警事件处理时延随着告警事件数量的增长而线性 增长,在4 0 0 0 条告警同时到来时,最大时延将达到2 5 分钟左右,这个时延是完 全不能被接受的。 该架构的另一个缺陷是很难改造成多主机冗余备份架构,以增强其容灾能 力。告警系统是监控全网设备的接入点,它的容灾能力强弱关系到全网设备故障 监控水平高低。而由于预警系统进程只启动在一个主机上的,就可能因软件重启 或主机硬件故障导致无法正常运行,这对全网来说是致命的。 因此预警系统的单主机单进程系统架构,虽然具有实现简单的优势,但考虑 到其处理能力和容灾能力的局限,这种架构不是一种很理想的系统架构。 北京邮电大学同络与交换技术国家重点实验室 北京邮电大学硕士学位论文 移动智能嘲两管告警系统的设计与实现 3 1 2 单主机多线程系统架构 单主机多线程系统架构可以弥补单主机单进程架构中服务器处理能力不足 的缺陷。服务器预先初始化处理线程池,当主线程每接收到一个告警事件时,唤 醒一个线程对告警事件进行处理,这是典型的多线程b o s s w o r k e r s 模式, 告警服务器的处理需求很适用多线程编程,使用多线程模型有利于提高服务器处 理性能【4 1 。 图3 - 2 单主机多线程系统架构图 如表3 2 所示,只需一个4 个处理线程池,在4 0 0 0 条消息同时到来时,最 大时延将从单进程架构的3 0 分钟减少为7 分钟左右,效率提高7 6 7 o 同时从表3 2 也可以看出随着线程池中线程个数的增加,平均处理时延和最 大处理时延并没有随之线性减少,这是由于在多线程模型中线程上下文切换代价 和线程对关键资源竞争关系导致的。关键资源的竞争代码,被定义为关键区域 ( c r i t i c a ls e c t i o n ) ,这段代码的要求是尽量简单,这样就可以避免多个线程由于 得不到锁而进入等待状态,从而导致实际处理效率的降低【4 l 。而在告警服务器的 处理逻辑里会涉及到告警静态信息配置表,告警事件注册表,告警事件缓存等一 系列数据结构,这些数据结构在处理过程是共享的,并且会被频繁进行更新和修 改,这使得各线程关键资源的竞争关系在线程数增加时表现得特别明显。 单主机多线程架构中还有一个缺陷,就是依然很难进行多主机冗余架构改 造。多线程架构实际是单进程架构在处理能力上的一个改进,还是单机模型。 表3 - 2 单主机多线程服务器处理性能统计表 i 接收告警事件数量线程池中线程个数多线程服务器平均处多线程服务器最大处理 理时延( s )时延( s ) 北京邮电大学网络与交换技术国家重点实验室 北京邮电大学硕士学位论文移动智能嘲嘲管告警系统的设计与实现 1 0 0 044 8 6 6 5 1 0 5 0 2 1 1 0 0 08 1 2 3 2 82 4 3 6 4 1 0 1 6 8 0 0 61 6 5 4 2 2 咖 49 7 3 3 22 1 1 0 2 3 2 0 0 0 82 4 4 5 14 9 3 1 5 2 0 0 0 1 61 6 1 0 33 1 6 1 5 4 0 0 0 41 9 4 2 64 1 9 1 1 2 舢84 8 5 1 59 7 0 3 1 4 0 1 63 1 3 4 6 6 2 6 9 1 3 1 3 纂群系统架构 集群系统架构是针对单机架构在处理能力瓶颈提出的。集群架构采用了基于 负载均衡的请求分发技术。负载均衡器具有很好的吞吐率,将请求均衡地转移到 不同的服务器上执行,且负载均衡器自动屏蔽掉服务器的故障,从而将一组服务 器构成一个高性能的、高可用的虚拟服务器【卯。整个服务器集群的结构对客户是 透明的,犹如单主机架构,且无需修改客户端和服务器端的程序。 北京邮电大学网络与交换技术国家重点实验室 北京邮电大学硕士学位论文 移动智能嘲网管告警系统的设计与实现 图3 - 3 集群系统架构图 如图3 - 3 所示,集群体系结构分为三层组成部分: 负载均衡器( l o a db a l a n e e r ) ,它是整个集群对外面的前端机,负责将客户 的请求发送到一组服务器上执行,而客户认为服务是来自一个口地址( 可称之 为虚拟口地址) 上的。 负载均衡器是服务器集群系统的唯一入口点( s i n g l ee n t r y p o i n t ) ,它可以采 用负载均衡技术,当客户请求到达时,负载均衡器只根据服务器负载情况和设定 的调度算法从服务器池中选出一个服务器,将该告警事件转发到选出的服务器, 并记录这个调度。 处理服务器池( s e r v e rp 0 0 1 ) ,是一组真正执行客户请求的服务器,每个处 理服务器采用多线程b o o s s 脚o 鼬江r s 模型对客户请求进行并发处理,以提高 服务器处理能力。 服务器池的结点数目是可变的。当整个系统收到的负载超过目前所有结点的 处理能力时,可以在服务器池中增加服务器来满足不断增长的请求负载。从一段 较长时间来看,告警事件是一个随机事件,因此事件一般都可以在不同的结点上 并行执行,所以整个系统的性能基本上可以随着服务器池的结点数目增加而线性 增长。 数据库( s t o r a g e ) ,它为服务器池提供一个共享的存储区,这样容易实现处 理服务器池里的服务器都具有相同的配置内容,如初始化的告警详细信息。 处理服务器结点需要动态更新的数据也一般存储在数据库系统中,数据库会 保证并发访问时数据的一致性。 综上所述,集群系统架构具有如下优势: 高可用性。集群旨在避免单点失效。应用程序可分布在多台计算机,从而在 一定程度上实现并行运行和故障恢复,并提供更高的可用性。 夺可伸缩性。可以通过添加更多的处理器或计算机来提高计算机的计算能力。 可管理性。对最终用户、应用系统和网络而言,集群是一种单一系统,它向 本地和远程的管理员提供单点的控制功能。 与其它架构相比,集群系统架构表现出良好的可扩展性,强大的可靠性和优 异的处理性能,因此选用集群架构作为告警系统的体系架构,在实际应用中,服 务器池结点数目一般配置为两个。 北京邮电大学网络与交换技术国家重点实验室1 3 北京邮电大学硕士学位论文移动智能嘲网管告警系统的设计与实现 3 2 通信机制设计 本节主要讨论根据告警系统和体系架构特点设计相应的通信机制,满足告警 系统可扩展性需求。 3 2 1 通信机制概述 告警系统整体通信机制包括两个部分: 1l 设备与告警系统的通信机制。这涉及到设备采用何种方式与告警系统发 送告警信息。 2 l 集群架构的通信机制。集群架构的通信机制是指集群内负载均衡器与处 理服务器的通信方式。 图3 - 4 告警系统通信机制结构图 如图3 - 4 所示,告警上报机制为u d p 方式,集群通信是通过消息中间件 ( m e s s a g er c :( 1 u e s tb r o k e r , m r b ) 进行的。具体过程为:各个设备通过u d p 方 式发送告警给负载均衡器,负载均衡器根据各处理服务器负载状态,选择一个合 适的处理服务器,通过消息中间件将告警发送给处理服务器,同时处理服务器也 通过消息中间件定时汇报设备负载。 下面具体讨论通信机制的各个部分。 3 2 2 告警上报机制设计 告警的上报模型是设备一旦发现故障,就触发告警,对于发送告警包的 北京邮电大学网络与交换技术国家重点实验室 北京邮电大学硕士学位论文 移动智能网网管告警系统的设计与实现 t c p ,口连接有两种方式:t c p ( t r a n s m i s s i o nc o n t r o lp r o t o c 0 1 ) 和u d p ( u s e r d a t a g r a mp r o t o c 0 1 ) 。 使用t c p 连接方式作为告警上报机制的好处有: 1 ) 作为可靠连接,设备发送的告警能有保证地到达负载均衡器,这也是最 大的优点。 2 ) 每个设备只要一次建立好连接,以后所有的告警上报都可以复用该连 接。 注意,t c p 连接方式是不保证连接建立成功之后通信双方都是存在的,例如 对端服务器断电后,通信的另一方并不会收到连接断开的通知,也无法知道服务 器实际已经不可用。实际上有两种方法可以实现t c p 方式连接的确定性:1 ) 打开t c pk e e p a l i v e 开关,并可设置检查连接对端是否存在的时间间隔,但t c p 实现不同,并不是所有版本都支持设置时间间隔功能,这就有可能出现检查时间 间隔过长的情况,如3 0 分钟检查一次,那么k e e p a l i v e 就变得没有实际意义;2 ) 在应用层实现心跳机制。总之,这两种方法都增加了通信实现的复杂度。 同时由于每个设备故障的发生是具有突发性的,因此设备上报告警使用长连 接是不合适的:1 ) 维护连接的代价太高;2 ) 使用i o 多路复用s e l e c t 函数对长 连接进行管理,通常只能支持1 0 2 4 个连接,并且速度随连接数增长线性下降;3 ) 由于每个故障报告包比较小,如果使用t c p 连接,每接收到一个告警,就要发 送一个确认【6 1 ,这对网络带宽是很大浪费的。而u d p 连接是无需确认连接方式, 不需要建立长期连接,一个端口就可支持所有设备上报告警,更适合故障报告模 型,并且在电信网络内,可以很安全地认为u d p 丢包情况是很少见的。 为防止误接收或接收了错误的u d p 包,所有u d p 包的告警内容是经过编码, 然后在服务器端解码和验证,如果出现解码验证失败,则丢弃该u d p 包。 常用的编码机制有二进制编码和文本编码两种: 二进制编码,如a s n 1 ,优点是编码后长度简短,传输转换效率高,缺 点是编码字段固定,不易于动态扩展,直观性差,不便于调试和维护 文本编码,优点是易于动态扩展编码字段,易于调试,当然这是以编解 码效率为代价的。文本编码主要有结构型和平板型两种,结构型以s o a p 传输协议为代表,按照x m l 树状结构组织编码字段,平板型是简单连接 所有编码字段,并以特定分隔符区分各字段的字符串形式。 北京邮电大学同络与交换技术国家重点实验室1 5 北京邮电大学硕士学位论文移动智能阿嘲管告警系统的设计与实现 考虑到可扩展性和可调试性,告警消息是采用平板型文本编码方式,编码结 构如图3 5 所示: 字段分隔符字段值分隔符字巨分隔符字段值分离符 3 2 3 集群通信机制设计 图3 - 5 告警消息编码方式 由于负载均衡器和处理服务器处于不同的主机,这就要求它们之间的通信能 屏蔽互异系统的物理差异,并支持动态扩展特性。很自然地,消息中间件能够很 好地符合这些要求。消息中间件将不同分布式环境封装起来,对外提供统一的接 口,使得应用和业务能通过统一接口进行开发。消息中间件就是要使处理过程面 向业务而不是面向物理连接,从而将开发者解放出来,使其能专心于业务的开发, 而不需要考虑底层通信细节【,j 。 这里开发的消息中间件m r b 通过采用按名通信机制有效满足了上述需求, 它是基于c + + 编程语言及s o c k e t 机制的,下面具体讨论该消息中间件的设计 与应用。 3 2 3 1 中间件系统体系结构 如图3 - 6 所示,本消息中问件的结构主要包括2 部分:1 ) 底层通信服务器 ( m r bs e r v e r ) :它是一个消息转发系统,它接收发送端的消息,并对消息进行 解码,然后根据目的地址将消息准确地传送到e l 的端,同时提供对外的管理接口; 2 ) 应用程序a p i ( m r b a p i ) :是消息中间件提供给编程人员的接口,它封装了 发送消息、接收消息及消息处理的细节,使得应用程序员可以集中精力在应用逻 辑的开发,而不必考虑底层通信细节。 图3 - 6 中问件系统体系结构图 北京邮电大学同络与交换技术国家重点实验室 北京邮电大学硕士学位论文 移动智能网网管告警系统的设计与实现 通过上面的介绍,可以看到本消息中间件既是一个运行系统,又是一个开发 系统,它侧重于提供可靠、高效的通信服务。下面具体讲述以上两部分的实现细 节。 3 2 3 2 底层通信服务罱 底层通信服务器是一个消息转发系统。它接收源客户端发来的消息,并分析 消息头,得出目的客户端的信息,然后将消息转发给目的客户端。 这里需要区分客户端与后面应用程序a p i 中描述的c l i e n t 和s a y e l - 的概念。 所有注册在底层通信服务器上的应用都作为底层通信服务器的客户端,而c l i e n t 和s e r v e r 则是对每个客户端在交互时角色的描述,每个客户端都包含了c l i e n t 和 s a - y e l - 的双重功能。连结在底层通信服务器上的各客户端对底层通信服务器来说 是平等的。各客户端之间在逻辑上可以有各种关系,也可以毫无关系,这些关系 对底层通信服务器来说是透明的。多个不相关应用程序的客户端完全可以与同一 个底层通信服务器连接,具有相关性的多个客户端在逻辑上的关系完全由具体应 用来决定,其中接收并处理请求的客户端作为s e t y e l ,而发送请求的客户端作为 c l i e n t 。 底层通信服务器与客户端之间采用基于文本编码的协议进行通信。客户端要 在底层通信服务器上转发的消息首先在客户端编码为文本字符流然后在生成的 字符流前加上消息头,该消息头包含了底层通信服务器转发所需要的信息,如消 息目的地址等。 协议的具体格式为: 消息头的格式为: 图3 _ 7 中间件消息格式 图3 - 8 消息头格式 其中消息头的各组成部分含义如下: 北京邮电大学网络与交换技术国家重点实验室1 7 北京邮电大学硕士学位论文 移动智能m m 管告警系统的设计与实现 起始符:用于界定一条完整消息的开始,在协议中使用1 作为起始符。 分隔符:用于分隔消息头中各关键字段。 结束符:用于界定消息头的结束,在协议中使用】作为结束符。 消息类型:见表3 - 3 表3 - 3 消息类型表 值含义 o客户端到服务器的登陆消息 1 0 0客户端到客户端的业务请求 2 0 0 客户端到客户端的业务应答 3 0 0客户端到客户端的业务通知 消息源地址:发送该消息的客户端名字。 消息目的地址:接收该消息的客户端名字( 消息类型为3 0 时,可能是一个 组名) 。消息类型为0 时,消息发往服务器,该字段没有意义。 消息长度:消息长度为消息体的长度,该长度不包括消息头长度,大小可以 为0 ,因此可以通过起始符,结束符和消息长度来唯一界定一条完整消息。 消息流水号:为保证消息的唯一性,发送业务请求和业务通知时,将为消息 分配一个唯一的流水号。发送业务应答时,该处填对应业务请求的流水号。 业务号:对应消息的业务类型,系统将根据业务号注册并寻找处理函数。 结束标志:用于一个请求多个应答的情况,0 为消息结束,1 表示消息未结 束。 下面是该协议的几个例子: 消息体可以为空消息,如a g e n t 实体登录的消息编码: 【0 ,a g e n t ,0 ,0 ,0 ,o 】 由实体a g e n t 发给实体m a n a g e r 的一条业务请求号为1 0 的消息可以编 码为: 【1 0 0 ,a g e n t ,m a n a g e r ,5 ,9 ,1 0 ,0 卜h e l l o 使用结束标志可以实现一对多应答,如实体m a n a g e r 发给a g e n t 的应答 可以编码: 【2 0 0 ,m a n a g e r ,a g e n t ,5 ,9 ,2 0 ,1 卜h e l l o 1 8北京邮电大学同络与交换技术国家重点实验室 北京邮电大学硕士学位论文移动智能嘲网管告警系统的设计与实现 【2 0 0 ,m a n a g e r ,a g e n t , 3 ,9 ,3 0 ,1 卜h o w 【2 0 0 ,m a n a g e r ,a g e n t ,8 ,9 ,2 0 ,o 卜a 糟y o u ? 使用组名作为目的地址实现消息广播,如实体m a n a g e r 发给a l a n n g r o u p 组的业务通知编码: 【3 0 0 ,m a n a g e r ,a l a r m g r o u p ,1 ,1 0 9 ,2 0 0 ,0 卜a l a r m o c x 艚 该广播消息到达服务器后,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论