[信息与通信]基于电信业务系统自监管的研究.doc_第1页
[信息与通信]基于电信业务系统自监管的研究.doc_第2页
[信息与通信]基于电信业务系统自监管的研究.doc_第3页
[信息与通信]基于电信业务系统自监管的研究.doc_第4页
[信息与通信]基于电信业务系统自监管的研究.doc_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

基于电信业务系统自监管的研究与实现摘要当今,电信企业业务支撑系统可以看成由服务支持和服务提供两部分工作组成。服务支持是业务支撑系统管理者每天进行的日常管理工作,工作重点偏重于各项业务指标的监控处理以及主机状况的监控;服务提供是将管理数据转化为决策信息,工作重点偏重于业务视角来看待问题。目前业务支撑系统管理人员80%到85%的时间花费在服务支持方面,而这方面的工作大部分是日常的、重复的和低价值的;如何在保证系统正常运行的情况下,将更多的时间和精力节省出来,就成为了至关重要的问题。 因此,开发一套多主机远程自动化监控系统就成为了解决问题的捷径。本文采用Perl脚本语言作为开发环境,Unix或Linux系统主机作为开发平台,Oracle 10g数据库作为系统支持数据库,有效并快速准确的完成多主机、多数据库的业务监控和自身状态监控。在完成以上目标的基础上,也要考虑到程序的易用性和采集结果的可读性。除此之外,进行二次开发的便捷性,安全性也在考虑范畴内。综上所述,本文将以准确,稳定 ,易用为目标,完成电信业务自监管系统的开发及其相关工作。关键字:电信业务系统监控,系统告警,主机远程监控; Telecommunication business system based on self-regulation research and implementationSummaryToday, telecommunications enterprise business support systems can be regarded as service support and service provided by the two parts of work. Support is a business support systems manager for the daily management of the day, Focus emphasis on the monitoring indicators of the business processing and host status monitoring; Service providers is to manage data into decision-making information, Focus emphasis on business perspective to look at the problem. Management of current business support systems 80% to 85% of the time spent in the service support, But this aspects work majority is daily, redundant and the low value; How to ensure the normal running of the case, more time and effort to save them, they become a critical issue.Therefore, the development of a multi-host remote automatic monitoring system becomes a shortcut to solve the problem. This procedure uses the Perl script language to take the development environment, Unix or Linux system host as a development platform, Oracle 10g database as a system support database, save the monitor configuration information, monitor object information, monitoring information and other content to return results.Upon completion of these objectives, based on procedures should take into account ease of use and readability of the results collected.In addition, the secondary development of the convenience, safety, also considering the context. In summary, this article will be accurate, stable, easy to use as the goal, the completion of the telecommunications business since the regulatory system and its related work.Keywords: Telecommunication business system monitoring, system alarms, remote monitor;基于电信业务系统自监管的研究与实现11 绪论51.1电信企业自监管现状51.2电信业务自监管系统的必要性61.3本文采用的技术和方法61.4本文的组织结构72 基础知识72.1TELNET与SSH的区别72.2 Oracle数据库82.3 Perl语言92.4Insight报表系统103 系统的分析与设计113.1需求分析113.2数据库设计143.3用例功能描述214 系统的实际应用264.1 主机模块264.2 对象请求模块295 系统测试335.1对象请求模块测试335.2主机模块测试345结论35外文资料翻译37外文翻译46 1 绪论本部分主要介绍了当前电信行业对于业务主机和业务系统进行管理的方法以及所存在的问题,并说明本系统的优点。1.1电信企业自监管现状1) 主机状况的监管大型电信企业使用的监控管理软件为Tivoli。IBM Tivoli 软件为我们提供了很多智能基础设施管理解决方案,有助于客户可以按照自己的需要将系统做出相应改变。Tivoli 软件不同于其他独立软件,它利用基于智能策略的资源分配、安全、存储和系统管理解决方案,为我们提供了管理,优化,监控的集成视图。 现正在监控所用的NetView,是Tivoli的一部分,并且是是Tivoli系统管理框架中非常重要的一部分,它利用标准的SNMP协议对网络上符合该协议的主机进行实时的监控,对网络中出现的多种故障进行报警,从而大幅度减少系统管理上的难度和工作量。NetView问世以来以其自身的先进性、可靠性、安全性获得过多项大奖,在大企业中一直有着较高的占有率。NetView作为行业里处于领先地位的的软件,通过SNMP协议管理控制网上的各种IP资源,可以实现在一个网管中心对多地点网的IP资源的集中有效管理,拥有极为强大且多样的功能。NetView利用轮循、请求、应答的方式对整个网络的设备进行集中监控管理,网上的IP资源会在有需要的时候发送出对应的报告,NetView可以不断地对网上IP资源的实时状态,配置和业务进行监控。一个微小的变化NetView都可以收到详细信息。但是过多的事件报告往往会造成网络管理人员难以分辨哪些是急需处理的哪些是优先级较低的,所以NetView为了应对这种问题,开发了强大的事件过滤功能,管理员可以通过设置事件过滤器调整优先级来筛选哪些报告需要送至NetView中,这一特点可以使那些只有对管理员来说比较重要的信息才在监控器上显示出来。如当某个路由器在60秒内连续出现三次同样的事件,我们认为是路由器出现故障,我们可以通过配置当这种情况发生时,在监控屏幕上只出现一条具体的警告信息,这样的话,网络管理人员在处理问题的时候就可以比较有针对性。虽然Tivoli有如此之多的优势,但不可不承认,其存在的问题也是相当致命的.首先其自身价格非常昂贵,无论平时的维护还是版本的升级,都是一般小企业所不能承受的,其次有,Tivoli只对unix系统的主机进行监控时能达到让人满意的效果,对Linux和Windows主机的监控时,会频繁的发生错误,并且出现采集结果极其不准确的问题,大量的浪费了管理人员的时间。2)业务状况的监管 业务的监管相较于主机的监管要复杂很多,由于不同企业的业务差异性很大及其自身的复杂性,所以一直没有一套智能的独立系统对其进行管理。 目前电信企业对业务的监管基本还是由运维人员进行每天的例行检测 ,由于是例行监测,消耗人力不说,最重要的是当业务系统出现故障时不能及时发现并反馈给相关人员,这就造成了管理人员不能在第一时间处理系统出现的故障,以至于影响用户的正常使用。1.2电信业务自监管系统的必要性随着业务支撑网运营管理系统在电信行业中的快速普及和发展,面对繁多的主机、存储、数据库、中间件、业务系统,数据中心的管理复杂性越来越高,这时,为了确保业务系统各个节点服务器的稳定性和数据准确性,就需要引入自监控系统。自监控系统的主要功能是通过用户的的配置,面对多主机多数据库,远程定时自动监控各个节点服务器的文件状况,进程状况以及数据库的自身状态,业务系统状态等等,当发现有问题时,会生成相信的错误信息,并利用短信内平台及时给相关人员发送告警短信,催促相关人员及时响应处理响应问题,以避免故障的发生,自监控系统在系统的运作中可以大大提升工作人员的工作效率和减少成本,从而增加企业的利润。由此可见,自监管系统的开发在电信企业中是势在必行的。1.3本文采用的技术和方法(1) Oracle数据库.(2)Powerdesigner.(3)perl语言.(4)shell脚本语言.(5)insight报表技术.1.4本文的组织结构本文由六部分构成。第一部分是绪论,主要介绍自监管系统开发的背景以及电信企业自监管的现状;第二部分是基础知识,主要介绍实现本系统时涉及到的基本概念和相关技术。第三部分是系统的分析与设计,主要介绍系统的总体结构,并大体介绍系统模块的分类第四部分是系统的实际应用,主要介绍了在实际使用中,每个模块的作用以及详细使用方法第五部分是系统的实际运行效果,主要介绍了本系统经过电信企业一段时间的实际运行,发现的问题以及客户反馈。第六部分是结论,全面总结了本文做出的贡献,和以后要继续完成的工作.2 基础知识2.1TELNET与SSH的区别 首先,Telent是明码传输,SSH是加密后传输。使用Telnet用来访问远程主机的TCP/IP协议控制网络设备很很容易被他人进行监听,并且他人也会利用管理员安全意识的缺乏,对服务器造成安全威胁。传统上的网络服务如:ftp、pop和telnet在其实都是不安全的,因为它们在网络上用明文传送口令和数据,而这些数据又是相当容易被拦截获取的。而且,这些服务程序的安全验证方式也是有其自身弱点,就是很容易受到“中间人”(man-in-the-middle)这种方式的攻击。所谓“中间人”的攻击方式,就是“中间人”冒充真正的服务器接收你的传给对端服务器的数据,然后再冒充你把数据传给真正的服务器。服务器和你之间的数据传送被“中间人”修改后,就会出现很严重的问题,并威胁自身数据的安全。SSH是替代Telnet和其他远程控制台管理应用程序的行业标准。SSH命令是加密的并以几种方式进行保密。SSH功能很多,它不光可以代替telnet,又可以为ftp、pop、甚至ppp提供一个较为安全的“通道”。SSH(Secure SHell)到目前为止有两个不兼容的版本SSH1和SSH2。SSH1又分为1.3和1.5两个版本。SSH1采用DES、3DES、Blowfish和RC4等对称加密算法保护数据安全传输,而对称加密算法的密钥是通过非对称加密算法(RSA)来完成交换的。SSH1使用循环冗余校验码(CRC)来保证数据的完整性,但是后来发现这种方法有缺陷。SSH2避免了RSA的专利问题,并修补了CRC的缺陷。SSH2用数字签名算法(DSA)和Diffie-Hellman(DH)算法代替RSA来完成对称密钥的交换,用消息证实代码(HMAC)来代替CRC。同时SSH2增加了AES和Twofish等对称加密算法。2.2 Oracle数据库ORACLE 是以高级结构化查询语言(SQL)为基础的大型关系数据库,通俗地讲它是用方便逻辑管理的语言操纵大量有规律数据的集合。是目前最流行的客户/服务器(CLIENT/SERVER)体系结构的数据库之一。ORACLE7.X以来引入了共享SQL和多线索服务器体系结构。这减少了ORACLE的资源占用,并增强了ORACLE的能力,使之在低档软硬件平台上用较少的资源就可以支持更多的用户,而在高档平台上可以支持成百上千个用户。Oracle的管理是基于角色(ROLE)分工的安全保密管理。在数据库管理功能、完整性检查、安全性、一致性方面都有良好的表现。Oracle数据库可以支持大量多媒体数据,如二进制图形、声音、动画以及多维数据结构等。并提供了与第三代高级语言的接口软件PRO*系列,能在C,C+等主语言中嵌入SQL语句及过程化(PL/SQL)语句,对数据库中的数据进行操纵。加上它有许多优秀的前台开发工具如 POWER BUILD、SQL*FORMS、VISIA BASIC 等,可以快速开发生成基于客户端PC 平台的应用程序,并具有良好的移植性。除此之外,Oracle提供了新的分布式数据库能力。可通过网络较方便地读写远端数据库里的数据,并有对称复制的技术。 ORACLE数据库在物理上是存储于硬盘的各种文件。它是活动的,可扩充的,随着数据的添加和应用程序的增大而变化。ORACLE数据库在逻辑上是由许多表空间构成。主要分为系统表空间和非系统表空间。非系统表空间内存储着各项应用的数据、索引、程序等相关信息。我们准备上马一个较大的ORACLE应用系统时,应该创建它所独占的表空间,同时定义物理文件的存放路径和所占硬盘的大小。Oracle的存储方面。物理上存放于网络的多个ORACLE数据库,逻辑上可以看成一个单个的大数据库。用户可以通过网络对异地数据库中的数据同时进行存取,而服务器之间的协同处理对于工作站用户及应用程序而言是完全透明的:开发人员无需关心网络的连接细节、无需关心数据在网络接点中的具体分布情况、也无需关心服务器之间的协调工作过程。ORACLE数据库之间通过数据库链接(DB-LINKS)建立访问机制,相当于一方以另一方的某用户远程登录所做的操作。但ORACLE采用的一些高级管理方法,如同义词(SYNONME)等使我们觉察不到这个过程,似乎远端的数据就在本地。数据库复制技术包括:实时复制、定时复制、储存转发复制。对复制的力度而言,有整个数据库表的复制,表中部分行的复制。在复制的过程中,有自动冲突检测和解决的手段。2.3 Perl语言Perl具有高级语言(如C)的强大能力和灵活性。事实上,你将看到,它的许多特性是从C语言中借用来的。与脚本语言一样,Perl不需要编译器和链接器来运行代码,你要做的只是写出程序并告诉Perl来运行而已。这意味着Perl对于小的编程问题的快速解决方案和为大型事件创建原型来测试潜在的解决方案是十分理想的。Perl提供脚本语言(如sed和awk)的所有功能,还具有它们所不具备的很多功能。Perl还支持sed到Perl及awk到Perl的翻译器。简而言之,Perl象C一样强大,象awk、sed等脚本描述语言一样方便。Perl的解释程序是开放源码的免费软件,使用Perl不必担心费用。Perl能在绝大多数操作系统运行,可以方便地向不同操作系统迁移。Perl 是一种能完成任务的语言。从一开始,Perl 就设计成可以把简单工作简单化,同时又不失去处理困难问题能力的语言。它可以很容易操作数字,文本,文件和目录,计算机和网络,特别是程序的语言。这种语言应该很容易运行外部的程序并且扫描这些程序的输出获取感兴趣的东西。而且它还应该很容易能把这些你感兴趣的东西交给其它程序做特殊的处理。当然,这种语言还应该很容易在任何现代的操作系统上可以移植地编译和运行2.4Insight报表系统INSIGHT报表系统依靠其高度简洁、高度集中的特点。在国内BI领域占据着BI技术与服务领导者的地位。其信息周期分为信息生产、信息流通、信息消费三个部分。信息生产环节由数据源整合统一视图(Insight OmniData)、方便的访问多数据源 ( Insight Data Sources)、分析工具集 (Insight Info Editor)三个部分组成信息流通环节由共享(Insight Publisher)、控制(Insight Securer)、监控(Insight Tracker)三个部分组成。信息消费环节由Insight的核心(Insight Server)、高级互动图形(vizInsight)、客户交互分析 (WebInsight)、客户交互编辑(WebEditor)、客户信息浏览(Thin Client)五个部分组成。INSIGHT系统的最大优点莫过于其直接部署直接使用的特点。除此之外,支持几乎所有的关系数据库(通过ODBC或者专门接口)和多维数据库(通过各种OLAP的专用接口),并且在一个分析应用中支持多数据源。对于XML格式的数据,INSIGHT系统也可以做到完美支持。本文所开发系统主要使用了INSIGHT系统中的WebEditor工具。本工具具有以下特点:1)零程序开发方式。2)操作数据:支持回写。3) 展现方式:2D图形、D图形、气泡图、交通灯、仪表盘、瀑布图、雷达图、工程进度图、动态地图(MAP)展示。4) 钻取方式:目录树方式;删除式钻取。5) 数据二次处理:丰富的计算类函数。6) 流程控制:异常强大的流程控制能力。7) 对星型模型的支持。3 系统的分析与设计3.1需求分析l 需严格控制对象响应时间,不能挂死无响应。l 连接失败,需按照配置的连接尝试次数进行尝试。l 避免多个连接请求同时连接同一主机或数据库。l 确保采集数据的准确性.l 采集对象应可以二次开发扩充。3.1.1顶层数据流图图3.1 顶层数据流图主机监控数据流说明:1)用户在数据库中完成程序要求配置表的配置。 2)程序对远程主机对象发送请求。 3)程序返回采集到的主机信息文件和日志一起返回给用户。数据库监控数据流说明:1)用户在数据库中完成程序要求配置表的配置。 2)程序对远程数据库对象发送请求。 3)程序返回采集到的数据库信息文件和日志一起返回给用户。3.1.2流程图图3.2 流程图程序流程说明:1)从数据库请求要监控主机或数据库的配置信息,若不符合规则则程序退出。2)从数据库请求要监控主机或数据库的详细监控信息,若不符合规则则程序退出。 3)连接要监控的主机或数据库。若连接失败则重试,直到达到最大连接次数后退出程序。 4)依次请求每个对象,若请求失败则退出。 5)根据业务系统分发记录采集结果的XML文件。 6)分析处理XML文件,并完成告警归并,告警清除,告警触发功能。3.1.3 拓扑图 图3.3 拓扑图拓扑图说明: 所需设备 : 1台监控服务器(linux、unix均可),1台数据库服务器、一天或多台被监控主机或服务器。实现功能 :监控主机通过获取监控数据库中的被监控对象信息,来对被监控对象发出请求,请求成功后将返回的结果发送到监控主机进行分析和相应处理。 3.2数据库设计3.2.1数据库设计原则1) 命名要简洁,并能充分体现本表的用途和意义。全部远程监控相关表表名以RM开头。由于告警当前表会作为多告警系统的统一接口表,故以MM开头。2)对于日志表,都要为其ID建立序列,序列的命名为SEQ_表名。为了管理方便,除了ID外,尽量不用或少用序列。3)由于程序中需要对多个配置表进行联合查询,故配置表中的关联字段一概使用相同字段名。4)尽量避免低级冗余而提倡高级冗余。表3.1 表格列表NameCode主机定义表RM_HOST告警当前表MM_ALARM_BAK告警结果中间表RM_MID_VAL数据库监控配置表RM_DATEBASE_MONITOR监控对象定义表RM_RECORD_DEF监控对象表RM_OBJECT监控日志表RM_LOG监控配置表RM_KEYPROCESS监控错误代码定义表RM_ERRCODE_DEF3.2.2配置表设计 表3.2 主机定义表 RM_HOSTNameCodeData TypePrimaryForeign KeyComment主机IPHOST_IPVARCHAR2(15)FALSEFALSE主机名称HOST_CODEVARCHAR2(100)FALSEFALSE用户名USER_NAMEVARCHAR2(100)FALSEFALSE密码PASSWORDVARCHAR2(100)FALSEFALSE业务系统BUSINESS_SYSTEMVARCHAR2(100)FALSEFALSE对象版本OBJECT_VERSIONVARCHAR2(100)FALSEFALSE远程连接方式REMOTE_CONNECTVARCHAR2(20)FALSEFALSE端口PORTVARCHAR2(10)FALSEFALSE重试次数RETRY_NUMNUMBERFALSEFALSE主机描述HOST_DESCRVARCHAR2(100)FALSEFALSE最大连接数MAXCONNECTIONNUMBERFALSEFALSE状态STATUSNUMBERFALSEFALSE本表主要用来配置远程监控多主机的自身信息。除此之外业务系统:根据配置的差异会生成不同的采集文件,告警文件以及日志文件。对象版本:配置了主机所使用的操作系统,目前支持的操作系统包含:window 、liunx、unix。远程连接方式:目前支持SSH和TELNET。端口:如不配置即使用远程连接的默认端口。如需改变连接端口,需要在本字段配置重试次数:通过本配置可以设置当远程连接超时时重试的次数。最大连接数:本配置主要为了防止某台主机连接数过多的情况,当连接数超过配置的数量时,则会告警。状态字段置为1时本主机不做监控,置为0时则进行监控。表3.3 监控对象表 RM_OBJECTNameCodeData TypePrimaryForeign KeyComment对象版本OBJECT_VERSIONVARCHAR2(100)FALSEFALSE对象名OBJECT_NAMEVARCHAR2(100)FALSEFALSE对象描述OBJECT_DESCVARCHAR2(100)FALSEFALSE告警级别ALARM_LEVELNUMBERFALSEFALSE告警类型ALARM_TYPENUMBERFALSEFALSE本表主要配置监控对象的信息。对象版本:配置了本对象对应那种系统,目前支持的操作系统包含:window 、liunx、unix。告警级别:0为不告警 ,1为低级告警 ,2为一般告警 3为紧急告警。告警类型:目前支持阈值告警。表3.4 监控对象定义表 RM_RECORD_DEFNameCodeData TypePrimaryForeign KeyComment对象名OBJECT_NAMEVARCHAR2(200)FALSEFALSE记录名RECORD_NAMEVARCHAR2(200)FALSEFALSE本表主要用于配置处理告警时采集的具体信息。对象名:配置采集何种文件。记录名:配置采集文件的哪些记录。表3.5 监控错误代码定义表 RM_ERRCODE_DEFNameCodeData TypePrimaryForeign KeyComment错误代码ERRCODEVARCHAR2(8)FALSEFALSE错误信息ERR_MSGVARCHAR2(128)FALSEFALSE本表主要配置了程序中错误代码对应何种错误的描述错误代码:配置了错误代码。错误信息:配置了错误代码对应的描述。表3.6主机监控配置表 RM_KEYPROCESSNameCodeData TypePrimaryForeign KeyComment主机IPHOST_IPVARCHAR2(15)TUREFALSE监控名称PROCESS_NAMEVARCHAR2(100)FALSEFALSE进程描述PROCESS_DESCRVARCHAR2(200)FALSEFALSE进程数量PROCESS_NUMNUMBERFALSEFALSE关键字KEYWORDLISTVARCHAR2(400)FALSEFALSE状态STATUSNUMBERFALSEFALSE电话PHONENUMBERFALSEFALSE本表配置具体的要监控的信息主机IP:配置需要在哪台主机进行监控。监控名称:配置了具体监控的名称。进程描述:对本监控的描述。进程数量:当指标未达到本数量时,则会出发告警。关键字:填写需要监控的进程,文件夹名称等等。状态 :0为进程监控 , 1为文件数量监控 , 2为TLQ队列监控,3为TLQ连通性监控。电话:配置了需要短信告警对象的手机号。表3.6 数据库监控配置表 RM_DATEBASE_MONITORNameCodeData TypePrimaryForeign KeyComment数据库名称DB_NAMEVARCHAR2(100)FALSEFALSE用户名USER_NAMEVARCHAR2(100)FALSEFALSE密码PASSWDVARCHAR2(100)FALSEFALSE业务系统BUSINESS_SYSTEMVARCHAR2(100)FALSEFALSE告警数量FAULT_NUMNUMBER(10)FALSEFALSE状态STATUSNUMBERFALSEFALSE关键SQLKEY_SQLVARCHAR2(4000)FALSEFALSE告警名称FAULT_NAMEVARCHAR2(100)FALSEFALSE最后更新时间LASTUPDATETIMEDATEFALSEFALSE监控小时MONITOR_HOURNUMBERFALSEFALSE电话PHONEVARCHAR2(1000)FALSEFALSE间隔时间INTERVALNUMBERFALSEFALSE监控分钟MONITOR_MINUMBERFALSEFALSE本表配置了数据库监控的详细信息。数据库名称:需要监控的数据库名称。用户名:数据库用户名。密码:数据库密码。业务系统:本监控所属业务系统。告警数量:当监控指标达到本值则触发告警。状态:0为监控,1为不监控。关键SQL:本配置用于设置监控sql。告警名称:本监控名称。最后更新时间:配置了最后发生告警的时间。监控小时:当时间晚于本小时时才进行监控。监控分钟:当时间晚于当前分钟时才发生告警。间隔时间:当本次发生告警的时候和上次告警的时间小于本配置时,则不告警。电话:要发送短信相关人员的手机号码。3.2.3日志表设计表3.7 告警结果中间表 RM_MID_VALNameCodeData TypePrimaryForeign KeyCommentIDIDNUMBERFALSEFALSE类型TYPEVARCHAR2(100)FALSEFALSE主机HOSTVARCHAR2(200)FALSEFALSE告警级别ALARM_LEVELNUMBERFALSEFALSE开始时间OCCURTIMEVARCHAR2(200)FALSEFALSE进程名称PROCESSNAMEVARCHAR2(200)FALSEFALSE进程数量PROCESSNUMNUMBERFALSEFALSE实际进程数量REALNUMVARCHAR2(200)FALSEFALSE创建时间CREATEDDATEFALSEFALSE 本表记录着程序解析采集文件后,每条监控的具体信息。便于管理人员查看监控详细效果表3.8 监控日志表 RM_LOGNameCodeData TypePrimaryForeign KeyCommentIDIDNUMBERFALSEFALSE主机IPHOST_IPVARCHAR2(64)FALSEFALSE模块名称MODULE_NAMEVARCHAR2(64)FALSEFALSE监控成功个数SUCCESS_NUMNUMBERFALSEFALSE监控告警个数FAULT_NUMNUMBERFALSEFALSE总监控个数TOTAL_NUMNUMBERFALSEFALSE错误代码ERR_CODEVARCHAR2(8)FALSEFALSE开始时间BEGIN_TIMEDATEFALSEFALSE结束时间END_TIMEDATEFALSEFALSE文件日期FILE_DATEVARCHAR2(64)FALSEFALSE创建时间CREATEDDATEFALSEFALSE本表记录每个模块每次监控的结果状态。便于管理人员查看监控总体效果表3.9 告警当前表 MM_ALARM_BAKNameCodeData TypePrimaryForeign KeyComment监控名称MONITORNAMEVARCHAR2(255)FALSEFALSE对象名称OBJECTNAMEVARCHAR2(255)FALSEFALSE指标名称KPINAMEVARCHAR2(255)FALSEFALSE告警等级ALARMLEVELNUMBERFALSEFALSE告警数值VALUENUMBERFALSEFALSE描述DESCRVARCHAR2(255)FALSEFALSE告警次数COUNTNUMBERFALSEFALSE首次告警时间FIRSTOCCURTIMEDATEFALSEFALSE最后告警时间LASTOCCURTIMEDATEFALSEFALSE创建时间CREATEDTIMEDATEFALSEFALSE清除状态CLEARSTATUSNUMBERFALSEFALSE清除时间CLEARTIMEDATEFALSEFALSE清除人员CLEARUSERVARCHAR2(255)FALSEFALSEIDIDVARCHAR2(16)FALSEFALSE本表记录着当前正在告警的记录其中告警次数由告警归并模块管理并进行累加。清除状态由告警消除模块进行自动清除。有些需要手动删除的告警,需要管理人员从前台界面手动删除。3.3用例功能描述3.3.1主机配置管理功能编号:SRS-FUN-001功能简述:主机配置管理执行步骤:维护主机信息表,维护内容包括:主机IP,主机名,监控用户名,密码,业务系统,监控连接方式,端口,连接重试次数,操作系统类型,最大连接数,最后重启时间,监控状态(0 监控,1 不监控);维护界面业务流程,规则放在第二阶段3.3.2数据库配置管理功能编号:SRS-FUN-003功能简述:数据库配置管理执行步骤:维护数据库信息表,维护内容包括:数据库名,监控用户名,密码,连接重试次数,数据库类型,最大连接数,监控状态(0 监控,1 不监控)。维护界面业务流程,规则放在第二阶段3.3.3进程对象配置管理功能编号:SRS-FUN-005功能简述:进程对象配置管理执行步骤:维护进程信息表,维护内容包括:主机IP,进程英文名,关键字列表,进程数,进程描述(可以为中文名称),监控状态(0 监控,1不监控)。维护界面业务流程,规则放在第二阶段3.3.4主机对象管理功能编号:SRS-FUN-007功能简述:日志管理执行步骤:维护主机对象信息表,维护内容包括:操作系统类型,可用的主机对象,对象描述。维护界面业务流程,规则放在第二阶段3.3.5数据库对象管理功能编号:SRS-FUN-009功能简述:请求单一主机的单一主机对象执行步骤:维护数据库对象信息表,维护内容包括:数据库类型,可用的数据库对象,对象描述。维护界面业务流程,规则放在第二阶段3.3.6日志管理功能编号:SRS-FUN-011功能简述:请求主机列表中和对象列表中的主机对象执行步骤:日志级别从高到低依次为:ERROR WARN INFO DEBUG,共 4个级别。#其中ERROR 为错误日志,出现错误日志时,系统退出#WARN 为警告日志,警告时,一般使用默认配置。#INFO 为正常流程日志,记录程序执行的主流程#TRACE 为详细日志,详细记录程序执行的数据流,主流程的子流程#程序默认配置开启INFO级别日志级别可以通过设置配置文件进行更改。低优先级日志,包含高优先级日志内容。日志格式为:时间进程号日志写入时长产生日志的文件名产生日志的文件行 消息内容 换行符其中,时间:格式 年/月/日 时:分:秒日志写入时长:毫秒3.3.7请求主机对象功能编号:SRS-FUN-013功能简述:请求业务系统中和对象列表中的主机对象触发因素:系统时钟或用户执行requestHostObject.pl hostip 主机IP objectlist 对象列表 -trace tracelevel -f -d 分发目录 timeout timeout执行步骤:1. 系统确认命令行是否选择 trace开关,如果打开此开关,则根据配置的tracelevel 记录日志。traclelevel:INFO 代表详细日志;tracelevel:ERROR 代表错误日志。其他值为非法。2. 系统确认主机IP 是否在主机配置表中,如不存在,则提醒用户主机IP 未配置,退出系统。3. 系统确认对象列表中所有对象是否在主机对象表中,如有对象不存在,则提醒用户对象列表中的此对象未配置,退出系统。4. 系统根据主机配置信息,远程连接到被监控主机(SSH或TELNET)。如果连接失败,则根据配置的重试次数重试连接,直到连接成功或者超过尝试次数。如果最终无法连接成功,则提醒用户连接失败和失败原因,并生成连接失败告警XML文件,退出系统。(主机IP 不通或者用户名,密码错误等)。如果连接成功,则生成连接成功告警XML 文件。5. 系统依次请求对象列表中的对象,如果请求失败,则提醒用户失败原因。并退出系统。6. 如果请求成功,则确认命令行是否配置了-f 文件分发开关,如果配置了此开关,则拷贝请求到的对象文件到-d 文件分发目录。7. 系统请求下一对象,直到请求完所有对象。8. 断开SSH 或TELNET 连接。3.3.8请求数据库对象功能编号:SRS-FUN-015功能简述:请求单一数据库的单一数据库对象触发因素:系统时钟或用户执行requestDbObject.pl dbname 数据库名 objectlist 对象列表 -trace tracelevel -f -d destDir执行步骤:1. 系统确认命令行是否选择 trace开关,如果打开此开关,则根据配置的tracelevel 记录日志。traclelevel:INFO 代表详细日志;tracelevel:ERROR 代表错误日志。其他值为非法。2. 系统确认数据库IP 是否在数据库配置表中,如不存在,则提醒用户数据库IP 未配置,退出系统。 3. 系统确认对象列表中所有对象是否在数据库对象表中,如有对象不存在,则提醒用户对象列表中的此对象未配置,退出系统。 4. 系统根据数据库配置信息,远程连接到被监控数据库(数据库连接)。如果连接失败,则根据配置的重试次数重试连接,直到连接成功或者超过尝试次数。 如果最终无法连接成功,则提醒用户连接失败和失败原因,并生成连接失败告警XML文件,并退出系统。(数据库名无法解析或者用户名,密码错误等)。如果连接成功,则生成连接成功XML 告警文件。 5. 系统依次请求对象列表中的对象,如果请求失败,则提醒用户失败原因。 6. 如果请求成功,则确认命令行是否配置了-f 文件分发开关,如果配置了此开关,则拷贝请求到的对象文件到-d 文件分发目录。 7. 系统请求下一对象,直到请求完所有对象。8. 断开数据库连接。 3.3.9请求主机PING状态对象功能编号:SRS-FUN-017功能简述:请求主机PING状态对象触发因素:quicklyPing.pl执行步骤:系统对所有主机IP 管理状态为0的主机进行ping 连接检查,并把结果记录到ping 报告XML文件中。XML文件格式见QuicklyPingHostStatus对象说明。备注:性能要求:1分钟内,检查完所有主机。目的:快速检查各被监控主机状态,发现异常马上上报,防止因网络故障或宕机故障引起重大应用故障。待解决问题:因网络异常,ping 主机时,有时会出现瞬断。瞬断时,应继续检查2到3次,以判断是否为瞬断(注,该功能需要有针对每台主机的配置开关,在想要的时候开启)。3.3.10请求DB连接状态对象功能编号:SRS-FUN-019功能简述:请求DB连接状态对象触发因素:quicklyDbConnectCheck.pl执行步骤:系统对所有管理状态为0的数据库进行连接检查,并把结果记录到连接数据库检查报告XML文件中。XML格式见QuicklyDbConnectStatus对象说明。备注:性能要求:1分钟内,检查完所有数据库。安全性要求:所有数据库连接必须立即断开。防止因过多数据库连接耗光数据库连接数。被监控的数据库的监控连接数不能超过配置的最大连接数。否则,告警:过多的DB监控连接,并退出系统。待解决问题:因网络异常,远程连接数据库时,有时会出现瞬断。瞬断时,应继续检查2到3次,以判断是否为瞬断(注,该功能需要有针对每个数据库实例的配置开关,在想要的时候开启)。这样设置,是否能够解决问题需实践检验。4 系统的实际应用4.1 主机模块模块名称:RemoteMonitorHost.pm4.1.1 全局变量my $sysDbh;#系统数据库连接句柄my $sysSth; #系统数据库语句执行句柄4.1.2 Telnet定义:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论