渝中区信息中心IT运维管理系统可行性报告_第1页
渝中区信息中心IT运维管理系统可行性报告_第2页
渝中区信息中心IT运维管理系统可行性报告_第3页
渝中区信息中心IT运维管理系统可行性报告_第4页
渝中区信息中心IT运维管理系统可行性报告_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、it运维管理系统可行性报告项目名称: 项目申报单位: 编制单位:设计编号:2013年09月22日目 录1. 总论11.1 主要依据11.2 主要原则12. 项目必要性22.1 监控平台现状22.1.1监控平台系统架构22.1.2监控平台设备分类32.1.3监控对象和目的32.1.4项目建设必要性32.2 简要结论43. 项目需求分析43.1 综合监控43.2 网络监控53.3 主机监控53.4 故障管理54. 项目方案64.1 项目目标和范围64.2 项目建设方案64.2.1 本期系统结构74.2.3主要模块功能设计监控总览网络监控主机监控144

2、.2.3.4故障管理174.2.4数据采集方式194.3 项目实施计划204.3.1工程实施建议204.3.2工程实施205. 主要设备材料清单205.1 设备配置要求205.2 实施内容配置清单206. 估算书216.1 概述216.1.1资金来源216.1.2设备供应216.1.3配套资源条件216.1.4外部协作条件216.2 编制原则和依据226.3 投资分析226.3.1经济分析226.3.2投资估算221. 总论本文件为2014年信息化建设项目信息通信系统统一监控平台建设工程可行性研究报告,重点解决信息通信系统监控分散、设备配置多套、占用值班人员过多等问题。本报告在项目需求、建设方

3、案、投资估算及经济评价等方面对项目建设的可行性和必要性进行分析和论证。1.1 主要依据1.2 主要原则本次可研主要遵循以下原则:高容量:综合告警管理系统是一个多级网络监控系统,是一种分布式、模块化结构、完全满足三级管理的、相对独立的监控系统。先进性:系统设计符合监控行业主流的设计思想和设计标准,产品的设计与开发技术水平保持着行业内领先地位,采用的设备和技术能适应今后长期发展的需要。系统可以根据用户需求在fsu内采用本地或上端解析两种方式完成监控数据的采集及告警信息的发送。可靠性:通过自身监测实时检查机制、双通道冗余技术,确保监控系统的高可用性,使整套系统可以确保7*24小时不间断的提供监控服务

4、。实时性:监控系统采用实时多任务操作系统,面向对象编程技术及事件优先处理技术。监控系统在链路存在的情况下,从告警发生到有人职守的监控中心接收到告警信号的时间间隔应不大于5秒,数据响应时间应小于5秒,命令执行响应时间应小于5秒。可及性:监控系统具有支持本地和远程访问的能力。操作人员在本地或远端均能在计算机屏幕上观察到全部监控数据。具有友好的人机画面和汉字支持能力。具有灵活的输入输出方法。扩充性:监控系统具有足够的灵活性以适应不同规模的电源系统和不同数量的监控对象的需要。监控系统的软硬件采用模块化结构并具有组态功能。当局站设备有所变化时,用户能自行修改系统配置,修改系统设定参数,可随时根据需要调整

5、、设计、更新界面,所有操作无需编程。开放性:监控系统采用标准的通信接口和统一的通信协议。监控系统能与各种智能设备、各级网管计算机正常通信。监控系统具有丰富的系统开放资源和网络资源,具有开放的网络通信协议,开放式数据库接口。监控系统的通信接口及协议均遵循行业标准。前端硬件采集设备能对各类被监控智能化设备实现全面的协议兼容。扩展性:系统采用模块化结构,具有足够的灵活性以适应不同规模的系统和不同数量的监控对象的需求;能适应不断增加的扩展需求,当系统需要扩容时,可以方便的扩充硬件设备。实用性:系统性能价格比高,易维护、易使用、运行费用低。2. 项目必要性2.1 监控平台现状。2.1.1监控平台系统架构

6、监控系统平台按照分层架构设计思想进行建设,实现网管数据采集与处理的分离,数据处理与呈现的分离,共分为三个层次:数据采集层、数据处理层和功能显示层。这样的设计增强了系统的灵活性和扩展性。数据采集层:数据采集层是位于数据处理层与管理对象之间的数据采集子系统,与 ip 网的网元设备和相关的业务系统交互,遵循标准的通信协议,完成it运维管理系统所需的各类原始管理数据的采集,包括主机、网络、数据库、中间件、应用软件、环境等数据源的原始信息,如:配置数据、性能数据、故障数据、准确性数据等;数据处理层:将数据采集层所获得各种数据进行清洗、整理和标准化处理,提供各应用功能进行处理分析、统计及存储,如通过触发事

7、件发生器,将收集到的各类原始信息与kpi阈值对比后进行分析、配置或处理,形成资源分类的告警信息等;功能显示层:针对分类管理信息进行统一汇总和多维展现,实现网络、系统硬件设备资源和软件运行状况的统一监控和管理,保障业务系统的正常运行。图2-1 监控平台系统架构监控系统的管理对象将来还包括:网络设备、安全设备、ip地址、数据流、机房巡检、应用系统(主机、数据库、应用等),数据采集的方式多种多样,支持分布式主动轮询或被动接受的方式采集数据,支持标准的snmp、syslog、wmi、telnet等协议的数据采集,支持数据库接口采集,支持应用api接口采集等多种方式,支持集成第三方管理平台组件进行数据采

8、集,还可以根据用户的要求定制相应的接口,将相应系统的信息纳入网络管理系统中,形成统一管理。监控系统采用开放的数据存储平台sql server来进行网管系统的数据存储,能够保存两年以上的历史故障数据和性能数据以便生成相应的趋势分析报告。监控系统能够针对告警事件提供灵活的过滤,提供对告警级别、告警类别、告警消息等配置的能力,告警划分成几种颜色,提供多种工具和方法定位问题的根源。监控系统的性能数据采集能够支持秒级单位的采样周期,能够提供原始采样频率的数据。监控系统经过一段时间的记录,能够通过对性能数据的对比,生成相应的阀值告警事件。监控系统通过web访问的方式为用户展示物理拓扑结构,并通过物理拓扑结

9、构为用户提供全网的性能和状态信息,并通过颜色表现表示出来,帮助用户及时发现网络潜在的故障隐患点,从而为用户提供管理数据的分析、诊断机制和支撑管理流程。监控系统标准的syslog、telnet、api等接口,可以将安全管理系统以及相关环境的管理数据,纳入监控系统中实现集中管理。2.1.2监控平台设备分类被监控对象类型分为主机设备、网络设备、数据库、中间件等基础服务。随着信息通信的不断融合,标准应用、巡检、业务管理等也需要逐步纳入统一监控。2.1.3监控对象和目的l 实现对信息网内不同厂商、多种类型设备的监控管理;l 实现对信息网上告警信息的定制、获取、处理和统计功能;l 实现对信息网上所有网络设

10、备、主机、中间件、数据库性能数据的采集和统计功能;l 根据监测到的性能原始数据,对信息系统运行状况,运行趋势等进行分析。l 提供灵活的、门类齐全的报表功能。l 为总部与下属单位的网管级联提供上下贯通接口。2.1.4项目建设必要性信息化建设的深入, it综合管理在企业发展过程中担负起越来越重要的角色,企业利润来源也越来越依赖于it系统的建设水平,而企业信息化的建设水平取决于两个方面,一个方面是基础设施的搭建,这是硬件基础,另一方面是管理层面,就是如何将已有的硬件基础设施的效能更好的发挥出来,这就和it综合水平的高低息息相关。如何及时了解系统的运行状况,有效地降低系统运行的风险,主动的发现并及时解

11、决系统运行故障,让业务系统保持724小时的健康、持续、稳定、高效运行,这些都给渝中区信息中心it综合管理水平提出了更高的要求,也是当前it系统运维管理普遍面临的巨大挑战。而在it综合上,业内人士普遍认为:由于企业对于各种信息化应用的持续建设,it设备和信息系统多而复杂,然而系统的关联性却日益增强。往往一个信息系统出现问题,受影响的不再是单个系统,而是全部或部分系统。可是往往企业的实际状况是各种it系统各自为战,缺乏整合和信息互通,缺少一个可以对系统进行全面管控的自动化监控管理平台是造成企业it综合效率偏低,问题迭出的根本原因。换句话说,如何把it综合管理与渝中区信息中心的生产模式和管理系统进行

12、科学匹配,已经是渝中区信息中心提升效率,增强核心竞争力的砝码。 当前it管理系统越来越深入地切入管理决策,从网络管理向业务服务管理过渡、从参数读取管理向智能分析管理过渡、从网管员设置与维护向多部门信息共享与协同管理过渡。在此基础上,传统的方式已经渐渐落伍,采用以企业业务为核心的it综合管理迫在眉睫。2.2 简要结论本工程建设的信息通信系统统一监控平台建设工程主要完善渝中区信息中心集中监控、集中管理等问题,逐渐实现故障监控的标准化与规范化,本项目总投资为*万元。经过技术方案、投资估算、经济分析与论证,本项目的建设方案合理、技术先进,工程的建设能够将调控中心的故障监控管理水平实现一次大幅度的提升,

13、切实可行,建议尽早实施。3. 项目需求分析在渝中区信息中心建立统一的it综合管理平台,可以将目前分散的网络、主机设备及系统的告警信息统一接入it综合管理平台,能够实现告警联动分析,做到事前发现系统故障并及时解决。3.1 综合监控在it运维管理系统的管理思想里,综合监控主要是供值班人员使用的功能,此功能的设计是本着简单、直观、有效的原则,把值班人员最关心的信息通过该功能菜单进行检索和呈现。用户可以在监控总览中进行监控总览、查看设备运行、线路流量、峰值流量、查看告警等操作。综合监控是监控系统对所有被管对象的一个大屏综合展示窗口,展现直观方便、关联性强。用户可以配置自己个性化的监控首页,这样就可以让

14、用户把自己最关心的东西,一进系统就能马上看到。通过业务视图展现各类服务逻辑,并对服务系统的诸多业务关键参数(kpi)进行监控,作为服务管理的基础。支持全网设备负载自动top n排序,主动告诉用户哪些设备需要关注,全网运行的隐患在哪里。全网告警预览。让用户一幕了然了解网络中的问题所在。业务在线用户数从用户关注使用情况的角度反映业务系统状态,提供有多少使用者在线、使用者都是谁他的ip地址区域所属部门、流量以及趋势图,帮助用户了解业务访问量的分布状态。自动生成全网设备运行统计率报表。方便用户了解全网的设备运行状况。3.2 网络监控l 在大型的网络中,通过节点或线路的定位,可以迅速找到用户想要找的设备

15、和链路。l 支持设备端口的vlan划分,简化部分管理员日常的配置工作。l 拓扑生成的时候能够以任意节点为中心发起搜索。l 可以真实反映整个网络的运行状态,直观的反映设备的分布情况、负载状况和设备属性以及线路的实时流量。l 通过颜色简单明了的告诉用户网络中负载和流量的压力所在,主动告诉用户的关注点在哪里,动态通知用户可能的故障隐患。l 自定义设备和链路的中文名称,下标显示,让用户摆脱枯燥的ip地址,更方便快速识别设备的用途。l 真实的面板图展示,让用户直观的从图上就可以查看端口流量,关闭、打开端口、端口下联设备,可以迅速定位问题点。3.3 主机监控l 提供对windows、aix、linux、s

16、olaris等主机系统进行全方位的监测和管理,帮助用户及时了解到各类系统的kpi的运行状态。l 可以关联告警系统,对主机关键指标的异常状态进行告警,让用户可以及时的知道并进行处理。l 可以关联告警系统,对主机的异常进程,或进程的异常状态进行告警,让用户可以及时的知道并进行处理。l 支持动态数据流转图,可以图形化展现cpu负载、内存使用率、硬盘容量、应用进程、文件占用空间、网络流量等信息。l 取数方式灵活,支持agent和agentless两种方式供用户选择。l 数据展现方式多样、层层递进物理拓朴图、监控总览、数据流转图、业务拓朴图。l it运维管理系统提供对windows、aix、linux、

17、solaris等主机系统的多方面监测和管理:3.4 故障管理l it运维管理系统注重运行维护管理,偏向于事前管理而非事后管理,为此强化了故障管理与故障预警管理。it运维管理系统支持从网络的第2层到第7层实施全面的故障告警管理。l 设备失效固然是严重故障,但 it运维管理系统的设计并非为了让用户被动地等待“出事”,绝大多数告警项的设计是为了建立“预警”机制。l it运维管理系统提供建立故障预警管理,通过设置“阀值”,可以不断监测设备负载是否超标(cpu负载/mem利用率)、线路流量是否正常,端口是否有持续的错包等现象,在问题发生前及时了解非正常情况。l 代替值班人员7x24小时不间断的监控关注项

18、目,出现超过阈值的告警通知调控中心值班人员。l 设计多种告警信息发送通道,监控系统提供了诸如短信息告警、语音告警、第三方程序告警、电子邮件告警等方式,并且可帮助用户实现部分安全的自动事件处理工作。4. 项目方案4.1 项目目标和范围本项目集中解决渝中区信息中心监控分散、缺乏集中管理等问题,形成统一的监控平台。it综合管理平台监控的目标主要体现在以下几方面内容:功能统一网络设备、主机监控、数据库监控、中间件监控等,在规划时充分考虑各模块间功能的需求规划,并充分考虑未来可能增加的功能。平台统一一个统一的软件平台,具备全面的接入能力、标准化的接口、强大的监控功能、完善的管理能力、灵活的系统架构是本项

19、目实施的关键。实施统一明确总体目标和分阶段目标,有计划、按部就班分步实施,降低系统投入负荷和实施风险。本报告为信息通信系统统一监控平台建设工程可行性研究报告,主要包括如下内容:项目建设的必要性分析;需求分析;系统建设方案;项目工程进度安排;工程投资估算;项目的综合结论意见。4.2 项目建设方案本方案设计的中心思想不仅建设一个单纯意义上的管理系统,同时还是建设一个高度集成的易于扩展的标准化运行监控平台,通过强有力的信息支撑,优化调控中心综合监控及问题处理流程,使系统综合运行质量得到有效保障,也可以使调控中心的管理水平上一个新的台阶。4.2.1 本期系统结构图4-1 系统逻辑结构示意图从上图,可以

20、直观的看出it运维管理系统模块清晰,层次分明。各模块之间既相互独立,又互相关联,共同实现了对被管对象的集中监控和管理,另外也通过web方式为用户进行了统一的展现。4.2.3主要模块功能设计监控总览通过it运维管理系统,客户可以将多种相关的系统整合一个呈现平台之上,从而促进用户合理规划现有的可用资源,提高资源的使用率。it运维管理系统能够提供对各类ip设备、主机系统、操作系统、中间件、应用系统等等各领域,实施跨厂家、跨平台的统一管理,提供集中、综合化的监控和管理。实现了声、光、电、短消息发送、e-mail等告警手段;并对各系统的运行性能进行监控、统计和分析;并提供被监测设备的故障日

21、志,事件统计分析等功能,能够满足客户信息网络运行维护的需要。it运维管理系统的联合监控思路:it运维管理系统的联合监控以“服务联合体”为监控中心,提供各角度、递进的关联分析与处理,并非平面化的管理。以监视web服务举例:考虑一, 传统的管理产品是单独监视某领域某参数,对“监视web服务”可以简化为http 80端口是否有效,it运维管理系统监控考虑点不同,可以从环境(周边温度、湿度)、提供web服务的主机负载、分离的数据库服务器负载、网际流量、进程状况等等不同角度实施联合监控,中心目标很明确:全面监视web服务是否运行正常。考虑二, it运维管理系统监控允许从分布的不同数据采集点,分布的不同数

22、据采集方式,甚至不同的系统采集数据进行集中处理考虑三, it运维管理系统综合监控可以预制大量的检测点,分为不同层次,在不同阶段介入检测,这样,首先减低了日常检测对系统的压力,在故障症兆发现之初(第一批日常检测点异常)自动、智能启动相关的检测点层层深入,给出正确的或非常接近正确的诊断结果通知用户、启动流程处理,切实减轻管理人员压力。考虑四, it运维管理系统可以直接连动故障处理流程,自动预处理部分故障、隔离故障,防止故障扩散,赢得处理时间。it运维管理系统支持事件处理的优先级判断(紧急度、影响度),支持事件合并,在配置管理、问题管理、变更管理方面提供直观有效的管理接口与管理实现,提供事前管理。i

23、t运维管理系统能够很好的满足客户网络主机系统管理平台的实际需求,提供了强大的故障监测和故障处理平台,具备良好的实用性,并提供多种方式实现与客户现有各管理系统的联合监控,满足了客户综合化监控的需求。网络监控监控系统同时提供物理拓扑和逻辑拓扑,前者强调物理,即真实网络的动态反映;后者强调逻辑,即宏观网络静态反映。之所以在发现结果上采用了物理拓扑图,并不是因为逻拓扑不重要。而是因为从绝大多数的客户角度出发,物理拓扑所能提供的价值要远大于逻辑拓扑。物理拓扑图是作为支撑系统的最基本也是最直接的一种发现问题机制,具有举足轻重的地位。支持逻辑拓扑图,让用户对自己网络的ip子网分布一目了然。还可

24、以自动发现网络中新增设备(ip节点)。且逻辑拓扑图是自动、实时发现的。在大型的网络中,通过节点或线路的定位,可以迅速找到用户想要找的设备和链路。支持设备端口的vlan划分,简化部分管理员日常的配置工作。拓扑生成的时候能够以任意节点为中心发起搜索。可以真实反映整个网络的运行状态,直观的反映设备的分布情况、负载状况和设备属性以及线路的实时流量。通过颜色简单明了的告诉用户网络中负载和流量的压力所在,主动告诉用户的关注点在哪里,动态通知用户可能的故障隐患。自定义设备和链路的中文名称,下标显示,让用户摆脱枯燥的ip地址,更方便快速识别设备的用途。真实的面板图展示,让用户直观的从图上就可以查看端口流量,关

25、闭、打开端口、端口下联设备,可以迅速定位问题点。a. 网络拓扑管理的优势支持逻辑拓扑图,让用户对自己网络的ip子网分布一目了然。还可以可以自动发现网络中新增设备(ip节点)。且逻辑拓扑图是自动、实时发现的。支持机房拓扑,让管理人员不需要去机房就可以看到整个机房的运行情况。机房拓朴和网络拓朴、业务拓朴关联,可以方便的互相跳转,进而调用相应的功能。在大型的网络中,通过节点或线路的定位,可以迅速找到用户想要找的设备和链路。支持设备端口的vlan划分,简化部分管理员日常的配置工作。拓扑生成的时候能够以任意节点为中心发起搜索。可以真实反映整个网络的运行状态,直观的反映设备的分布情况、负载状况和设备属性以

26、及线路的实时流量,可以对全网设备的负载、线路流量进行历史记录和回放,方便历史故障回溯和分析。通过颜色简单明了的告诉用户网络中负载和流量的压力所在,主动告诉用户的关注点在哪里,动态通知用户可能的故障隐患。自定义设备和链路的中文名称,下标显示,让用户摆脱枯燥的ip地址,更方便快速识别设备的用途。真实的面板图展示,让用户直观的从图上就可以查看端口流量,关闭、打开端口、端口下联设备,可以迅速定位问题点。b. 拓扑图生成算法it运维管理系统中的自动物理拓扑生成功能是精心设计、自主研发完成的功能,能够迅速搜索整个网络内的所有节点,一次性获得网络中所有路由器、交换机、服务器、pc 等管理单元的数据。并且能够

27、自动判断并勾画出设备间的冗余连接、备份连接、均衡负载连接等关系,完成网络拓扑发现。c. 通用拓扑生成算法自动物理拓扑生成支持跨厂商设备的通用生成算法,无须用户的人工干预,能够从网管机出发,自动依据网络路由信息、ip地址信息,按照“广度优先”的树结构遍历算法,逐层对网络上的所有ip地址进行扫描与snmp测试,对于采用snmp管理协议的各厂商网络产品,包括无线网络产品、网络防火墙、安全产品、打印机、服务器、主机系统,自动查找整个网络的路由设备、网络交换机、电源、打印机以及主机等支持snmp协议的设备,能自动辨识各生产厂商、设备类型、设备端口信息、设备面版图等信息。在完成网络设备的遍历与发现后,it

28、运维管理系统将从各网络设备中读取rfc组织定义的各种标准mib信息,去伪存真,综合分析、计算各网络设备之间的真实端口连接关系,辨别设备连接线路的类型、连接速率,提供各网络设备之间的准确的连接关系,包括设备间的冗余连接、备份连接、均衡负载连接,从而为用户提供了一份真实的网络物理连接关系图。d. cdp专用算法it运维管理系统还特别针对cisco厂商所提供的cdp信息开发了专用网络拓扑图算法,能够自动根据设备中的cdp信息,采取“深度优先”的树结构遍历算法,逐个节点进行分析处理,并同时建立各设备之间的物理连接关系,逐步完成网络拓扑图的构造。e. 灵活的拓扑图发现条件除了自动拓扑生成外,it运维管理

29、系统系统还为管理人员提供了增加搜索网段、添加指定ip地址以及过滤的网段等功能,可实现跨互联网的不同区域局域网的管理,方便管理人员进一步调整网络管理范围和提高网络遍历速度;同时支持将指定的设备类型进行过滤(系统已经预定义了部分设备名单,用户可以根据网络上的实际情况进行补充和调整),去除那些支持snmp但非管理人员所必须关注的各种设备,提高网络管理效率。f. 逻辑拓扑发现it运维管理系统不仅能够提供强大的物理拓扑图展现,还可以通过拓扑添加、子图、缩略图的形势实现逻辑拓扑展现,按照用户自己定义的逻辑连接关系自定义逻辑拓扑图连接方式,并且能够按照不同的系统应用提供系统应用拓扑图。g. 拓扑图添加it运

30、维管理系统在自动拓扑的基础上,作为日常运维产品中以网络维护为主的理念,专门提供了拓扑生成和拓扑添加两种工作方式,以适应系统运行中局部的网络变动的需要。拓扑生成是清空原来所有的拓扑图和配置信息,重新开始搜索网络拓扑图。拓扑添加则是保留物理拓扑图以及配置信息不变的情况下,将新搜索发现的网络设备及其之间的连接关系以及与原有设备之间的连接关系添加到物理拓扑图中,从而形成新的、与网络环境一致的物理拓扑图。h. 基于ie 的拓扑浏览it运维管理系统提供了灵活的拓扑图呈现方式和查看手段。提供拓扑图背景地图的定制,按照不同地域的真实地图灵活拖动网络设备,对整个地域网络分布情况提供更清晰的呈现。拓扑图支持无级别

31、放大和缩小功能,对拓扑图上的不同网络类型的节点(网元、网元组、子网等)提供多种图标展现手段,图标展现采用自动识别和手动修改两种方式,拓扑图上的所有设备均能够自由拖动,并且提供上下,左右对齐功能。网络拓扑图提供多种颜色的展现,网络节点设备的各种负载(cpu、mem、设备连续运行时间等),线路流量都可以通过颜色在拓扑图上呈现。网络拓扑图完全真实的反应了网络的实际连接情况,鼠标点击某一个网络节点都能够通过下标的方式显示该节点的详细信息,包括设备ip地址,设备名称,设备各种负载,设备端口流量等信息,鼠标点击连接线路则展现线路连接相关信息,包括:线路连接设备ip地址,网络设备连接接口信息,线路流量信息,

32、线路广播包,带宽占用率等拓扑图管理功能提供整个网络拓扑导航菜单,从根图到下属子图,缩略图等信息都能够在导航菜单中显示,通过导航菜单能够快速的查找到任何一个网络中的子图及缩略图,并且能够对任意子图及缩略图进行手工编辑,在子图及缩略图上添加,删除网络节点拓扑图组成元素的连接情况,设备性能,设备属性及不同子网的设备组成都能够方面查看拓扑图上的网络节点能够提供多种组合显示方式,比如:ip地址,主机名称,设备类型, 设备oid号等,可以任意组合,并且能够隐藏不同属性及网元i. 灵活的拓扑图导航功能it运维管理系统在拓扑图管理工具中提供拓扑图导航选项。在该功能选项框中可以逐层进入各级子网,缩略图,分别显示

33、不同子网的详细信息,在导航栏上通过树状结构标题,随意展开下级目录,返回上级目录,确认同时打开相关子网网络结构图。j. 拓扑图缩放功能it运维管理系统提供对拓扑图的无级别缩放功能,并且放大过程中不会造成拓扑图失真,丢行,闪烁等现象,并且可以任意对拓扑图上的设备进行平移,拓扑图相对平移操作。提供对指定区域的任意缩放,通过区域缩放导航功能选择任意区域,对该区域网络拓扑进行缩放提供缩略图显示方式,将比较复杂或重要的网络部分缩略为一个图标在根图上显示,并且可以任意编辑缩略图元素组成,添加,删除网络节点。k. 拓扑图定位功能it运维管理系统提供对整个网络系统中ip、mac定位,任意输入ip或mac信息选择

34、查询后都可以快速定位到该ip或mac的网络物理位置,并在拓扑图上通过高亮闪烁的方式显示出来。提供不同网元的选择方式,鼠标单选或者区域选择,从而完成多种配合操作l. 拓扑图监视网络管理系统对网络设备的配置信息提供备份,定期对网络设备的配置文件与备份文件进行对比,发现设备配置文件更改后,马上根据系统告警功能提供相关设备配置文件更改告警,并且备份新增配置文件,最多提供5份设备配置文件存档,方便用户选择不同配置文档对网络设备进行恢复。网络拓扑图管理范围内的网元设备发生变更后,如设备添加、删除,会有相关设备信息的提示,保证网络管理员对网络变化情况了如指掌m. 线路流量和设备属性监视网络拓扑图中鼠标点击任

35、何一条线路都可以显示线路相关流量,线路粗细可以按线路等级、物理带宽情况进行显示如下图:网络拓扑图中鼠标点击任何一个设备都能够可以查看设备基本属性n. 性能越限监控it运维管理系统提供对整个网络资源的性能提供多种监测方式设备颜色定义:对网元cpu、mem性能提供3个级别的颜色定义,如:对网元cpu负载提供0-30%绿色显示,30%-60%黄色显示,60%-100%红色显示,如果在网络拓扑图中发现红色设备,说明该设备性能越限。同样道理可以对网络线路的流量进行颜色级别定义,发现红色流量说明网络流量性能越限。在告警设定功能模块中,设定对网元性能及线路流量告警阈值,一旦网络设备或线路流量超过用户定义的告

36、警阈值后,第一时间提供相关告警o. 事件的实时告警it运维管理系统能够对实时的业务告警事件做出及时反应,通过不同的告警方式第一时间把告警信息反映给用户,告警方式如:手机短信、e-mail通知、语音提示、在拓扑图中相应链路变色、节点闪烁并有感叹号提示,告警信息未确认或告警未消除都会有相关提示信息一直保持告警状态p. 丰富的告警阈值设定it运维管理系统提供多种告警阈值的默认设定,也可以通过手工对不同网元及应用服务的报警条件进行设置q. 网络拓扑图编辑it运维管理系统可以任意编辑拓扑图,如:手工添加虚拟网元到拓扑图、手工添加、修改、删除网元之间的连线、手工定义、修改、移动网元位置、名称等、可增加、修

37、改、删除网元组节点、保存当前视图、拓扑图可以备份与导入、并支持打印功能、拓扑图可发布到web信息系统中网络拓扑图网元管理 it运维管理系统拓扑图管理支持不同的拓扑管理视图,可以拥有不同的背景图,支持将前景与后景相对位置锁定,可以进行相对大小缩放(相对位置不漂移)。管理人员可以在计算机上真实再现网络设备的外观和所有端口的即时活动状态,一如亲临设备现场。设备面板图管理it运维管理系统提供所有网络设备的真实面板图管理,可以在设备图标上通过双击图标直接进入设备面板管理、用户分级管理、端口流量管理,并在设备面板图上真实、实时地显示设备各端口连接状态, 支持设备堆叠显示功能,。对于某个具体端口,it运维管

38、理系统提供与该端口连接的主机名称、相对应的ip地址、mac物理地址。同时btnm还可以提供直接端口关断与启用操作网元配置参数备份可以增量备份网元的系统运行配置参数,每个网元可以备份多大5份不同的配置文件自动识别堆叠式设备能够自动识别堆叠设备,提供堆叠设备真实物理面版图关闭/打开端口打开或者关闭物理端口,需要有“写”权限的共同体名(设备属性的设备访问参数中的snmp参数设置.vlan划分,vlan自动辨识能够在设备真实面板图上划分设备vlan,自动发现,辨识交换机每个端口所在vlan 更改vlan更改该端口的所属的vlan号端口状态设备真实面版图以醒目的颜色区分端口的活动状态:红色表示被管理员关

39、闭,浅蓝色色表示当前没有物理连接,绿色表示该端口目前活动良好。针对不同的端口类型,设备面版图中将以不同的外型表示,如rj45、gbic、console等。并提供与snmp中接口表编号的对比。端口下联设备通过查询网络设备的即时mib数据信息,通过与网络地址簿的分析整理,管理人员可以直接获得指定端口所连设备的ip地址、mac地址以及主机名称,也可以获得经由此端口进行数据交换的所有设备、主机的信息。设备支持it运维管理系统的真实面版图管理支持的设备厂商有 cisco、baynetworks、juniper、foundry、extreme、avaya、3com、intel、fore、marconi、c

40、abletron、f5 等等以及华为、港湾、迈普、sva上广电、联想、神州数码、d_link、accton、tcl、博达 等等。r. 图例管理it运维管理系统可以通过图例管理功能对图例进行管理,包括:查询各种图例及其颜色的意义、定制图例,包括重新选择或修改图例的形状、大小和颜色等。s. 常用工具的集成it运维管理系统拓扑图管理为设备及线路的管理精心选择了常用功能,通过在相应设备、线路图标上通过鼠标右键提供给用户:设备remote_telnet、remote_ping管理设备snmp 测试管理告警设置管理、日志查询管理;设备常用mib库查询设备属性查询、设置允许直接调用第三方程序线路属性管理t.

41、 topn 性能排序it运维管理系统拓扑图支持简洁的性能管理入口,通过鼠标圈定一批设备或线路后,通过点击快捷键直接可以给出该批设备、线路指定参数(如cpu、内存、流量等参数)的topn即时排序结果。主机监控通过it运维管理系统,主要是在用户环境中实现对主机系统及相关系统的综合管理,包括:所有被管信息的收集、系统管理、数据库和中间件的管理、存储系统的管理、资源信息库管理、统一监控平台(对第三方管理软件的整合)。数据采集是针对不同的对象所采用的不同采集方式,包括snmp、syslog、业务和应用仿真、透明agent等。对象抽象化层主要负责获取对象的信息,将它们抽象成管理对象,向上屏蔽

42、不同it对象的差异。业务层主要提供具体的应用功能,如服务拓扑管理、报表分析和流程管理等。访问层用户展示管理信息、暴露管理功能,用户通过它发出管理命令,执行日常管理任务。支持的主机类型有:windowsibm aixhp-unixsolarislinux(redhatsuse)freebsdcentosnovell tur64l 提供对windows、aix、linux、solaris等主机系统进行全方位的监测和管理,帮助用户及时了解到各类系统的kpi的运行状态。l 可以关联告警系统,对主机关键指标的异常状态进行告警,让用户可以及时的知道并进行处理。l 可以关联告警系统,对主机的异常进程,或进程

43、的异常状态进行告警,让用户可以及时的知道并进行处理。l 支持动态数据流转图,可以图形化展现cpu负载、内存使用率、硬盘容量、应用进程、文件占用空间、网络流量等信息。l 取数方式灵活,支持agent和agentless两种方式供用户选择。l 数据展现方式多样、层层递进物理拓朴图、监控总览、数据流转图、业务拓朴图。a. 系统和通用应用数据采集it运维管理系统支持通过syslog、命令集/透明agent、snmp、端口应用仿真等多种监测方式监测服务器,可以获取远程服务器的系统资源,it运维管理系统支持对windows、unix、linux、aix、solaris、hpux等多种服务器系统管理和监视,

44、对服务器操作系统的运行状态和性能数据,包括服务器的cpu负载、内存利用率、应用进程、文件系统、文件体积等信息的分析与监视。管理和监视服务器上各应用服务的运行状态和性能数据,包括email、http、ftp、email、apache/iis、数据库、dns、dhcp服务以及各中间件等。b. 进程状态分析服务器进程控制对整个服务器的运行至关重要,会影响到其操作系统的正常运行和关键服务的正常运行,所以实时掌握服务器的所有进程运行情况是很有必要的。正常情况下运行着大量的系统进程和应用进程。它们在运行过程中会消耗服务器的资源,甚至一些非法的进程可以造成服务器的瘫痪,所以服务器的进程管理也是很有必要的。首

45、先就是进程的数量,第一,如果服务器里运行着的进程过多,势必会占用大量系统资源,进程数量越多,造成服务器不稳定的可能性就越大,所以监视所有进程的总数量可以帮助用户及时了解到服务器的资源情况,出现异常,也可以第一时间让用户了解到他必须现在去看看到底发生了什么事?第二,相同名字的进程数量过多,大部分时间意味着病毒爆发,所以监视同名进程的数量也是很有意义的。我们提供了进程数量的监视,时刻监视服务器所有进程数量或进程名字和设置匹配的进程数量,当出现异常时会在第一时间内提醒用户,保证用户尽早发现问题、解决问题,避免更严重的故障发生。it运维管理系统能够以表格的方式实时显示服务器的所有进程运行情况,包括进程

46、名称、cpu利用时间、cpu占用情况、当前内存占用情况、运行状态等等,为用户分析服务器的当前运行情况提供详细的实时数据来源。it运维管理系统支持对服务器上的应用进程情况进行监视,支持使用*和?的通配符统计符合条件的应用进程的数量,当该数量超过/小于指定的阈值时,系统将触发告警。it运维管理系统也可以直接监视某些特定名称的进程的活动状态。系统中的某一活动着的进程可能对用户非常重要,所以用户会关心这个进程是否一直在进程列表中,我们称这样的进程为“关键进程”;当这些进程出现在进程表中或者不出现在进程表中时,系统将自动触发告警,提醒管理人员及时处理。it运维管理系统提供对指定进程进行cpu利用率、内存

47、利用率不间断监视的功能。每一个进程都会占用系统资源,如cpu、内存,当某一个进程或某几个进程占用的cpu过高时,会影响到整个服务器的运行,使得运行速度变慢,使得其他进程因为分享不到cpu而无法正常运行;某些进程如果存在内存泄露等问题,会不断申请内存,导致系统内存溢出。it运维管理系统自动每分钟从服务器上获取最新的进程运行数据,提供各进程的运行趋势分析图,包括进程的cpu占用趋势图、物理内存利用率趋势图,方便管理人员查看各进程一段时间以来的运行情况。c. 文件系统分析很多的应用服务都需要使用磁盘空间进行数据的存储和处理,所以一般情况下,服务器的磁盘空间应该保持一定的空白容量,当磁盘空间低于可控制

48、下限时,用户应该马上进行相应处理,避免磁盘空间被占满后关键服务不能正常运行的情况发生。而且磁盘空间被占满也有可能是病毒引起的,这需要管理人员第一时间就要掌握到,尽量避免病毒的扩散和维护关键服务的正常运行。文件系统分析主要提供服务器上各文件系统的空间大小和使用情况(已用空间、剩余空间、利用率)以及文件系统的名称、类型等基本信息。管理人员可以指定系统的刷新间隔,自动以一定的频率从服务器上读取文件系统信息和参数,便于服务器文件系统的状态监视和处理。d. cpu利用率1、服务器cpu的利用率,可针对系统的每个cpu分别分析其相应的利用率;2、服务器当前进程列表所占用的cpu利用率,cpu使用时间;3、

49、显示服务器cpu性能(分进程显示)实时变化情况和历史变化趋势;4、服务器cpu阈值告警,当服务器cpu负载过大/小,能产生报警;5、服务器进程cpu占用阈值告警,当进程占用cpu过大/小,能产生报警;e. 内存利用率1、服务器内存的利用率;2、服务器当前进程列表所占用的内存利用情况,内存利用率;3、显示服务器内存利用率(分进程显示)实时变化情况和历史变化趋势;4、服务器内存利用率阈值告警,当服务器内存利用率过大/小,能产生报警;5、服务器进程内存利用率阈值告警,当进程占用内存过大/小,能产生报警;f. 硬盘性能分析it运维管理系统可以收集磁盘性能i/o状态信息。帮助用户分析磁盘读取的繁忙程度,

50、由于磁盘i/o信息是影响系统性能的常见因素,进而得到对优化整个系统性能的参考指标。g. 服务器日志查询、分析it运维管理系统采用syslog、wmi、telnet、ssh的方式来读取所监控服务器的日志,并可按分钟、小时、日等方式对日志进行查询与分析。it运维管理系统提供对windows、aix、linux、solaris等主机系统的多方面监测和管理:对windows操作系统主要可以监控如下内容:l 服务器的配置信息:自动获取服务器名称、ip地址、系统版本、cpu个数、磁盘大小、内存大小等;l 服务器的运行状态:服务器运行状态、服务器磁盘状态、网卡状态、进程总数l 服务器cpu运行情况:cpu用

51、户时间百分比、cpu系统时间百分比、cpu运行队列进程个数l 服务器内存使用情况:内存利用率、虚拟内存(交换区)的使用率、交换swap分区页数量(换入/换出);l 服务器磁盘运行指标:磁盘空间利用率、磁盘读/写速率、磁盘tps指标。l 服务器文件管理指标:各文件系统分区的使用率和空闲空间、指定的关键文件是否存在和当前大小;l 服务器关键进程运行指标:包括进程id、进程名、进程状态、占用cpu时间、内存占用大小等;l 服务器日志告警:检查服务器的关键日志文件,提取相关的错误日志信息(warning/error/fail)并生成告警;实时监控操作系统,数据库和应用系统中制定的日志文件,并可根据其中

52、的特定信息,执行用户预定义的操作;l 对系统服务进行监控,对重要服务的运行故障进行实时告警。对aix、solaris、linux等类unix系统主要可以监控如下内容:l 服务器的配置信息:获取服务器名称、ip地址、系统版本、cpu个数、磁盘大小、内存大小等;l 服务器的运行状态:服务器运行状态、服务器磁盘状态、网卡状态、进程总数l 服务器cpu运行情况:cpu用户时间百分比、cpu系统时间百分比、cpu运行队列进程个数l 服务器内存使用情况:内存利用率、虚拟内存(交换区)的使用率、交换swap分区页数量(换入/换出);l 服务器磁盘运行指标:磁盘空间利用率、磁盘读/写速率、磁盘tps指标。l

53、服务器文件管理指标:各文件系统分区的使用率和空闲空间、指定的关键文件是否存在和当前大小;l 服务器关键进程运行指标:包括进程id、进程名、进程状态、占用cpu时间、内存占用大小等;l 服务器日志告警:检查服务器的关键日志文件,提取相关的错误日志信息(warning/error/fail)并生成告警;实时监控操作系统,数据库和应用系统中制定的日志文件,并可根据其中的特定信息,执行用户预定义的操作;故障管理固定门限告警,对任意一种性能指标,任意一个节点或接口设置指标值的上下行告警门限,并可分别设置告警压制时间与级别。组合告警,可以根据多个系统监测器的监测结果组合进行告警判断。 故障采

54、集的接口支持如下:l 支持设备syslog发送数据接收,分析查看,按照级别告警,支持用户自定义的告警方式,整个系统具有接收和处理新的故障告警的能力。l 对于一些没有相应的监控产品对其进行监控的系统,it运维管理系统可以通过开发接口,调用应用系统的命令行或者直接编写对此应用的监控程序。 it运维管理系统提供基本的系统事件规则配置支持如下:l 提供友好的配置界面,能够方便地定制各类事件的标准化处理规则,以及定制将标准事件转化为告警事件的规则。l 配置规则的内容包括事件过滤、事件标准化、告警传递、告警升级、告警清除等内容。 其他内容可借鉴和参考系统管理的故障管理要求。l it运维管理系统可以将管理的

55、各类故障和预警事件,通过统一数据接口,将告警收集到统一事件平台,并且可以通过统计事件平台进行进一步的事件分析处理,并进入运维服务流程。 告警管理通知方式报警方式也是在系统监控项目中一个重要的界面。不同的报警方式适用于不同的角色,也跟事件的严重程度有关。常见的报警方式如下:值班室声光电报警:如果值班室具备声光电设备,并且可以用操作系统级的命令进行调用,那么很容易和“事件集中处理工具”进行集成。通过制订规则,对特定事件调用脚本,从而启动声光电报警。邮件报警如果“事件集中处理工具”可以和客户环境中的邮件服务器相连,那么也可以通过制订规则,对特定事件调用发送邮件的脚本短消息报警如果“事件集中处理工具”

56、可以和客户环境中的短信网关相连,那么也可以通过制订规则,对特定事件调用发送短消息的脚本提供各种报警方式在技术上没有什么难点,关键的在于分析哪些事件需要报警通知?如何为不同的事件选择合适的报警通知方式?通知内容如何设定? 组合告警与关联抑制it运维管理系统的告警模块专门提供了告警屏蔽和激活,为高级智能判断提供了基础,支持如下情况:提供告警过滤机制,如某设备snmp 访问失效自动屏蔽该设备内部各snmp 检测点轮询。提供高级层层深入的故障发现模式,出于减少被检测对象额外管理流量压力,避免影响设备、服务正常性能,一般仅对几个重要指标参数进行例行检测,但,几个指标参数虽可以反映问题征兆,却不足以定位问题根源-信息太少,借助it运维管理系统 告警屏蔽功能我们可以预置多

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论