版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、IT运维管理系统平台项目1.1 总体设计要求(1)系统平台设计应该符合信息行业和本行业的标准,系统内部 数据采用标准的格式,系统构架采用标准开放的应用框架和 组件结构。(2)为保证系统平台的统一性,要求软件/模块必须使用同一品牌, 所有软件/模块必须拥有完全自主知识产权,不能依托于其他 第三方的平台。支持主流操作系统和ORACLE数据库,全中文界面,提供友好、直观、易懂的图形呈现,提供强大的信 息交互与管理能力。系统要求运行在开放的 TCP/IP网络环境下,基于J2EE平台 开发,结合C+、CORBA标准和技术,采用B/S + C/S架构, 支持IE7, IE8等标准浏览器,实现系统界面、业务
2、逻辑、数 据集成等功能,采用标准接口进行系统间的数据交换与数据 共享。(4)监控子系统要求支持远程监控和代理、CLI等多种方式监测。支持对 Windows、Linux、Unix (HPUX、AIX、Solaris,)平 台系统的监测,支持 Syslog安全日志的管理;支持多种告警 方式,能够以Email、NetSend、外部命令、Snmp设置、Trap 转发、Agent执行脚本、短信等通知方式进行告警;支持对所有监控范围内IT资源的当前和历史运行情况进行统计,弁生成各种分析报表和图表。(5)平台要求支持统一身份认证的单点登录、统一权限管理和统 一界面展现功能;(6)系统平台要求提供友好的操作管
3、理,能够根据不同管理层次 的管理要求灵活定制不同的管理界面。(7)系统要能够提供良好的集成接口,支持与第三方标准产品的 集成部署;1.2 项目建设目标与原则IT运维管理系统平台项目建设的总体目标是实现对企业的网 络、设备、主机、安全系统、数据库、中间件、应用系统等 IT 资源的可视、可控、可管理,从根本上提高IT运维管理水平,为企业核心业务系统提供有利保障;加强对IT系统及IT资源的监控与维护能力、提高维护工作效率、改善维护工作的质量,进 而保证各系统维护水平的可持续性提升。IT运维管理平台的建设应遵循开放性、先进性、安全性、可 靠性、易用性等原则:1 .战略性原则a)提供具有针对性、可行性和
4、可靠性的技术解决方案2 .开放性原则a)采用符合国际国内通用的标准协议b)支持主流计算机平台、操作系统以及数据库厂商的各 类软硬件产品。3 .先进性原则a)采用国内外监控和服务管理领域先进的技术和解决方 案b)在方案中要将监控和服务有机的结合起来,实现无缝 集成。4 .安全性原则a)保证数据安全b)不增加现有应用系统的复杂性,更不会降低现有应用 系统的稳定性。c)有严格的身份认证,实施对用户真实身份鉴别d)采取分级用户结构,提供用户权限管理,防止未授权 的用户访问;e)有安全审计功能,配置审计时对生产系统不产生影响;f)日志安全存放,弁有格式化的输出,便于检索和查询5 .可靠性原则a)管理系统
5、应该在系统结构、设计方案、设备选择、技 术服务等方面综合考虑,保证系统能够安全无故障运 行b)安装在被监控对象上的代理或探测工具占用被监控对象的资源在5%以内;6 .易用性原则a)提供简洁、方便、有效的管理工具和界面,有完整的 系统文档。b)提供可扩充性的接口设计以便于维护人员的日常管理 和维护;c)采用CS+B/S结构;用户界面应有容错能力,所用术语 应具有一致性;d)用户进入系统的相应功能模块后,该模块所涉及的各 项功能尽量在统一的一个界面中显示和完成,减少新 界面的弹出;e)系统采用集中、无需代理的方式运行,无需在被监测 信息系统、服务器上安装任何代理软件,只需在一台 网管机上安装,即可
6、自动对整个信息系统进行监测和 管理,不改变现有系统的应用配置,对现有系统性能 影响甚微,安装实施、维护使用十分方便。7 .知识产权保护原则a)要求本项目涉及的所有产品符合国家对软件产品的有 关规定,弁具有相应的产品认证或许可,无版权纠纷。2 IT运维管理平台功能要求2.1 网络监控与管理要求2.1.1 系统工作模式系统采用多层架构、信息总线技术,具备良好的性能和扩展 性,系统为用户提供了 C/S和B/S的两种展现模式,为不同关注 层面的用户服务。以方便管理人员使用 C/S对网络进行专业管 理,运维人员使用 B/S对网络进行值班监控。系统具有拥有灵活、高效的网络采集引擎,通过对象识别、 采集弁发
7、及针对的厂商扩展脚本,可准确、可靠的提供网络设备交互服务。系统利用ICMP、ARP、SNMP、NetBIOS、CLI等标 准进行网络探测和信息采集,对发现的网元对象进行识别、 分析、 保存,形成统一的网管资源库,弁在此基础上进行拓扑计算,生 成物理、网络等不同层次的拓扑结构。通过主动(ICMP、SNMP、CLI)与被动(Trap、NetFlow、 SFlow、镜像、NetStream)两种方式,系统可以从设备上获得各 类性能指标和流量数据,经过长时间数据的跟踪记录, 最终挖掘 分析生成各种报表,展现网管部门需要的网络流量与负荷信息, 以供对网络状态的合理评估与决策。在对网络的不间断实时监测中,
8、 系统能够收集针对网络、 设备、终端及链路的各种事件, 弁利用过去在网管过程中学习得到 的处理规则,系统可以对这些事件进行智能分析, 弁关联所有符 合故障特征的相关事件,最终在故障发生前、或故障发现时发出 正确告警,以便网络管理人员高效、及时的定位弁解决问题。2.1.2 网络安全设备管理全面支持 CISCO、华为、中兴、北电、 Foundry、Extreme、Avaya、H3c、DLink等各种不同厂商、不同型号的网络与安全 设备,提供各类设备的基本信息、CPU / MEM负载状况,设备可用状态、连续运行时间、响应延时、端口速率、ICMP连通性等设备属性与监测信息,亦可自定义 SNMP监测内容
9、。网络设备监测项主要包括:设备CPU利用率:监测网络设备的CPU使用率。设备内存利用率:监测网络设备的内存使用量、内存使用率。端口速率监测:监测网络设备中指定端口的入速率、出速率、 入丢帧速、出丢帧速、单播入帧速、单播出帧速、非单播入 帧速、非单播出帧速、入错误帧速、出错误帧速。端口上下线监测:监测网络设备指定的端口的上下线状态。自定义SNMP监测:可监测多个SNMP表达式(支持四则运 算、时间差值运算等)对应的采集结果。ICMP连通性监测:监测与网络设备的连通性。2.1.3 面向网络的一体化管理管理界面友好,能够提供实时的底层网络、设备、系统、数 据库和应用服务运行状态的有效监控和统计、网络
10、边界安全保 障、告警事件列表及IP资源管理等功能,每个区域可以把各功 能管理项获取的底层数据按照IT基础设施内在的关联关系,根据运维人员的使用习惯进行了人性化的重新整合呈现,改变过去传统网管生硬的专业指标分割罗列的风格。在支持典型功能外,还可以从管理人员的角度出发, 把平时 经常关注的设备监测视图进行重新组织显示, 从管理人员的角度 进行查看。提供web客户端,管理员在网络的任何位置,甚至是外网, 都可以通过浏览器访问网络监控系统的后台服务器,实现随时、 随地统揽全局。2.1.4 网络拓扑管理提供能够提供准确直观的1 .发现的设备种类全面系统支持多厂商的网络设备,可以支持的厂商包括 CISCO
11、、 Juniper、Huawei 华为、ZXR 中兴、H3C、Enterasys 凯创、Extreme、 Foundry、Harbour 港湾、CDRS 神州数码、AVAYA、 Nortel 北 电、3COM、ARRAY、D-Link、Maipu 迈普、Red-Giant 锐捷、NetScreen> Topsec天融信、Riverstone 等。2 .拓扑发现技术手段先进支持通过 SNMP、ICMP、NetBIOS、ARP、Traceroute、Telnet 等多种手段自动发现、识别设备。在支持众多国内外设备的基础 上,系统还对网络类型有很好的兼容性,可以很好的发现 VPN、 VLAN网
12、络拓扑,提供拓扑的动态跟踪和更新功能,能够更加有效的反应网络拓扑现状。提供网络拓扑动态发现和跟踪技术,可以通过单设备拓扑、 多设备拓扑、网段拓扑、种子节点拓扑等多种方式的拓扑发现网 络拓扑准确地展现出网络的当前拓扑情况。3 .拓扑显示视图多样系统基于Java平台,支持远程管理协议采集,系统对B/S、C/S混合支持。支持大规模的网络管理问题,系统支持将大型网 络通过按照地域、部门等划分成多个相对较小的子网实现分级管 理、提供远程管理工具辅助用户对大型网络进行监控和管理。用户可以根据自己的使用习惯选择合适的拓扑视图加以监控。能够提供以下拓扑图:物理拓扑反映被管网络的实际连接的二层网络拓 扑图,方便
13、用户直观掌控网络的实际连接情况;网络拓扑反映被管网络各个子网之间的连接关系拓扑图,方便用户从IP层逻辑组织网络的管理;子网拓扑一一反映同一网段内终端与二、三层设备的连 接关系拓扑,方便用户进行终端设备连接状态的监控及 故障诊断;Web拓扑一一系统支持网络拓扑图基于浏览器的展现, 通过浏览器的方式监测网络的运行情况,WEB拓扑图通过3-N级的方式展现网络拓扑、设备状态、端口状态。 用户可以通过浏览器访问,通过浏览器来查看网络运行 的情况。这种显示方式的好处是方便用户穿过防火墙, 随时随地进行拓扑浏览监控。全屏拓扑一一可以提供全屏拓扑,以便可以更为方便的 全局浏览拓扑,同时也方便进行大屏展现4 .
14、拓扑显示信息丰富在拓扑图上可以浏览网络资源的详细信息,包括: 在拓扑图上集成设备状态、链路带宽流量、告警故障的 展现,使用不同颜色、粗细、图标表示被管理对象的状 态信息;提供快速查找和定位设备功能,可以通过设备名称、IP地址、MAC地址等信息,在拓扑图上准确定位设备, 弁显示出此设备的网络连接信息;自动记录设备的所有活动情况,如接入网络、设备迁移 及上下线信息。便捷的浮动信息显示,浮动显示各类设备和链路的关键 信息;集成丰富的右键管理菜单;集成一些常用管理工具,如多实例ping、remote ping、traceroute、telnet、MIB 浏览器拓扑图无级缩放、全屏显示以及背景图设置。手
15、工修改网络设备的配置信息2.1.5设备管理系统设备管理全面及时,能够提供设备管理的快照,提供管理的设备列表,弁能够提供手、自动可选的设备配置备份功能。1 .设备管理的快照在拓扑中可以轻松点击被监控设备进入设备运行监控界面,以Dashboard的方式浏览网络设备状态的 CPU、内存、链路流量 等当前运行参数,若设备出现告警事件或阈值告警, 则在网络拓 扑图上相关网络设备节点图标以不同的颜色显示,提示管理员进行处理。2 .直观清晰的设备列表10设备管理将系统所发现的所有设备以列表形式展现出来,户可以方便的查看到设备的名称、类型、IP地址、MAC地址。用户即可以查看所有设备,也可以按类型查看或按子网
16、查看。用户可以查询所管理的各子网网段内IP地址的分配、使用情况,以及占用该IP地址设备的上联设备及端口的详情等。3 .手、自可选的设备配置备份系统集成主流厂商思科、 华为、华三和神码等网络设备的配 置备份功能,管理员可以设置备份策略,根据管理员配置的策略, 系统自动将网络设备的配置信息备份到备份服务器上。减少设备出现故障时进行设备配置恢复的时间。对于非主流厂商设备,可以通过 TCL脚本编写交互工具的 方式获取相应设备配置备份来实现兼容性的扩展。系统提供了手动备份与自动备份两种备份功能。4 .详细的设备信息分析统计系统可以帮助用户统计网络设备及终端设备的详细信息,不仅包括设备名称、别名、厂商、型
17、号等基本信息,也包括设备端 口的类型、端口号、IP地址、MAC地址、端口速率、MTU、端 口状态以及对端端口的详细信息,此外还支持SNMP设备的端口各类出入栈二层桢传输统计情况,如丢包率、错包率等。系统还提供动态的网管信息展现,如端口列表、ARP表、TCP/UDP表、转发表、CDP表、STP表、设备部件表等。2.1.6性能管理本系统管理平台提供了完善的被管理网络数据采集,分 析,统计和报表功能,能够通过 SNMP ICMP采集方式,对网 络设备的CPU内存、流量等运行性能指标进行轮询采集。系 统进行实时采集数据分析,弁保持对网络性能和设备性能的 跟踪和趋势分析。1 .监测指标丰富系统支持网络性
18、能实时监测,能监测所有网络设备的当 前运行负荷状况,包括:当前 CPUffl用率、当前内存利用率、 入流速、出流速、入包速率、出包速率,到网络设备的端口 流量、丢包率、错包率、 Ping延时和丢包等运行参数超过预 设阈值时,弁能在拓扑图上根据用户定义阈值以醒目颜色显 示。同时,系统提供对主机操作系统 CPU内存和硬盘使用情 况的实时监控。止匕外,系统还提供对典型Web服务的可用性监控,如 HTTP/HTTPS FTP、 DNS DHCP LDA将常见应用服 务,弁且系统同样支持对主机和 Web服务监控的阈值告警功 能。在实时监测的基础上,系统还提供对历史性能数据进行 统计分析功能。网管系统提供
19、的实时性能监视可以实时监控网络设备的 端口流量和丢包率等性能指标,弁可以方便的给出这些指标的趋势、平均值和最大值,为故障的预测提供有力的分析工具。通过系统能够设置性能的采样周期,能够以图形方式显示性 能指标,弁可根据用户的需要定义监测的指标。2 .多层面性能监测系统为网络管理员提供多角度的监测。除了提供网络、物理 拓扑显示的图形性能提示外、 还为网管员提供主动的面向设备的 负荷监测、面向链路的流量监测、 面向终端的活跃度监测等多层 面的性能监测。面向网络设备的负荷监测能够监控到网络设备的 CPU和内存使用情况,通过监控网 络设备的负荷情况,将被动管理化为主动预警, 随时可发现网络 的隐患。面向
20、链路的流量监测链路性能直接体现网络上数据传输质量。网络上的延迟过 长、瓶颈或丢包错包率增高都将会影响网络提供服务的质量。在拓扑图上通过节点的颜色变化、 链路的颜色变化、总览列表的带 宽占比统计,可以让用户从集成化界面中全面评估网络的整体性 能状态,快速定位出网络的瓶颈和隐患。面向终端的活跃度监测终端活动快照列表记录了所有终端设备的当前运行状况,内容包括:设备名称、设备IP地址、上联交换机端口、当前在线 状态、上次Poll时间、当前流速、当前包速、平均包大小,方便 用户进行故障诊断和病毒分析。 此外,还提供终端活跃度历史统 计。3 .监测配置简单系统配置界面友好、过程简单,且配置完即可生效。同时
21、, 系统具有自动评估监测的能力,能够自动生成配置。另外,性能 的阈值可在配置时设定,性能达到或超过阈值可触发各种形式的 告警,如:邮件、短信、声音等。4 .1.7故障管理通过系统故障管理,系统能够对故障信息进行搜集、分类、 归弁、压缩及告警通知,帮助网络管理人员即使定位故障源、故 障类型及故障波及范围等,帮助管理员来解决日常出现的各种故 障,从而确保在规定的时间期限内使网络重新投入运行。系统能够自动获得整个IT环境的各种事件,包括网络设备 的故障,性能的过载,流量的异常,服务器的异常性能,各类应 用的故障,各类终端的变更等等。通过系统故障监控台,用户能 够对整个IT环境的运行情况一目了然。1
22、.统一的故障分析引擎系统通过内置的事件分析引擎, 对获取的事件进行实时的压 缩、归弁,建立集中化的以故障为导向的集中告警展现。方便运 维人员实时查看网内所产生的故障。通过对事件进行过滤、归弁、相关性分析、传递等分析处 理。将处理过的事件保存在数据库中。支持对故障持续时 间较长的告警级别自动升级处理,支持用户自定义故障类型。对事件的严重级别加以分类,弁分别通知相关人员(如:普通故障就只通知网络管理员,重大故障同时通知主管领导和网络管理员);不同的用户可以为自己定义自己的过 滤和通知策略。故障管理能够实时监视弁截获网络运行过程中所出现的 故障,确定故障位置,以声音、电子邮件、短消息等多媒 体方式通
23、知网络管理员,弁给出故障原因。2 .多种告警类型系统根据故障来源及故障信息所属专业将告警信息分为以下几类:网络故障告警监测到链路或设备故障时,尤其是骨干链路Up-Down核心设 备离线等,发出故障告警信息。网络性能告警监测到网络设备、服务器的端口流量、丢包率、错包率、Ping 延时和丢包、CPLffl用率、内存利用率、磁盘利用率等运行参数 超过预设阈值时,发出故障预警信息。网络安全告警非法设备接入告警:未经过合法登记的设备接入网络 后,系统自动进行告警,弁根据配置采取主动拦截等 联动处理。IP地址变更告警:IP/MAC/PORT地址绑定之后,如果 出现用户私自更改IP地址的情况,系统发现将主动
24、发 送告警。主动接收设备Trap信息系统能够主动接收网络设备、防火墙等设备发出的Trap故障 信息,弁在告警台统一展现给用户。3 .直观的告警列表系统把告警事件按节点和严重级别进行排序,弁提供包括来源、描述、发生时间、告警名称、告警等级在内的详细列表。4 .灵活的告警通知系统提供了丰富的故障通知方法,包括:声、光、 Windows 消息、EMAIL,短信等方法,用户也可自己编写处理程序进行处5 .集成多种故障诊断工具系统提供了各种工具帮助用户进一步监测故障的原因,包括:SNMPE具、Telnet、Ping、Tracert、NetBIOS、RemotePing 等等,辅助用户排除故障。6 .1.
25、8流量管理系统为用户提供了细颗粒度的流量分析管理工具Flowmon,实现从端口到应用的广泛流量分析和统计。通过Flowmon,系统能够实时监控系统流量,而不是历史数 据回放;系统无须配置成本高昂的硬件探针即可实现设备实时流 量的采集分析,从而避免在网络中引入新的故障点。1 .支持多种流量采集手段系统提供多种流量采集的方式,支持端口镜像流量、sFlow流量、Netflow 流量等,Flowmon可以同时支持多个网卡和多种采集弁行的流量分析,弁为数据分析提供一致的访问界面。考虑到网络数据流量分析的数据量十分庞大,系统不会保存所有的原始流量数据信息,而是仅仅保存分析加工后的归弁信 息,从而降低服务器
26、的存储要求。2 .多维度实时流量分析系统支持对流量实时分析,当流量数据采集到Flowmon之后,系统会对流量数据开始进一步的分析,提取有效的数据信息,主要通过以下处理过程:数据过滤:可以通过地址、端口、协议等条件设置数据过 滤器,滤去不需要的干扰数据。流向分析:对数据包包头或者 xFlow的包信息进行解码, 获取数据包的流向信息,用于分析数据的来源和目的地, 通过分析矩阵获取每个网络节点的流向情况。层次分析:系统对数据包进行 1-7层的划分,用于分析全 局的数据流量。协议分析:系统会进行协议级别的数据分析,系统采用了 CSPAE分析引擎进行TCP/UDP数据流分析,可以分析大 多数的常见 TC
27、P/UDP协议,包括:HTTP、POP3、SMTP、 FTP、SNMP、DNS等常见协议。应用分析:系统会对一些动态协议进行应用级别的 7层包 头分析,从而可以掌握 BitTorrent、eDonkey、MSN等P2P 和即时通讯协议的流量情况。3 .通过流量分析辅助网络的异常判断全局统计通过对流量的分析,Flowmon可以对采集到的数据进行整体的评估分析,让用户了解网络的整体情况,主要包括:全局流量统计:从整体角度对网络流量的数据包情况进行统计,包括数据包的长度、 TTL、总体流量、总体协 议分布、总体TCP/IP协议分布、TCP/UDP端口分布等。终端流量统计:从整体对终端流量的进行统计和
28、排序。协议统计系统从协议角度对网络数据行为进行分析,弁按照终端 形成排名,便于管理员掌握网络中协议的分布和重点终端的 数据行为。通过协议流量排名分析,可以有效地发现AR嗝毒、蠕虫异常流量、BT流量、网络异常流量等行为。协议整体分布:从全局协议、TCP/IP协议两个级别提供 协议的分布。全局协议的排名分析:从终端角度对全局的协议进行排名分析(按照 TCP/UDP/ARP/ICMP/IPX/IGMP/OSPF 等分类)TCP/IP协议排名分析:从终端角度对 TCP/IP协议的组 成 进 行 排 名 分 析 (按 照HTTP/FTP/Mail/Telnet/ /SNMP/BitTorrent/eDo
29、nkey/Me ssenger等进行分类)会话统计系统通过对流量的流向进行分析,弁对TCP会话进行监测,从而获取各个网络节点的流量和会话统计信息。主要包括:终端流量通讯矩阵:以矩阵的方式展现终端之间的通讯关系和通讯流量。终端流向统计:本地网络和外部网络, 多个VLAN之间 各个终端的流量统计排名和总流量。终端会话统计:终端 TCP建立会话的统计,按照 TCP 的端口进行展现。终端统计系统从单个终端节点的角度,分析单个终端的网络数据行为,主要包括以下几个方面:终端总体分析:包括活动时间、总的数据流量和包数、基本协议对比等最近24小时的流量统计:每小时的发送、接收流量的统计数据包的统计:从 TCP
30、会话、TCP标志包、异常数据包三个方面对数据包进行统计终端协议分布:终端使用的各种协议的分布图 其他统计:包括ICMP协议统计、最后一次的数据通讯统计等。2.1.9报表管理系统能够为用户提供性能、告警、状态、资源多个角度 的统计和分析报表。系统具备报表自定义扩展能力,通过报表设计器,可以 定制更符合需求的报表。用户对相应的系统监测数据进行统 计后,能够以报表形式展现分析统计结果。报表包括:网络 运行统计、节点延时统计、节点端口流量统计、设备CPUQ载统计、设备内存占用统计、主机 CP改载统计、主机内存 占用统计、Oracle数据库运行统计、服务运行统计等1 .端口 I/O流量报表通过网络设备的
31、端口对流量进行统计,弁以报表的形式 进行展现统计结果。2 .设备故障日/月报表系统平台提供统一事件管理来解决分割管理的数据融合 问题,通过以告警事件为导向,提供了清晰的、集中的事件 管理。可以让管理人员对整个IT环境的各种硬件和软件系统 的实时事件信息收集,对各类事件信息进行过滤、压缩、归弁等相关性分析与处理,智能化压缩处理海量告警事件,分 析出真正的问题所在,实时呈现出完整的事件信息,弁将这 些信息分发给负责服务水平监视的操作管理员。系统支持以日/月为单位实时呈现所有的网络、 系统、应用、安全、桌面等被关注的资源。3 .设备清单报表以直观的方式显示设备当前的运行状态。系统能够根据设定,统计指
32、定的子网内各设备上端口的 运行情况。让管理员能够直观的掌握设备上的端口数量以及 端口的使用情况,科学有效地分配设备的端口使用,提高网 络环境的运行效率。4 .性能报表系统能够根据不同层次管理员设定的不同监测参数组 合,自动生成所需的性能分析报告,提供的性能报告能够针 对网络所有的被管理资源(服务器、数据库、中间件)的关 键性能指标(CPU内存、磁盘、进程使用情况)进行详细的 展现,系统还能根据设定自动将历史报告发送给相关人员, 提高决策效率。5 .自定义报表系统提供的内置报表,若无法满足现有需要,可以通过 客户化工作。6 .1.10 安全边界管理系统提供IP地址资源管理,对网络边界的安全和 I
33、P地 址的户籍进行管理。系统通过内置的设备合法性监测引擎,在不额外消耗网络带宽的情况下,自动发现和监测网内终端设备的基本属性(IP地址、MACfe址、主机名、连接的交换 机端口等),系统能够通过IP/MAC/主机/组织/人等信息绑定, 建立IP资源信息库。IP地址使用情况详细列举出系统发现的 各子网内IP地址的使用情况,包括IP地址、设备名、端口 号、端口名称、IP状态、上联设备、上联设备 IP、上联设备 端口等。边界按照IP地址的“户籍表”,监控网络中IP的使用 情况,对非法使用的IP地址进行拦截,将非法的IP终端隔 离出网络,确保用户不能随意修改 IP地址和防止IP地址盗 用。网络边界管理
34、提供了 IP地址使用的高级审计功能,方便 对IP地址的使用进行历史审计和追查。系统能自动跟踪终端的变化情况。发现有未经登记的设 备、或违反IP/MAC/交换机端口绑定规则的终端设备进行告 联 二O系统能够通过IP/MAC/PORTW定实时发现是否有非法设 备接入局域网络及是否有用户私自更改IP地址的行为;根据安全策略配置通过手动或者自动的方法将非法接入设备隔离 出网络,或者将已被拦截的设备重新开通网络连接。有效保 障了网络的安全。拦截与放行设备:手动或者自动(根据安全策略配置)将非法设备隔离出网络,或者将已被拦截的设备重新开通网 络连接。IP/MAC/PORT绑定:IP/MAC/PORT地址绑
35、定之后,能够 实时发现是否有非法设备接入网络及是否有用户私自更 改IP地址的行为,如果用户私自更改IP地址,系统主动发送告警信息。终端合法性监控:系统通过业务监控系统的合法性监测引 擎,能在不额外消耗网络带宽的情况下,自动监测网内终 端设备的基本属性(IP地址、MAC地址、主机名、连接 的交换机端口等),对私自变更设备信息进行告警。2.2 资源监测管理系统集网络安全设备、应用服务和基础支撑系统等监测管理 于一体,支持 SNMP、Syslog、CLI (Telnet、SSH、WMI )、JMX 等远程监控手段和Broadview UniAgent代理监测,各类标准应用 协议仿真,拥有了 500多
36、种监测器,提供对整个业务网络的 7X24 不间断监控。强大监测插件体系无需二次开发,通过监测插件,不断增加监测器数量,扩展 监测范围与内容。众多监测器工作独立,互不影响,保证整个监 测体系的稳定运行。灵活的监测时间调度机制和智能化的监测阈值模型自定义监测时间与监测阈值,形成多样化、组合型监测策略, 满足复杂环境下不同的监测任务要求。主机代理Agent监测和远程无代理监测两种监测模式多方式、多手段的自由组合,兼顾业务网络各部分性能影响, 适应不同监测条件。2.2.1 服务器系统管理系统能够管理和监测 Windows、Linux、IBM AIX、AS/400、 HP-UX、SUN Solaris、
37、SCO Unix等不同操作系统的服务器或集 群的运行状态和性能数据,包括服务器的基本信息、CPU负载、内存利用率、应用进程、文件系统、磁盘空间和吞吐、事件与错 误日志等信息的分析与监视。 帮助用户及早发现服务器系统的性 能瓶颈与故障隐患。服务器监测项主要包括:主机基本信息采集:主机的基本信息,包括:CPU数目、机 器型号、系统名称、系统版本、IP地址、内存大小、总线程 数目、磁盘名称等。主机CPU使用率:监测主机系统的CPU使用率。主机内存使用率:监测主机系统的内存使用量、内存使用率。主机磁盘使用率:监测主机系统的指定磁盘使用率。主机磁盘IO监测:监测主机系统的磁盘 TPS数、磁盘写操 作速率
38、等、每秒完成IO读写次数、每秒读写扇区数、每秒读 K字节数、平均I/O队列长度等。应用进程监测:监测主机系统中指定应用进程的内存使用量、 内存使用率、CPU使用率。系统服务监测:监测主机系统中指定服务的运行状态主机当前登陆用户信息:当前登录用户登陆的时间、终端IP、 终端名称主机端口速率监测: 监测主机系统中指定端口的入速率、出 速率、入丢帧速、出丢帧速、单播入帧速、单播出帧速、非 单播入帧速、非单播出帧速、入错误帧速、出错误帧速等。主机重要文件监测:监测主机系统中指定的文件大小。Job基本信息采集(AS/400):监测Job的名称、CPU使用率、 类型、状态、所属用户等。ICMP连通性监测:
39、监测与主机的连通性。HACMP集群状态监测:监测集群的可用状态及子节点的状 态。自定义指标监测:系统提供了通用监测器,用户可以通过编写shell或者groovy脚本自定义监测指标2.2.2 数据库管理根据预定义的监测项目对 Oracle、SQL Server、Sybase DB2、Informix、MySQL等多种数据库,按照属性相关性分为数据库 工作状态、数据库表空间的利用情况、数据文件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数据库内存利 用状态等属性监测组,分组监测数据库系统的性能、事务、连接 等性能数据。DB2数据库监测基础监测:最后一次备份时间、数据库状态、数据库激活
40、 时间、当前连接数、连接总次数缓冲池信息监测:各缓冲读写次数、命中率锁监测:死锁数、锁等待率、锁升级率锁表信息:锁状态、锁模式、表空间、 Schema排序信息监测:应用排序数、排序溢出百分比表空间监测:已使用页、表空间类型、页长、总页数、表 空间状态、空闲率、空闲页、使用率、预取大小、扩展数 据块大小表空间容器监测:使用率、总页数、已使用页、容器类型、 表空间名称Oracle数据库监测基础监测:表空间使用率、连接会话数高级队列监测:ready消息数、错误的消息数、消息平均 访问时间、消息总数归档目的地监测:归档目的地类型、归档目的地状态、归 档目的地可用空间、归档目的地可用空间百分比、归档目
41、的地位置基本信息采集:使用spfile启动、只读模式、归档路径、 例程开始时间、限制模式、归档模式、例程名、弁行状态、 位长、DB版本、DB名称、主机名、实例状态检查点监测:发生检查点数、完成检查点数数据文件监测:文件大小、读次数、写次数、读时间、写文件块数、读文件块数、读写文件块数、写时间全表扫描配置: RSRATIO值、LTSCANRATIO值资源锁定监测:锁定时长碎片监测:FSFI值PGA配置:PGA内存及各区域大小、实例处理性能等进程资源消耗监测:可用PGA百分比、可用PGA、已分配PGA、已使用PGA命中率监测:共享区字典缓存区命中率、多次解析 (重装)的条目比率、高速缓存区命中率、
42、共享区库缓存区命中率、 磁盘排序与内存排序比率、回退段等待次数与获取次数比 率递归调用信息监测:递归调用百分比、时间间隔的递归调用百分比、用户调用数、递归调用数、递归-用户调用比 率、递归调用速率Redo日志配置:重做条目的平台大小、多种请求成功 /失 败比率、错误次数等Rman备份监测:增量备份大小、全备份大小回滚段:大小命中率、等待率、等待次数、活动事务数、翻转次数、扩展次数、一致更改率、收缩次数、用户回滚率会话监测:会话ID、用户名、CPU时间、排序次数、缓 冲区命中率、读次数、写次数、提交次数、占用游标数、 扫描次数SGA配置:共享库缓存大小、SQL缓存大小、数据字典 缓存大小、共享池
43、大小、重做日志缓冲区大小、高速缓冲 区大小SQL监测:使用内存、执行时间、SQL语句、用户 转存空间监测:转储空间使用率 表空间监测:未使用Extent数量读时间、最大Extent数量、 已使用率、已使用量、未使用量、未使用百分率、允许最大空间、是否自动扩展、写时间、Segment管理方式、表空间类型、当前 Extent数量、下一个 Extent大小表状态监测:增长速度、索引大小、数据大小、表空间、用户撤销空间监测状态监测:快照太旧错误计数、无空间计数作业队列监测:破损作业数量、过期作业数量、失败作业数量MySQL数据库监测基础监测:缓存查询数、连接数数据库大小监测:数据库大小SQL Serv
44、e基础监测:连接会话数、CPU使用率、数据文件大小、日志文件大小基本信息:阻塞进程数、处理器名称、Windows版本、处理器数目、主机名、内存(MB)、数据库数目、会话数目、启动时间数据库大小:数据大小、数据库大小、未分配大小、未使 用大小、索引大小、保留大小文件监测:路径、增长方式、容量、文件组、数据库、大小会话监测:最后处理时间、命令、数据库、CPU时间(ms)、内存(KB)、程序、建立时间、用户、状态、主机Informix数据库监测基础监测:回滚数、死锁数、写缓存命中率、读缓存命中率、数据库连接数检查点监测:检查点速率、检查点等待速率DbSpace监测:数据空间使用率磁盘读写监测:页写速
45、率、页读速率、物理磁盘写速率、物理磁盘读速率锁监测:锁请求速率、锁超时率、锁等待率、死锁率日志读写监测:物理日志页面写速率、物理日志写速率、逻辑日志页面写速率、逻辑日志写速率、逻辑日志记录写速率共享内存监测:块写速率、缓冲区写命中率、缓冲刷新到磁盘速率、Foreground写速、缓冲区等待速率、LRU写速率、顺序扫描速率、Latch等待速率、缓冲区读命中率排序监测:内存排序速率、磁盘排序速率事务监测:事务提交速率、事务回滚速率Sybase数据库监测基本信息采集:DBMS名称、DBMS版本、系统信息、产 品版本、主版本号、产品名称、次版本号数据库监测:使用百分比、已使用大小、数据大小、空间 大小
46、、索引大小、未使用段大小、数据段大小、段总大小、 索引段大小会话监测:数据库、命令、已用内存、 CPU时间、IO读 写次数、程序、主机、用户、状态事务监测:系统事务交易总数、每秒回滚事务数、每秒事 务数设备监测:属性值数据库:CPU使用率、数据库空闲表空间、数据库表空间、 连接会话数2.2.3 中间件管理产品支持对 Websphere WebLogic、MQSeries、Tomcat、 Tuxedo、Tibco、Resin、TongWeb、等各类不同中间件,提供包 括配置信息、连接池、线程队列、负载监测、通道情况监测等多 类监测组,分析与监测中间件的各项运行状态参数。中间件监测项主要包括:系统
47、信息采集:监测中间件基本信息,包括:操作系统、操 作系统版本、当前可用堆栈及大小、当前目录、重启次数、 开启线程数。JVM使用监测:监测JVM的堆栈大小和使用率。JDBC链接池监测:监测指定JDBC连接池资源连接情况。JTA事务监测:监测中间件中数据处理事务的活动情况。线程池监测:监测指定线程类的线程平均数、空闲线程平均 数以及线程吞吐量。Servlet监测:监测指定Servlet执行和调用情况。EJB监测:监测指定EJB激活次数、钝化次数、缓存个数、事务提交次数、事务回滚次数、事务超时次数、访问次数。WEB应用监测:监测指定 Web应用中Session的当前个数、 最大值以及累积个数。JMS
48、队列深度监测:监测中间件中JMS消息队列活动情况。MQ通道情况监测:监测MQ的通道情况,包括:每秒接收 字节、每秒发送字节、通道状态、发送间隔、事务数。MQ队列深度监测:监测MQ服务的消息队列的队列深度。Tuxedo负荷监测:监测Tuxedo的机器状态是否被激活、每秒处理的队列服务数每秒入队的队列服务数、当前客户端数、当前Workstation客户端数。TongWeb数据连接池监控:监测国产中间件Tongweb数据库 连接信息,如最大、最小连接数,可用、创建、关闭、等待 连接数等TongWeb应用性能监控:主要监测系统线程情况、请求队列 情况、吞吐量、发送接收字节数等信息;2.2.4 基础应用
49、平台及通用服务管理状态提供对IIS、Apache、-Domino等基础应用平台的基础 信息、连接测试、基本负载等重要信息的监测。有效实时地分析 HTTP/HTTPS、DNS、FTP、DHCP、LDAP 等常见通用服务的运行状态和参数,深入分析服务响应速度变化的技术原因和规律,从根本上解决服务响应性能的问题。Domino服务器监测基础监测:监测Domino服务器的内存占用值、指定数据 库的使用率、待发邮件数、例死邮件。基本信息采集:采集Domino服务器的基本信息,包括: Domino版本、数据库存放路径、CPU个数和CPU类型信负载监测:监测Domino服务器当前负载情况,包括:每分钟交易数、
50、每分钟最大交易数、交易总数、当前用户数、 最大用户数、当前任务数。复制(Replication)监测:监测Domino服务器复制情况,包 括:成功复制次数、失败复制次数、删除文档总数、增加 文档总数、修改文档总数。邮件服务监测:监测Domino邮件服务情况,包括:死邮 件数、路由邮件数、待路由邮件数、已投递邮件数、待投 递邮件数、平均邮件大小、最大邮件大小。缓冲池监测:监测Domino缓冲池的使用情况,包括:缓 冲池大小、缓冲池使用值、缓冲池最大值、扩展管理池使 用值、扩展管理池最大值、NSF使用值、NSF最大值。扩展管理池监测:监测Domino扩展管理池的使用值、最 大值。Apache负载监
51、测:监测服务器是否连接,采集CPU负载、正 常运行时间、响应时间、累计访问数、累计访问数据处理、 每秒请求数、每秒处理字节数、每请求处理字节、忙作业数、 空闲作业数等指标。IIS监测主要包括:连接监测:监测IIS服务运行时间、服务运行时间、尝试 登陆/秒、尝试连接/秒、当前连接数、最大连接数。传输字节监测:发送字节/秒、接收字节/秒、传输字节/秒、 服务运行时间、接收文件/秒、发送文件/秒、找不到文件 的错误数、服务运行时间、传输文件 /秒。用户监测:服务运行时间、最大非匿名用户数、非匿名用户/秒、匿名用户/秒、当前非匿名用户数、当前匿名用户数、最大匿名用户数。WEB请求监测:post请求/秒
52、、head请求/秒、其他请求/ 秒、服务运行时间、get请求/秒。WEB服务器可用性监测: 监测http、https和 Web Service服 务器是否连接以及是否正常运行,可以监测指定 http的URL 路径是否包含或者不包含指定内容。标准邮件服务器监测:监测pop3、smtp邮件服务器是否连接 以及是否正常运行,可以监测具体的邮箱的邮件数以及邮箱使用量。基础服务监测主要包括:DNS服务监测:监测DNS服务器是否连接以及是否正常运 行,可以监测指定域名是否正确解析。FTP服务监测:监测FTP服务器是否连接以及是否正常运 行,设定已FTP方式登录该资源的阈值,监测指定文件是 否存在。通用资源
53、监测主要包括:TCP端口监测:可监测多个TCP端口,弁采集连接时间,可 指定端口开启或者关闭时告警。通用SNM彘测:可监测多个SNMP1达式(支持四则运算、 时间差值运算等)对应的采集结果,弁可设定告警阈值。2.2.5 基础运行环境管理对于IT环境系统,系统支持各种智能设备的快速监测,同 时通过SNMP、数据库接口等其他接口方式可以实现客户化的扩 展监控,监测内容包括基础运行环境的温度、湿度、漏水、烟感 和电源、UPS、智能空调等。2.3 告警监控管理2.3.1 告警管理事件分析系统具有强大灵活的事件分析功能,能够智能识别各类不同来源的原始事件。通过内建的智能事件分析引擎, 对标准化后的 原始
54、事件进行可靠过滤、重复压缩、对齐归弁与依赖关联,自动 修正告警记录,最终形成有效告警。自定义事件解析规则用户可自定义编辑和导入解析规则库文件,自主制定事件解析规则,同时支持第三方 M旧库的装载与自动解析。基于iBDM的事件关联分析事件的产生以及其影响都不是独立的。基于业务影响依赖模型iBDM的事件关联分析,自动发现关联,追溯事件影响、定位问题,发现问题根源。告警台作为告警管理平台,呈现最新告警信息,弁以最近24小时、 最近一周、最近一个月等不同区间统计最近的告警记录, 提供自 定义刷新、告警确认与消除等告警管理操作。分等级告警产生的告警信息分为提醒、警告、次要、重要、紧急五个等 级,用户可以根
55、据告警等级安排告警处理的优先次序。分类查询借助按资源与按节点的分类导航,快速搜索分类告警记录; 支持通过告警信息的事件等级、时间、类别、名称、资源等组合 条件进行自定义查询。告警的关联特性点击具体告警,会列举告警关联的事件,同时展现事件的详 细信息、问题资源信息和依赖关系图等,方便分析故障详情。2.3.2 告警通知多样的通知方式支持短信、邮件、语音等告警通知手段。支持外部命令、UniAgent执行脚本、NetSend、Snmp设置、 Trap转发等告警处理动作。告警处理动作将按预定义,自动在告 警发生后执行,先一步尝试恢复业务正常运行。灵活的通知策略根据不同的告警事件来源为它们指定不同的通知和
56、处理方 式,组成全面告警通知策略。强大的扩展功能2.4 统一监控展现通过统一监控展现功能,能够将不同类型的设备、系统、应 用等资源的监控平台进行集成,避免使用多个系统进行监控管 理。通过综合的展现平台来同事展示各种监控视图,以便于运维人员在一套系统上统揽全局。运维监控通过集成底层监控产品,能够提供从资源、节点、 网络、业务等多角度、层次化的监控信息集中展现,弁可通过服 务台和个人桌面集成底层监控平台的监控界面和数据,以支持上层的运维工作。2.4.1 灵活拓扑展现IT运维管理系统中的灵动拓扑展现与灵动可视化平台实现 同步,系统可以根据运维人员在灵动平台中创建的各类视图来显示资源配置、运行状态等信息。灵动拓扑展现不仅可以展现 IT资源的逻辑物理关系,还可 以查看视图中资源的运行状态。 拓扑图中的任一设备或者链路都 会以浮动框的形式显示其基本信息与运行状态。同时,通过点击节点,可跳转至相关联的视图或相关联资源的详细监控界面。IT运维管理系统作为运维与监控平台,其自身收集与处理 了大量IT部门运维所需要的各方面信息,包括:资源配置库、 监控性能与状态等。这些信息需要通过多种方式进行展现,而IT运维管理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中职(畜牧兽医)饲料营养阶段测试试题及答案
- 2025年高职蒙医学(蒙药应用)试题及答案
- 2025年高职纸制品设计(设计实操)试题及答案
- 2025年高职第二学年(环境艺术设计)AI辅助设计阶段测试试题及答案
- 2025年大学第四学年(生物学)分子生物学综合测试试题及答案
- 2025年高职第一学年(市场营销)营销策划阶段测试试题及答案
- 2025年高职水产养殖管理应用管理(管理技术)试题及答案
- 2025年大学大二(广播电视编导)电视节目编导综合测试卷
- 2025年大学(房地产开发与管理)房地产估价案例分析阶段测试题及解析
- 2026年阿坝职业学院单招综合素质笔试参考题库带答案解析
- 肿瘤化疗导致的中性粒细胞减少诊治中国专家共识解读
- 2025年查对制度考核考试题库(答案+解析)
- 云南省2025年普通高中学业水平合格性考试历史试题
- 四川省2025年高职单招职业技能综合测试(中职类)汽车类试卷(含答案解析)
- 消化系统肿瘤多学科协作(MDT)诊疗方案
- 安泰科技招聘笔试题库2025
- 二级生物安全培训课件
- 2025广东省横琴粤澳开发投资有限公司第二批社会招聘21人笔试历年典型考点题库附带答案详解试卷2套
- 塔吊拆除安全操作培训
- 2025年及未来5年中国抓娃娃机行业市场全景监测及投资前景展望报告
- 电机与拖动基础期末试卷及答案
评论
0/150
提交评论