共济IT一体化集中监控系统方案建议书.doc_第1页
共济IT一体化集中监控系统方案建议书.doc_第2页
共济IT一体化集中监控系统方案建议书.doc_第3页
共济IT一体化集中监控系统方案建议书.doc_第4页
共济IT一体化集中监控系统方案建议书.doc_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

精品文档 1欢迎下载 ITIT 一体化集中监控系统一体化集中监控系统 方案建议书方案建议书 深圳市共济科技有限公司 2012 年 04 月 IT 监控 精品文档 1欢迎下载 修订历史记录修订历史记录 日期日期版本版本描述描述作者作者 2012 04 27 V1 0 共济 IT 一体化集中监控系统方案 建议书 张颖 精品文档 2欢迎下载 目录目录 修订历史记录修订历史记录 1 1 第第 1 1 章章背景和需求背景和需求 6 6 1 1 项目背景 6 1 2 项目建设目标 6 1 3 需求概述 7 第第 2 2 章章系统设计系统设计 8 8 2 1 功能模块 8 2 2 系统部署架构 9 2 3 软件架构 12 2 4 系统流程 13 2 4 1 主要流程 13 2 4 2 数据流程 14 第第 3 3 章章主要功能及监控范围主要功能及监控范围 1717 3 1 主要功能 17 3 2 监控范围 18 第第 4 4 章章实时监控实时监控 2020 4 1 服务器 20 4 1 1 监控指标 20 4 1 2 界面展示 22 4 2 网络安全设备 22 4 2 1 监控指标 22 4 2 2 界面展示 25 4 3 存储设备 25 4 3 1 监控指标 25 4 3 2 界面展示 26 4 4 数据库 27 精品文档 3欢迎下载 4 4 1 监控指标 27 4 4 2 界面展示 31 4 5 中间件 32 4 5 1 监控指标 32 4 5 2 界面展示 34 4 6 应用软件 34 4 6 1 监控指标 34 第第 5 5 章章实时监控实时监控 设备监控设备监控 3535 5 1 设备监控列表 35 5 2 监控指标列表 37 5 3 列表导出 37 第第 6 6 章章实时监控实时监控 监控仪表板监控仪表板 3838 第第 7 7 章章实时监控实时监控 IPIP 冲突监控冲突监控 3939 7 1 实时 IP 冲突管理 39 7 2 IP 历史变更记录 40 7 3 IP 验证管理 40 第第 8 8 章章事件告警事件告警 4141 8 1 实时事件和告警查看 41 8 2 告警管理 41 8 3 事件管理 42 第第 9 9 章章工单管理工单管理 4343 9 1 产生工单 43 9 2 派发工单 44 9 3 处理工单 45 9 4 工单汇总 48 9 5 工单地址管理 48 9 6 工单故障类型管理 49 精品文档 4欢迎下载 第第 1010 章章知识库知识库 5050 10 1 工单归档 50 10 2 历史故障经验库 50 10 3 预案库管理 51 第第 1111 章章值班管理值班管理 5353 11 1 机房进出登记 53 11 2 交接班登记 54 11 3 班次管理 56 11 4 计划作业 58 第第 1212 章章统计报表统计报表 6060 12 1 性能统计报表 60 12 2 事件统计报表 61 12 3 工单统计报表 61 12 4 服务器资源统计报表 62 第第 1313 章章系统管理系统管理 6363 13 1 WEB 端的系统管理 63 13 2 监控应用服务器的系统管理 64 第第 1414 章章系统特点系统特点 6767 14 1 以高效服务业务为目的 67 14 2 全面集中监控 67 14 3 轻量级的产品 完成监控管一体化 67 14 4 安全可信 67 14 5 实施快 见效快 容易上手 68 14 6 维护容易 68 第第 1515 章章运行环境运行环境 6969 15 1 一体化集中监控服务器的配置要求 69 15 2 数据库服务器的配置要求 69 精品文档 5欢迎下载 15 3 告警网关的配置要求 69 第第 1616 章章典型案例典型案例 7070 精品文档 6欢迎下载 第第 1 章章 背景和需求背景和需求 1 1 项目背景项目背景 保障数据中心核心业务系统安全高效可靠地运行 是信息系统管理部门的 重要职责和伟大目标 也是 IT 人的使命所在 IT 人拥有不可推卸的权责 数据中心核心业务系统 从逻辑上看包含多个不同的应用组件 从物理上 看运行在多个不同的物理服务器上 数据在不同的设备或系统间流动 要实现上述目标需要对数据中心进行全方位 多层次的综合监控 需要对 问题处置和应急指挥进行科学管理 1 2 项目建设目标项目建设目标 本项目主要针对解决数据中心管理和运行工作中的实际问题 主要作用表 现在以下三个方面 监控对象一体化监控对象一体化 实现机房动力 环境 安保 小型机 服务器 网络 安全 存储设备 小型机 服务器 网络 安全 存储设备 数据库 中间件 应用软件数据库 中间件 应用软件等跨平台一体化的实时状态 性能 事件 配置等 数据的采集 正则化汇聚和保存 监控展示一体化监控展示一体化 所有监控对象的状态 性能 事件都集中的以三维效果图三维效果图的方式展示出来 更方便 直观 高效的让数据中心工作人员准确的定位故障发生位置并处理所 发生的紧急情况 监控管理一体化监控管理一体化 一体化集中监控系统实现 7X24 小时实时监控和报警 知识库支持的实时事 件故障处理 自动化管理报表生成 资产管理 知识管理 机房管理资产管理 知识管理 机房管理等日常管 理功能 让工作人员在日常数据中心管理维护上更加轻松 以避免在不必要的 环节浪费大量人力 物力 让工作人员将主要精力放在数据中心内核心业务上 来 提高数据中心的整体业务效率 精品文档 7欢迎下载 一体化集中监控系统一体化集中监控系统的实施 将保障数据中心核心业务系统的安全 高效 安全 高效 可靠可靠地运行 极大的提高数据中心管理工作的自动化 信息化工作效率 为更 好的服务于社会提供强有力的保障 1 3 需求需求概述概述 通过需求调研 本建设项目的需求包括三个方面 一是监控管理系统的功 能需求 二是监控范围的需求 包括具体的监控对象 监控指标 三是监控系 统扩展性的需求 从功能上讲 本项目需要实现监测 控制和管理的一体化 具体包括 实 时数据及状态展示 事件告警统一管理 知识库管理 资产管理 机房值班管 理 统计报表等 从监控范围上讲 本项目需要实现的监控类别包括 动力 环境 安保 小型机 服务器 网络 安全 存储设备 数据库 中间件 应用软件等 从 而实现一体化集中监控的目标 从系统扩展上讲 系统支持各网管系统和其他系统的集成 提供数据 事 件的提取和发送接口 实现各集成系统状态 数据及事件的一体化集中监控展 示 精品文档 8欢迎下载 第第 2 章章 系统系统设计设计 2 1 功能模块功能模块 从应用软件的层面看 IT 一体化集中监控系统共由六大子系统构成 包括 Web 客户端 管理客户端 Web 服务 监控服务器 后台服务进程和监控代理 各子系统具体功能及相互关系如下图 系统上线运行之后 使用最多的就是 Web 客户端 它提供了监控管所需要 的一切 管理客户端是增减监控对象 调整监控策略 优化监控代理部署和监控策 略的强大工具 Web 服务包括工程文件 数据中转 自身监控 备份恢复 升级许可等诸 多服务 除了数据中转服务外 Web 服务不依赖后台的其它任何服务 它能够 对系统的其它组件进行起 停操作和状态检测 从而实现 IT 一体化集中监控系 统的持续运行 监控服务器是 IT 一体化集中监控系统中最核心的子系统 除 Web 客户端外 精品文档 9欢迎下载 其它四个子系统都与监控服务器子系统直接交互 它内嵌强大的实时数据库 拥有侦听器 数据匹配 事件生成 数据保存 数据访问 连通检查和 SNMP 轮 询在内的高性能的内核服务 例如 它的数据匹配引擎 可以同时快速匹配出 几乎任何代理发送过来的任何格式的数据 它的事件生成引擎按事件生成规则 快速生成事件 它的数据保存服务按照保存策略快速地将监控指标的实时数据 保存到关系数据库 后台服务是由一组可以独立安装在不同机器上的程序组成 包括告警服务 策略执行 协议执行 级联服务 业务监控接口 动环监控接口等 监控服务 器加后台服务的设计 即保持了监控服务器的微内核又拥有了各种后台服务安 装部署的灵活性 共济 IT 一体化集中监控系统监控协议即支持由标准协议支持的监控对象 也包括非标准的监控对象 标准协议包括 SNMP IPMI WMI SYSLOG 等 非 标准监控对象通过由各类脚本 例如 perl 写成的监理代理来完成 这些脚本 化的监控代理 我们简称 脚本代理 即安全又高效 即可以本地部署 也可 以远程部署 一切按需求灵活设置 2 2 系统部署架构系统部署架构 根据不同的监控需求 现提出两种系统架构 单个中心机房单个中心机房 ITIT 监控 监控 IT 一体化集中监控系统部署之后 分为客户层 服务层 业务层和采集层 通过四个层的实施 来实现综合监控和科学管理 系统部署的一个例子如下图 所示 精品文档 10欢迎下载 经过部署后 四个层需要实施的内容有 1 客户层 客户层包含报警服务器 报警网关 管理客户端和 Web 客户 端 报警服务器部署报警网关 负责对外的电话 短信和邮件报警 需要单独 部署一台服务器 管理客户端安装 C S 客户端软件 主要负责监控应用服务器 的配置和使用 需要单独为管理员配置一台服务器 Web 客户端可以通过 Web 查看 只要网络连通 任何工作机都可以根据权限进行查看 2 服务层 服务层包含综合监控应用服务器和综合监控数据库服务器 综 合监控服务器需要高性能服务器主机和 Liunx 操作系统 可保证更高的稳定性 和性能 负责部署综合监控平台 工单管理子系统 报表子系统 系统管理服 务 联动服务 Web 服务 数据配置 存储和事件日志查询服务 综合监控数 据库服务器需要高性能服务器主机和数据库服务 用于存储监控的历史数据和 事件 配置信息等数据 3 业务层 业务层包含监控的各种业务系统 包括税收征管业务系统 网 上报税业务系统和货运发票业务系统等 这些业务系统的运行状态是监控的核 心 其它方面的监控都是辅助于业务系统监控 业务层监控的功能是综合监控 系统与各个业务系统通讯 获取业务系统状态 精品文档 11欢迎下载 4 采集层 采集层包含各种硬件 系统和动力与环境 通过对本层的监控 可以更加准备的分析出业务出现故障的原因和实现预警功能 本层采用分布式 设计 能够灵活增减监控设备 而无需在软件上修改代码 只需要配置即可 多机房联网型的多机房联网型的 ITIT 监控 监控 对于联网型的监控 可利用 IT 一体化集中监控系统的级联功能 实现各前 端机房内设备的集中监控管理 部署同样分为四层 客户层 中心服务层 本 地服务层和现场采集层 部署图如下 1 客户层 客户层包含报警服务器 报警网关 管理客户端和 Web 客户 端 报警服务器部署报警网关 负责对外的电话 短信和邮件报警 需要单独 部署一台服务器 管理客户端安装 C S 客户端软件 主要负责监控应用服务器 的配置和使用 需要单独为管理员配置一台服务器 Web 客户端可以通过 Web 查看 只要网络连通 任何工作机都可以根据权限进行查看 2 中心服务层 中心服务层包含中心应用服务器和数据库服务器 中心应 用服务器需要高性能服务器主机和 Liunx 操作系统 可保证更高的稳定性和性 精品文档 12欢迎下载 能 负责部署针对所有前端站点机房的综合监控平台 工单管理子系统 报表 子系统 系统管理服务 联动服务 Web 服务 数据配置 存储和事件日志查 询服务 综合监控数据库服务器需要高性能服务器主机和数据库服务 用于存 储所有前端站点机房监控的历史数据和事件 配置信息等数据 3 本地服务层 本地服务层包含一台前端应用服务器 前端应用服务器负 责部署本机房内设备 操作系统 业务系统以及动环系统的综合监控 并把监 控信息即时传递给中心服务层 本层采用分布式结构 增减所监控前端机房数 量时 只需增加或减少相应数量的前端应用服务器 4 现场采集层 现场采集层包含各种硬件 系统和动力与环境 通过对本 层的监控 可以更加准备的分析出业务出现故障的原因和实现预警功能 本层 采用分布式设计 能够灵活增减监控设备 而无需在软件上修改代码 只需要 配置即可 2 3 软件架构软件架构 一体化集中监控系统分为四个层次结构 系统四层结构如下图所示 精品文档 13欢迎下载 软件架构中每个层次的作用是 软件架构中每个层次的作用是 1 显示层显示层 本层主要是提供给用户图形交互界面 将大量的复杂的监控数 据通过图形化的方式分层次和优先级地展现给管理员 使一体化集中监 控系统的监控更加简单和易用 显示层主要实现了客户端功能 具有 C S 和 B S 双重架构 包括管理客户端和 Web 客户端 管理客户端具有 系统管理功能 Web 客户端通过友好的页面展示监控内容 显示故障报 警 用户可以通过 Web 浏览获知整个系统的运行状态 2 应用层应用层 本层是核心服务程序 负责维护采集层的数据 提供显示层浏 览服务和报警功能 应用层包含业务管理模块和报警网关模块 业务管 理模块负责从采集层获取监控数据 经过处理 将报警数据进行显示和 发送给报警网关模块 并对数据进行记录 以便报表分析处理 报警网 关模块接收到报警后 通过电话 短信或 Email 发送给管理员 应用层 各个服务都是监察的核心模块 系统设计了软件看门狗服务 自动监测 各个服务的运行状态 当运行状态下一体化集中监控相关服务出现异常 将由软件看门狗服务自动重启异常服务 恢复监察业务 3 采集层采集层 本层负责采集监控数据 采集层根据前端不同的监控对象采用 不同的采集方式 针对动力与环境监控 采集方式多采用串口方式 针 对业务监控 服务器 网络 存储和通讯的监控 多采用网络方式 4 设备层设备层 包括被监控的设备和系统 也包括各类专门的监控工具 2 4 系统流程系统流程 2 4 1 主要流程 一体化集中监控系统提供完整的 一体化的监控流程 主要的流程包括事 件 告警 工单 一体化集中监控展示 实时分析 统计报表和系统配置 配 套的流程包括 值班管理 知识管理和资产管理 如下图所示 精品文档 14欢迎下载 我们以工单流程为例来加以说明 工单的主线流程包括 监控代理 集中 监控 事件 工单 知识库 工单的内部流程包括创建 派发 处理 延时 记录 关闭等环节 工单处理的关联活动包括值班管理 知识管理和资产管理 2 4 2 数据流程 一体化集中监控系统是针对各种对象管理监控数据 从数据的采集到监控 的展示 通过各种服务完成数据处理 实现数据中心整体的集中监控管理 下 图为一体化集中监控系统的数据流程图 精品文档 15欢迎下载 外部实体 在一体化集中监控系统的数据流程中 涉及的外部实体对象包括监察对象 和用户 本系统主要将不同监察对象的监察数据处理分析后发送展现给用户 处理 在一体化集中监控系统的数据流程中 涉及的处理主要有以下内容 1 数据采集 针对不同的监察对象 采用相应的监控接口和方法 获取到 监控数据 2 数据匹配 接收监控数据 通过数据匹配引擎将关键数据进行提取 形 成监控指标 发送给监控服务 3 监控服务 是数据的交互中心 接收和管理所有监控指标 向告警服务 精品文档 16欢迎下载 Web 服务和数据存储服务发送需要的监控指标 4 指标报警服务 负责接收监控指标的实时数值 通过报警引擎判断监控 指标是否正常 当判断报警时 将报警事件送到 Web 服务和告警管理服 务 5 数据存储 负责将需要保存的监控指标数据按照保存策略保存到数据库 中 供数据报表服务查询 6 数据报表服务 负责提取历史数据 并通过定义的不同样式的模板进行 展示 供分析趋势 历史汇总和辅助决策使用 7 告警管理服务 负责接收的报警事件 通过告警管理引擎 具有告警分 组 告警过滤 排班告警和告警升级 以短信 电话或邮件的方式发送 给用户 8 Web 服务 负责将监控数据 报警事件和数据报表进行集中处理 并且 以图形化方式展示给用户 通过以上数据处理流程 完成了一体化集中监控系统主流程 精品文档 17欢迎下载 第第 3 章章 主要功能及监控范围主要功能及监控范围 3 1 主要功能主要功能 IT 一体化集中监控系统由以下功能模块构成 1 1 实时监控实时监控 实时监控包括监控页面 设备监控 监控仪表板和 IP 冲突监控等实时监控 类别 将监控对象用不同的展示方式进行实时监控 监控页面监控页面是将业务监控 数据中心设施监控和动环监控的指标和内容通过 图形化方式展示 便于用户查看管理 监控页面可实现总分结构展示 可查看 系统的整体状态 也可查看模块和设备的详细监控信息 所有的监控页面都可 根据用户的风格和特点灵活定制 设备监控设备监控显示所有被监控的设备 包括设备的状态 具体监控指标 产生 的事件 生成的工单以及相关的资产信息 监控仪表板监控仪表板以一个 9 宫格的形式即时展示需要显示的测点 支持多种控件 的显示方式 包括表格 饼图 柱状图 横 柱状图 竖 曲线 点图 IPIP 冲突监控冲突监控包括实时 IP 冲突监控 实时网络设备扫描 设备 IP 验证 设 备资产关联以及 IP 变更记录查询等内容 2 2 事件告警事件告警 监控系统发现的故障报警将通过事件告警子系统进行展示 通过本子系统 可以获取最新的故障报警 也可查询历史的故障报警 并且可将故障实时地以 短信 电话或邮件发送给值班人员 3 3 工单管理工单管理 当获知故障发生后 系统会自动生成工单 值班人员可根据工单内容分派 给专业人员进行解决 在处理过程中 有知识库支撑解决问题 4 4 知识库知识库 知识库的作用是将处理故障的经验进行整理总结 归纳录入知识库 支持 以后遇到相关问题的处理 5 5 值班管理值班管理 精品文档 18欢迎下载 值班管理子系统协助值班人员管理机房 包括来访登记 交接班登记 班 次管理和计划作业 6 6 统计报表统计报表 报表展示可统计分析历史数据 供决策分析使用 包括性能报表 事件报 表 工单报表 服务器统计报表和日志报表 7 7 系统管理系统管理 系统管理包括 WEB 客户和管理客户端的系统管理 WEB 客户端系统管理是 进行一体化集中监控系统软件的配置工作 包括权限分配 备份还原 服务管 理等 管理客户端的系统管理是管理员管理监控对象 设置指标各种规则 查 看数据 事件 代理消息的强大工具 3 2 监控范围监控范围 本系统可监控的 IT 设备类别如下表所示 设备型号设备型号 数量数量 单位单位 服务器服务器 Windows 服务器个 Linux 服务器逻辑分区 Unix 服务器逻辑分区 HPUX 服务器逻辑分区 Solaries 服务器逻辑分区 AIX 服务器逻辑分区 网络 安全 存储设备监控网络 安全 存储设备监控 交换机个 路由器个 防火墙个 安全网闸个 IPS 个 IDS 个 精品文档 19欢迎下载 存储设备个 负载均衡设备个 数据库监控数据库监控 Oracle 个 SQL Server 个 Informix 个 MySQL 个 Sybase 个 DB2 个 Domino 个 中间件监控中间件监控 WebSphere 个 CICS 个 MQ 个 Tuxedo 个 SNA 个 TONGLINK 个 WebLogic 个 MS EXCHANGE 个 Lotus Domino 个 Apache WEB 个 IIS WEB 个 应用软件监控应用软件监控 应用软件 1套 套 应用软件 n套 精品文档 20欢迎下载 第第 4 章章 实时监控实时监控 4 1 服务器服务器 4 1 1 监控指标 服务器监控主要监控服务器的操作系统 硬件监控与设备型号和厂家提 供的应用接口有关 各种业务系统都依赖于操作系统的稳定运行 监控系统 对不同的操作系统实现性能监测和故障报警 一体化集中监控系统监控的操作系统有 Windows 操作系统 Linux 操作系 统 Solaries 服务器 Unix 服务器 AIX 操作系统等所有类别的操作系统 服务器监控指标示例如下所示 设备名称设备名称 UNIXUNIX 服务器服务器 类别类别名称名称 系统时间 运行时间 操作系统名称 核心版本 操作系统版本 机器名称 主机类型 主机处理器类型 系统 IP 地址 文件系统设备 挂载点 已用空间百分比 剩余空间 MB 总容量 MB 文件系统 dev sda1 已用空间 MB 文件系统设备 装配点 已用空间百分比 剩余空间 MB 总容量 MB 文件系统 dev sdb 已用空间 MB 交换空间总交换空间 MB 精品文档 21欢迎下载 已用交换空间 MB 空闲交换空间 MB 已用百分比 空闲百分比 系统负荷 用户 CPU 占用率 系统 CPU 占用率 I O 等待 CPU 占用率 CPU 空闲率 CPU 负荷 CPU 使用率 总物理内存 MB 已用物理内存 MB 空闲物理内存 MB 内存使用率 换入 MB 内存负荷 换出 MB 磁盘使用率 磁盘等待队列 平均服务时间 ms 平均等待时间 ms I O 负荷 接收错误数 冲突数 冲突率 接收错误数 发送错误数 接收数据包数 网络负荷 eth1 发送数据包数 关键进程 1 状态 关键进程 1 内存 关键进程 1CPU 关键进程 n 状态 关键进程 n 内存 关键进程状态 关键进程 nCPU 精品文档 22欢迎下载 4 1 2 界面展示 4 2 网络安全设备网络安全设备 4 2 1 监控指标 一体化集中监控系统支持各种网络安全设备的监控 包括交换机 路由 器 防火墙 IPS IDS 安全网闸等 网络设备监控指标示例如下所示 设备名称设备名称 交换机交换机 类别类别名称名称 名称 运行时间设备 温度 5 秒 cpu 平均负载 1 分钟 cpu 平均负载 CPU 5 分钟 cpu 平均负载 精品文档 23欢迎下载 总内存大小 MB 已用内存 MB 内存 空闲内存 MB 端口名称 端口状态 传入流量 MB 传出流量 MB 传入丢包率 传出丢包率 传入错误率 传出错误率 MAC 地址 端口 1 IP 地址 端口名称 端口状态 传入流量 MB 传出流量 MB 传入丢包率 传出丢包率 传入错误率 传出错误率 MAC 地址 端口 n IP 地址 设备名称设备名称 防火墙防火墙 类别类别名称名称 设备名称 当前时间设备 运行时间 用户占用率 系统占用率 CPU 空闲率 1 分钟平均负载 5 分钟平均负载平均负载 15 分钟平均负载 空闲内存 KB memBuffer KB memCached KB 内存 总内存 KB dummy0 eth0 端口状态 eth1 精品文档 24欢迎下载 eth2 eth3 eth4 eth5 eth6 eth7 ipsec0 br1 dummy0 eth0 eth1 eth2 eth3 eth4 eth5 eth6 eth7 ipsec0 端口流进量 br1 dummy0 eth0 eth1 eth2 eth3 eth4 eth5 eth6 eth7 ipsec0 端口流出量 br1 精品文档 25欢迎下载 4 2 2 界面展示 4 3 存储设备存储设备 4 3 1 监控指标 一体化集中监控系统支持各种存储和负载均衡设备的监控包括 EMC 存储 磁盘阵列 光纤交换机 磁带机 磁带库 负载均衡设备等 硬件监控与设备型号和厂家提供的应用接口有关 具体监控指标如下所示 设备名称设备名称 IBMIBM 磁盘阵列存储设备磁盘阵列存储设备 类别类别名称名称 ECC 控制台状态 通道卡状态 控制器状态 盘包状态 Cache 状态 电源状态 电池状态 风扇状态 精品文档 26欢迎下载 设备名称设备名称 光纤交换机光纤交换机 类别类别名称名称 电源模块状态 通道板状态 端口状态 链路状态 温度温度值 设备名称设备名称 IBMIBM 磁带库磁带库 类别类别名称名称 电源模块状态 风扇状态 机械臂状态 磁带机状态 磁带状态 4 3 2 界面展示 精品文档 27欢迎下载 4 4 数据库数据库 4 4 1 监控指标 一体化集中监控系统支持 Oracle Sql server MySql Informix domino Sybase DB2 等多种数据库的监控 数据库的运行状态 数据库 服务主要进程的状态 CPU 使用率和内存大小 数据库表空间利用率 日志空 间利用率及指定 SQL 语句的执行情况等性能指标是反映一个数据库整体运行 是否健康的重要指标 具体监控指标如下所示 数据监控指标示例如下所示 设备名称设备名称 Oracle Oracle 数据库数据库 类别类别名称名称 状态 开始运行时间 可用性百分比 实例名 实例状态 版本 监听程序名称 监听程序状态 系统信息 主机 表空间名 已用表空间百分比 表空间总量 MB 已用表空间 MB 表空间 SYSAUX 空闲表空间 MB 表空间名 已用表空间百分比 表空间总量 MB 已用表空间 MB 表空间 SYSTEM 空闲表空间 MB 表空间名 已用表空间百分比 表空间总量 MB 已用表空间 MB 表空间 TEMP 空闲表空间 MB 表空间名 已用表空间百分比 表空间 USERS 表空间总量 MB 精品文档 28欢迎下载 已用表空间 MB 空闲表空间 MB 归档区目标 已用归档区百分比 归档区总量 KB 已用归档区 KB 归档区 空闲归档区 KB 归档程序暂停 数据块损坏 介质故障 警示日志错误状态 会话中止 当前登录计数 当前打开的游标计数 进程限制使用率 会话限制使用率 数据库限制 用户限制使用率 缓冲区高速缓存空闲百分比 重做日志缓冲区空闲百分比 Java 池空闲百分比 大型池空闲百分比 流池空闲百分比 共享池空闲百分比 游标高速缓存命中率 数据字典命中率 库高速缓存命中率 重做日志分配命中率 缓冲区高速缓存命中率 缓冲区高速缓存已用大小 MB 缓冲区高速缓存总大小 MB 共享池总大小 MB 共享池已用大小 MB 重做日志缓存区总大小 MB 重做日志缓存区已用大小 MB 系统全局区 SGA PGA 高速缓存命中率 事物处理数 s 累积登录数 s 吞吐量 用户登录时间 ms 设备名称设备名称 Sybase Sybase 类别类别名称名称 状态 版本系统信息 主机 精品文档 29欢迎下载 服务名 开始运行时间 CPU 使用率 数据库名 数据库大小 数据库使用率 事务日志大小 事务日志使用率 临时数据大小 数据库 临时数据使用率 命中率 读硬盘页数 每秒读硬盘页数 写页数 每秒写页数 读页数 高速缓存 每秒读页数 Master 读次数 每秒读次数 写次数 每秒写次数 等待数 每秒等待数 Grants 硬盘 Grants sec CPU 使用时间 逻辑读页数 每秒逻辑读页数 物理读页数 每秒物理读页数 存储页面数 每秒存储页面数 服务器忙 当前使用 CPU 个数 引擎 配置 CPU 个数 请求锁 等待后授予锁锁量 每秒等待后授予锁锁量 即可授予锁锁量 每秒即可授予锁锁量 锁数量 锁 每秒锁数量 精品文档 30欢迎下载 未被授予锁数量 每秒没授予未被授予锁数量 平均等待时间 死锁数 高速缓存大小 数据缓存大小 数据缓存命中率 存储过程缓存大小 内存管理 存储过程缓存命中率 平均读包大小 平均发送包大小 网络读字节数 每秒网络读字节数 网络发送字节数 每秒网络发送字节数 网络读包数 每秒网络读包数 网络发送包数 网络 每秒网络发送包数 高速缓存命中率 进程占用 CPU 时间 每秒锁数量 进程 写页数 ASE CPU 占用时间 死锁数 每秒锁数量 ASE 服务 交易数 平均执行时间 取样周期 平均执行时间 会话 执行存储过程数 取样周期 存储过程 执行存储过程数 会话 插入数 每秒插入数 删除行数 每秒删除行数 交易数 每秒交易数 更新数 每秒更新数 空间更新数 交易 每秒空间更新数 当前使用数据库 元数据 当前使用对象 精品文档 31欢迎下载 当前使用索引 I O 繁忙 I O 设备数 服务名 备份服务 状态 ASE 错误日志 级别 19 级别 20 级别 21 级别 22 级别 23 级别 24 级别 25 错误日志 级别 26 4 4 2 界面展示 精品文档 32欢迎下载 4 5 中间件中间件 4 5 1 监控指标 中间件是支持业务软件运行的一个基础因素 提供多种应用功能 一体 化集中监控系统需要对不同的中间件实现性能监测和故障报警 一体化集中 监控系统支持 WebSphere CICS MQ Tuxedo SNA TONGLINK WEBLOGIC MS EXCHANGE Lotus Domino Apache WEB IIS WEB 等多种中间件的监控 中间件监控指标示例如下所示 设备名称设备名称 WEBLOGICWEBLOGIC 类别类别名称名称 状态 开始运行时间 健康状态 CPU 使用率 堆使用 MB Java 厂商 系统信息 Java 版本 精品文档 33欢迎下载 主机 每分钟请求数 任务管理器 挂起请求数 活动会话数 请求处理时间 ms Servlet 和 JSPs 每分钟请求数 JMS 服务器个数 挂起消息数 JMS 当前消息数 正在使用 Bean 数 每分钟 Bean 访问数 Bean 访问成功率 每分钟 Bean 事务提交数 每分钟 Bean 事务回滚数 每分钟 Bean 事务超时数 EJBs Bean 事务提交率 打开的 JDBC 连接数 JDBC 每分钟创建连接数 活动事物数 每分钟事务提交数 JDBC 和 JTA 使用 每分钟事务回滚数 4 5 2 界面展示 精品文档 34欢迎下载 4 6 应用软件应用软件 4 6 1 监控指标 应用软件是用户工作的核心 其运行的稳定性需要时时保障 应用软件运 行监控子系统需要对各个应用软件的应用软件及其支撑设施进行监控 应用软件一体化集中监控 针对应用软件结构和特点 实现对关键模块 关键接口和关键事件的一体化集中监控 根据用户需求和应用软件结构 结合监控软件的页面设计 应用软件一体 化集中监控子系统界面可定制实现 精品文档 35欢迎下载 第第 5 章章 实时监控实时监控 设备监控设备监控 5 1 设备监控列表设备监控列表 设备监控列表显示所有被监控的设备 包括 IT 系统 网络设备或者动环设 备等 设备监控列表界面 状态 是指这个设备运行的健康状态 是否出现报警等 绿色表示正 常 红色表示报警 橙色表示预警 灰色表示通讯中断 指标 是指这个设备所有的具体的测点 监控指标列表 事件 是指这台设备产生的所有报警或者其他事件 工单 是指这台设备产生的所有工单 资产 是指这台设备的一些资产信息 比如生产厂商 供应商 保修 期 采购人等 说明 对设备的一些说明性信息 设备事件列表界面 精品文档 36欢迎下载 设备工单列表界面 设备资产信息表界面 精品文档 37欢迎下载 5 2 监控指标列表监控指标列表 点击或者双击设备名称进入监控指标列表页面 具体的可以看到每个 测点的 类别 名称 状态 当前值 图表事件 保存规则 告警规则 说明 等信息 设备指标列表界面 5 3 列表导出列表导出 点击设备监控列表的导出图标 将所有监控设备的信息列表或者具 体设备的监控指标列表导出为 excel 表格 精品文档 38欢迎下载 第第 6 章章 实时监控实时监控 监控仪表板监控仪表板 监控仪表板以一个 9 宫格的形式展示需要显示的测点 只需在资源树里找 到需要的测点 直接拖进九宫格中的一格即可 通过它 可以看到所关心的测 点的数据实时变化规律 监控仪表板界面 它支持多种控件的显示方式 包括表格 饼图 柱状图 横 柱状图 竖 曲线 点图 以你想要的方式来展现数据 可以跨设备的将各个设备的相同测点放到一个格子里来进行对比 比如将 Linux 服务器 AIX 服务器以及 Solaris 服务器的已用交换空间这三个测点进 行实时数据变化的对比 这样就可以一眼看出它们性能差别在哪了 精品文档 39欢迎下载 第第 7 章章 实时监控实时监控 IPIP 冲突监控冲突监控 7 1 实时实时 IPIP 冲突管理冲突管理 实时 IP 冲突管理可以对设置的子网段内的 IP 设备进行实时扫描 发现设 备 主要功能包括 实时 IP 扫描 设备 IP 验证 设备资产关联以及 IP 变更记 录查询 设备名称 IP 设备的名称 通过系统自动扫面出来也可手动在 资产 信息 栏编辑 Mac 地址 设备所对应的 Mac 地址 实时 IP 地址 设备的实时 IP 指系统当前扫描到的 IP 已验证的 IP 地址 已经过验证的设备的 IP 验证 对设备的 IP 进行验证 验证完就成为已验证 IP 的设备 资产关联 对设备进行资产关联操作 资产信息 查看设备的资产信息 IP 变更历史 查看设备的 IP 变更历史 精品文档 40欢迎下载 7 2 IPIP 历史变更记录历史变更记录 对网络中所有 IP 设备的创建时间进行查询 所谓创建时间是指该设备第一 次被系统扫描到的时间 也就是该设备被纳入管理的那一时间点 查询页面如 图所示 可以通过 Mac 地址 IP 地址或者查询时间段进行查询 7 3 IPIP 验证管理验证管理 对网络中所有已验证的设备进行查询 页面如图所示 精品文档 41欢迎下载 第第 8 章章 事件告警事件告警 事件和告警管理子系统包括 实时事件查看 实时告警查看 事件管理 告警管理 8 1 实时事件和告警查看实时事件和告警查看 值班人员和管理人员需要了解整体系统的事件和告警信息时 可以登录系 统 通过实时事件和告警查看实现下列功能 1 实时事件查看 2 实时告警查看 实时事件查看界面 8 2 告警管理告警管理 值班人员和管理人员需要第一时间获知系统的故障告警 一体化集中监控 系统提供了告警管理功能 实现故障告警的主动发送 主要功能有 1 告警发送策略 2 告警分组策略 3 告警过滤策略 4 排班告警策略 5 定时报平安 界面如下图所示 精品文档 42欢迎下载 8 3 事件管理事件管理 值班人员和管理人员需要了解整体系统的历史事件信息时 可以登录系统 通过事件管理实现下列功能 1 通过条件筛选查询事件 筛选条件包括时间 级别 类型 确认方式 确认人等 2 生成历史事件列表并导出 界面如下图所示 精品文档 43欢迎下载 第第 9 章章 工单管理工单管理 值班人员和管理人员获知系统的故障告警后 需要对事件处理的全过程进 行指导 跟踪的记录 系统提供了工单管理功能 实现事件全过程处理 工单 管理流程如下图所示 9 1 产生工单产生工单 工单是由事件驱动产生 可通过自动方式和手动方式两种生成 1 自动方式 当监控系统监测到报警事件时 如符合产生工单的条件 那么系统会自 动产生故障工单 2 手动方式 精品文档 44欢迎下载 当机房值班人员需要手动添加工单时 可通过系统的手动添加工单功能 项 进行添加自定义工单 工单内容包括工单名称 产生时间 地点 设备名称 工单内容 工单 状态 紧急程度 处理时限等 手工录入工单界面 9 2 派发工单派发工单 分派工单是针对新产生的工单 选择处理人 进行分派工作 由相应的值班人员针对新产生的工单进行查看分析 分派给对应的处理 人员 分派工单可由值班人员负责管理 将工单派发给相关故障处理人员 精品文档 45欢迎下载 9 3 处理工单处理工单 处理人员接收到工单后 进行处理故障 在处理过程中 可以查询系统 的知识库或选择对应预案 获取帮忙信息 协助完成任务处理 处理的进度状态需要反馈到工单中 方便领导查询跟踪统计 当工单处理完毕后 即可提交闭工单申请 处理工单的报告需要由故障处理人或维护人员填写 进行上报 处理工单界面 工单基本信息界面 精品文档 46欢迎下载 工单流水信息界面 工单辅助信息界面 可以通过知识库和预案库支撑解决问题 精品文档 47欢迎下载 工单延时申请界面 工单处理记录录入界面 关闭工单界面 精品文档 48欢迎下载 9 4 工单汇总工单汇总 根据单号 问题简述 报告时间 故障类别以及故障级别进行工单的查 询和查看 工单汇总查看界面 9 5 工单地址管理工单地址管理 工单地址管理主要是对工单的一些地址进行新增 删除 修改以及查询 工单地址列表界面 新增地址界面 精品文档 49欢迎下载 9 6 工单故障类型管理工单故障类型管理 根据实际情况新增 删除或修改故障类型 工单故障类型界面 精品文档 50欢迎下载 第第 10 章章 知识库知识库 10 1 工单归档工单归档 知识库的作用是将处理故障的经验进行整理总结 归纳录入知识库 支 持以后遇到相关问题的处理 工单归档界面 10 2 历史故障经验库历史故障经验库 根据预案文案和实际执行的情况进行对比 完善调优预案库 将故障处 理经验保存下来 更好的支持以后的工作 审核归档界面 归档经验库界面 精品文档 51欢迎下载 10 3 预案库管理预案库管理 系统针对可能发生的紧急性故障建立预案库 便于面对突发事件做到快 速响应 最大程度上减小紧急情况所带来的危害 在工单处理过程中可以选择预案或按照应急预案的匹配技术系统自动调 用预案 以让处理人员参考处理流程 在关闭工单时 还需要根据执行结果 对现有的预案库调优完善 使方 案更适合于紧急故障的处理 工单管理分系统中预案的内容是可后期完善 预案库管理界面 精品文档 52欢迎下载 预案库维护界面 精品文档 53欢迎下载 第第 11 章章 值班管理值班管理 11 1 机房进出登记机房进出登记 值班人员需要对所管理机房进出情况进行电子化管理 使机房管理的工作 更加规范 一体化集中监控系统提供了机房进出登记功能 记录和查询机房进 出情况 主要功能有 1 进入机房登记 对进入机房的人员进行登记 包括来访单位 来访人员 联系电话 进入 时间 预计离开时间 责任人 来访事由 2 离开机房登记 对来访人员的离开进行 便于以后查询 3 机房进出查询 对历史的进出机房记录进行查询 进入机房登记界面 离开机房登记界面 精品文档 54欢迎下载 机房进出查询界面 11 2 交接班登记交接班登记 值班人员需要对交接班情况进行电子化管理 使机房管理的工作更加规范 一体化集中监控系统提供了值班的交接班登记功能 记录和查询交接班情况 主要功能有 1 交班登记 对交班情况进行登记 便于接班人员了解上一班次的情况 2 接班登记 对接班工作进行登记 整理本班次的工作内容 3 交接班查询 对历史的交接班记录进行查询 交班登记界面 精品文档 55欢迎下载 接班登记界面 交接班查询界面 精品文档 56欢迎下载 11 3 班次管理班次管理 值班人员需要进行值班班次管理 定时提醒值班人员按时值班 保证运行 的稳定 一体化集中监控系统提供了班次管理功能 记录和提醒排班 主要功 能有 1 排班管理 排班管理是按每周进行排班 将值班人员进行选择设定 排班管理功能有 排班查询 排班信息列表 新增排班信息等功能 2 当日班次信息 将当日的班次信息进行显示 包括时间 值班人员和维护人员 3 班次提醒设置 可设置短信提醒的时间和内容 排班管理界面 新增排班信息界面 精品文档 57欢迎下载 当日班次信息界面 班次提醒设置界面 精品文档 58欢迎下载 11 4 计划作业计划作业 值班人员需要预先定义作业 定时提醒 使机房管理的工作更加规范 一 体化集中监控系统提供了计划作业功能 记录和提醒作业内容 主要功能有 1 新增计划 可新定义计划作业 包括计划名称 负责人 计划内容 计划周期 启动 时间 通知方式和计划状态 2 计划作业查询 可按计划名称 责任人 计划周期和启动时间查询所有的计划作业 3 计划作业列表 可查看所有的计划作业 并进行修改 新增计划界面 精品文档 59欢迎下载 计划查询及作业列表界面 精品文档 60欢迎下载 第第 12 章章 统计报表统计报表 值班人员 管理人员和领导需要对系统的运行信息进行统计分析 提供决 策支持 制定计划 系统提供了报表管理功能 实现统计分析 主要功能有 1 性能统计报表 2 事件统计报表 3 工单统计报表 4 服务器资源统计报表 12 1 性能统计报表性能统计报表 性能统计报表主要是统计不同监察指标的运行趋势 以便进行决策 性能统计报表的操作流程 1 设置查询条件 通过查询界面 选择需要统计的监察指标 统计时间 报表模板 2 生成统计报表 点击查询按钮 生成性能统计报表 性能统计报表界面 12 2 事件统计报表事件统计报表 事件统计报表主要是统计一段时间内的事件信息 可做事后分析 精品文档 61欢迎下载 事件统计报表的操作流程 1 设置查询条件 通过查询界面 选择需要统计的监察指标 统计时间 报警级别限制 事 件类型 是否确认 确认人员 确认时间和确认内容 2 生成统计报表 点击查询按钮 生成事件统计报表 事件统计报表界面 12 3 工单统计报表工单统计报表 工单统计报表主要是统计一段时间内的工单数据 可做事后分析 工单统计报表的操作流程 1 设置查询条件 通过查询界面 选择查询方式和需要统计的时间 2 生成统计报表 点击查询按钮 生成工单统计报表 工单统计报表界面 精品文档 62欢迎下载 12 4 服务器资源统计报表服务器资源统计报表 资源统计报表主要是统计一段时间内的服务器资源的使用情况 可做事后 分析决策 资源统计报表的操作流程 1 设置查询条件 通过查询界面 选择需要统计的服务器和时间 2 生成统计报表 点击查询按钮 生成服务器资源统计报表 资源统计报表界面 精品文档 63欢迎下载 第第 13 章章 系统管理系统管理 13 1 WEBWEB 端的系统管理端的系统管理 管理人员需要对一体化集中监控系统进行参数配置 使系统更加适合实际 情况 系统提供了参数配置功能 实现系统配置 主要功能有 1 资源管理 资源管理包括 视图管理 模板管理 数据管理以及页面管理 对资源进 行管理 定义各个用户的监察范围 可查看哪些监察页面 管理哪些监察 设备等 2 用户管理 用户管理包括 用户管理 角色管理和用户角色功能模块 实现对每个用 户权限的精确控制 3 日志 日志功能主要满足管理员对操作日志和系统日志的查询 导出 4 系统维护 系统维护包括 服务管理和网络参数 主要用来对服务子系统进行配置和 启停控制 5 设置 设置功能主要包括 个性化设置 页面轮询 告警设置以及工单生成策略 6 备份 恢复 具有工程和数据库备份 恢复功能 7 其他 具有资产管理和基础类型管理功能 系统管理界面 精品文档 64欢迎下载 13 2 监控应用服务器的系统管理监控应用服务器的系统管理 监控应用服务器的系统管理通过监控管理客户端来实现 该管理客户端具 备丰富 灵活和强大的功能 其功能如下表所示 其典型界面如下图所示 主功能主功能子功能子功能二级子功能二级子功能三级子功能三级子功能四级子功能四级子功能 系统管理 设备巡查 小型机 Windows XP Windows Server2003 SCO UNIX Solaris Suse Linux UNIXWARE 本机监控 Suse IT 监控 本机监控 Redhat UPS 空调 电量仪 电池监控仪 管理客户 端 设备管理 设备子系统 温湿度 精品文档 65欢迎下载 监控模块 漏水检测 设备级联 添加系统提供设备 添加自定义设备 添加设备 CM Desk 集成 删除设备 复制黏贴设备 监控设备属性配置通讯超时时间和报 警级别

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论