咨元运维技术方案_第1页
咨元运维技术方案_第2页
咨元运维技术方案_第3页
咨元运维技术方案_第4页
咨元运维技术方案_第5页
已阅读5页,还剩144页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

运维技术方案

广州咨元信息科技有限公司

2015年6月

文档说明

本文档所涉及到的文字、图表等,仅限于广州咨元信息科技有限公司(以下

简称“广州咨元”)和被呈送方内部使用,未经双方书面许可,请勿扩散到第三方。

文档属性

属性rtW

客户名称

项目名称

文档主题运维技术方案

文档编号

文档版本1.0

版本日期2015-06

文档状态

作者:

文档变更

版本修订日期修订人描述

1.02015-06广州咨元提交稿

文档送呈

单位姓名目的

IT管控系统技术方案

目录

1概述错误!未定义书签。

2IT运维管理项目分析与设计7

2.1运维管理的必要性7

2.2n■运维管理目标8

2.2.1提升遵从于业务目标的1T服务质量8

2.2.2提升fT资源管理能力9

2.2.3IT投资效益最大化9

2.2.4可持续改进的服务管理体系10

2.3系统设计原则10

2.4系统建设内容错误!未定义书签。

2.4.1统一CMDB错误!未定义书签。

2.4.2IT集中监控管理系统错误!未定义书签。

3项目需求功能列表点对点应答错误!未定义书签。

4IT集中监控管理系统14

4.1逻辑架构设计14

4.2物理架构设计15

4.3采集层17

4.3.1操作系统监控模块17

4.3.2主机硬件监控模块20

4.3.3虚拟化监控模块21

4.3.4数据库监控模块24

4.3.5中间件及应用监控模块26

4.3.6存储设备监控模块41

4.3.7网络监控模块43

4.3.8业务场景监控错误!未定义书签。

4.4处理层47

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第3页共149页

IT管控系统技术方案

4.4.1集中和分布式的事件处理架构47

4.4.2统一的集中事件管理界面47

4.4.3多级告警事件级别48

4.4.4告警事件信息自定义48

4.4.5开箱即用的集中事件处理规则48

4.4.6事件告警通知方式49

4.4.7事件定时器50

4.4.8事件规则处理语言50

4.4.9分级权限管理50

4.4.10自定义事件拓扑视图50

4.4.11动态基线51

4.4.12与第三方软件双向集成方式52

4.5门户和报表平台错误!未定义书签。

4.5.1监控展示门户错误!未定义书签。

4.5.2报表54

4.6CMDB平台建设61

4.6.1CMDB介绍69

4.6.2CMDB实施70

4.6.3自动发现工具ADDM72

4.7突出特点75

4.7.1采用单一代理实现采集75

4.7.2主动式动态基线和动态阈值80

4.7.3自我监控功能83

4.7.4灵活的开发工具84

4.7.5平滑升级与扩展87

4.7.6同时提供基于代理和无代理的采集方式87

5系统内外集成接口89

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第4页共149页

IT管控系统技术方案

5.1接口建设原则61

5.2丰富的集成方式62

5.2.1集成外围系统的信息62

5.2.2外围系统集成监控平台信息:63

5.3监控管理与流程系统接口设计错误!未定义书签。

5.4监控管理与流程系统的集成场景65

5.4.1短信接口67

5.4.2邮件接口67

6产品配置建议错误!未定义书签。

7项目实施方案125

7.1实施方法错误!未定义书签。

7.1.1实施框架错误!未定义书签。

7.1.2实施流程错误!未定义书签。

7.2项目实施阶段划分错误!未定义书签。

7.2.1实施内容错误!未定义书签。

7.2.2计划与准备错误!未定义书签。

7.2.3分析阶段错误!未定义书签。

7.2.4设计阶段错误!未定义书签。

7.2.5构建阶段错误!未定义书签。

7.2.6验证阶段错误!未定义书签。

7.2.7部署阶段错误!未定义书签。

7.2.8项目收尾阶段错误!未定义书签。

7.3项目管理错误!未定义书签。

7.3.1范围管理错误!未定义书签。

1.1.1沟通管理错误!未定义书签。

7.3.2问题管理错误!未定义书签。

7.3.3质量管理错误!未定义书签。

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第5页共149页

IT管控系统技术方案

7.3.4变更管理错误!未定义书签。

7.3.5风险管理错误!未定义书签。

7.3.6进度计划错误!未定义书签。

7.3.7项目完成标准错误!未定义书签。

7.4项目资源错误!未定义书签。

7.4.1项目组织架构错误!未定义书签。

7.4.2人员履历错误!未定义书签。

7.5项目计划错误!未定义书签。

7.6培训错误!未定义书签。

7.6.1设备及产品安装配置培训错误!未定义书签。

7.6.2报表开发系统集成开发培训错误!未定义书签。

7.6.3系统日常运维培训错误!未定义书签。

7.7运维服务错误!未定义书签。

7.7.1原厂服务错误!未定义书签。

7.7.2实施方售后服务错误!未定义书签。

8附录一:功能项点与产品模块对应错误!未定义书签。

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第6页共149页

IT管控系统技术方案

1n■运维管理项目分析与设计

1.1运维管理的必要性

•管理体系视角

从IT内部的系统运营保障的角度,IT部门的IT服务未被有效管理、IT服务

未计划,IT保障体系更多是被动响应的方式,在提升IT服务主动性方面,当前

管理体系的效果不甚明显。同时,由于当前部门责权体系本身的限制,部门内部

有自己的IT服务流程,无法充分适应IT运维的特点,加上技术手段的缺失,对

当前的IT管理控制能力有越来越弱的趋势;

•IT资源管理

IT资源(硬件/软件资源、有形/无形资源、物理/逻辑资源)没有统一的管理

平台,资源管理无法面向业务,IT资源的投入无法反映到关键业务,这对企业

IT的整体运作造成较大的风险,也无法实现整体绩效的提高。资源管理缺少统

一的管理方法及有效的工具系统。

•业务需求和n■服务提供的不一致

依靠当前的IT人员和IT资源管理现状,IT部门向业务部门提供IT服务的

能力以趋于极限,而来自业务部门的IT服务需求又越来越高,同时没有有效的

对这些服务需求进行管理,导致了业务需求和IT服务提供之间的矛盾会越来越

突出。

•人员绩效

没有一套行之有效的IT服务人员的绩效考核指标,也就无法对IT服务人

员工作饱和状态的统计,对IT服务的质量、服务能力也无法跟踪。若要再进一

步提升IT服务质量,必须依赖更多的IT维护人员,付出更多的IT服务成本。

•管理工具

在IT服务管理体系中,主要用于IT管理的工具包括以下几类:

□对人员活动进行流程管理的服务流程管理平台

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第7页共149页

IT管控系统技术方案

□对IT资源进行管理的IT资源管理系统

□对基础架构的性能、状态和使用趋势进行管理的监控系统

□IT操作的自动化系统

在一个理想的IT管理规划方案中,这几类工具系统是互相结合,协同作用

的,才能最大化的提高IT服务的效率和质量。其中IT服务管理流程平台帮助流

程进行落地和固化,并且自动产生周期性的IT服务数据报表,提供管理决策依

据;资源管理系统做为IT资产基础信息,是全面、唯一的IT资源数据来源;监

控系统是实现主动管理的必须手段,通过精确了解IT基础架构的运行状态和运

行趋势,以实现防患于未然;自动化系统是实现IT审计、IT基础架构变更批量

操作的必需工具,有效提高操作效率和降低操作风险。

1.2IT运维管理目标

1.2.1提升遵从于业务目标的IT服务质量

能够持续的、为业务部门提供统一标准的高质量IT服务,发挥IT服务部门

在战略中的支撑作用,给各个业务板块提供明确目标(满足或高于业务需求的)、

可度量的IT服务。充分支撑业务和内部管理运作,为整体运营提高效率,提供

保障,实现以下宏观收益:

>流程规范化:通过ITIL标准流程与现有流程的结合,确实有效的规范IT

管理流程,提高管理水平和工作效率;

>人员专业化:实现ITSM流程岗位的角色落地,使人员可以按照流程设

定岗位进行工作;

>流程自动化:改变了以往手动或者半自动的工作模式,大大提高了工作

效率;

>自动通知:通过集成邮件和短信,实现任务分派、升级的自动通知功能,

大大减少了分派工单的渠道,从而提高了响应和处理工作任务的效率;

>工作过程可视化:相关工作的痕迹将被保留在系统中,使工作的过程可

以被管理层和服务台监督,从而大大减少了工单处理如“泥牛入海”的情

况出现;

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第8页共149页

IT管控系统技术方案

>工作结果可量化:通过数据的分类累积,使需要的KPI考评得以实现;

>平台标准化:通过标准化的设计和建设,使IT服务能够在全国共享统一

平台,平台价值最大化;

>IT服务知识积累:通过知识库,对IT运维进行知识积累,通过知识库,

对事件的解决提供辅助/参考的解决方案。

>实现全面集中监控;

>实现集中事件管理;

>提供基于IT基础设施和在其之上构建的业务系统的各种报表:包括可用

性报表、统计报表、性能报表等。

>充分利用现有投资提高服务并在日后实现BSM价值;

1.2.2提升IT资源管理能力

IT资源能力是实现战略IT战略的核心能力。IT资源管理的范围包括:

□软件/硬件资源

□物理/逻辑资源

□有形/无形资源

提升IT资源管理能力的目标通过将上述几类资源进行资源建模,全面管理

每个CI项的信息及CI项之间的关系,通过面向业务的管理方式进行资源动态管

理,真正发挥资源能力在IT服务提供中的核心作用,为后续的IT服务管理提升

工作(包括事件管理、问题管理、服务水平管理、知识库管理等)打下坚实的基

础。

1.2.3IT投资效益最大化

IT的投资主要体现在人员和设备两方面,IT不是利润部门,没有直接的收

入来源,因此IT投资效益的计算一直是困扰IT部门的一个难点,国际上提出的

各种IT投资效益的计算方法,在不同组织采用时都遇到了困难。针对用户,该

如何衡量IT投资效益,并让IT投资效益最大化,我们建议采取分成两个阶段实

现的策略:

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第9页共149页

IT管控系统技术方案

第一阶段:倾向于关键业务系统投入。

通过实现面向业务的IT资源管理,明确关键业务所需要的IT资源,针对关

键业务在IT资源的投入上实现策略性的偏重。通过将有限的IT资源投入到关键

业务中,来实现IT投资效益最大化。

第二阶段:以支撑某业务的单项IT服务为计量单位,实现IT成本精确计量

和IT服务提供的模拟结算为前提,实现IT投资效益的量化计算。根据该项业务

的绩效计算该项IT服务的价值。

1.2.4可持续改进的服务管理体系

服务设计

〃评估市核服务运营

/a\

高质量的IT服务不是一朝一夕可以实现的,而且IT部门向业务部门提供

的IT服务也不是一成不变的。IT部门必须根据业务部门的实际运作情况,灵活

的提供满足业务需要的IT服务。因此,需要在IT内部建立起一种运作方式,通

过一定的流程、定义责任人、制定合适的评估指标及相关的措施,确保IT服务

能灵活地满足业务需求,并在持续改进的运作轨道上。

1.3系统设计原则

•先进性

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第10页共149页

IT管控系统技术方案

参考全球IT管理业界公认的指导性框架ITIL(InformationTechnical

InfrastructureLibrary)管理体系和BSM(业务服务理念),规范运维管理和操

作,采用先进的规范化IT管理模式,建设一流的IT运维管理。

•实用性

为了取得最大的投资回报,取得更好的收益,必须缩短IT运维管理的实施

周期。管理软件的安装简单、省时、安全、可靠,易学习、易管理维护,简化客

户化工作。

在不影响正常生产的情况下,结合实际管理情况,逐步实现以流程管理贯

穿整个IT服务管理过程,实现对业务系统的集中监控、集中管理、集中维护。

•高效性

为管理人员提供直观、易用的使用界面和策略定义工具,以及各种功能操

作方式一致,操作维护简单、管理界面友好。提供丰富的图形界面,通过这些图

形界面,用户能够完成日常的运维监控管理。

当系统出现故障时,可能会有几十个乃至上百个告警信息,众多的告警让

值班人员无从顾及。因此,在发出告警信息前需要对告警信息进行合并、过滤、

定制,并提供初步的故障分析手段。提供简单快捷的操作方式,以及以简单、有

效的方式通知运维技术人员或管理人员。

运维技术人员借助于IT集中监控管理系统,能进行快速故障定位,利用ITIL

流程平台系统,快速寻求帮助,从而达到快速解决故障的目的,最大限度地减少

对业务系统的损失。管理人员可随时了解业务系统的运行状况。

•扩展性

为了保护投资,要求管理软件具有很好的开放性和对标准的支持能力,支

持各种主流平台、数据库和中间件等。同时,产品应采用模块化设计,有良好的

可扩展性和可伸缩性,便于今后的扩展和分步实施,保护已有的投资。提供各类

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第11页共149页

IT管控系统技术方案

开发工具,能够进行各种开发扩展。

支持后台使用多种数据库存储方式,支持平台安装在多种操作系统下。

能够支持后期陆续可能开展的ITIL流程平台、自动化平台等系统的集成扩

展。

•规范性

统一标准和规范是建设IT运维管理项目的基本要求,系统之间应采用开放

的接口标准,便于信息交换、信息共享和业务协同。

•稳定性

系统管理平台能适应各Windows、Linux、Unix、AIX系统,同时满足支持代

理和无代理二种方式。系统管理功能支持模块化安装,每个模块可以单独安装和

运行,系统管理平台能稳定运行。

支持多数据采集服务器部署,支持分级管理和采集,支持分布式管理。

支持高可用性架构,如HA,集群等架构,确保监控平台自身的高可用、可

靠性。

•安全性

系统管理包括但不仅能采用简单网络管理协议(SNMP)来管理主机设备,

可对被管主机不启动SNMP协议,只通过Agent和管理站进行通信,同时双方

通信可采用安全的底层协议通信。

支持普通用户可以监控的权限,无需系统管理员和DBA权限进行监控各种

资源。

支持SSL协议;保证监控数据安全,支持跨防火墙监控,并要求单一监控

端口。

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第12页共149页

IT管控系统技术方案

具有自身安全性控制,包括用户访问权限、用户必须具有分权管理功能,

系统能够按角色管理用户,将特定对象的管理权限分配给特定的用户角色,同一

用户角色还可以具有不同的管理权限。

用户权限默认应该支持多层次的权限,可以对拓扑图进行分权管理,例如

不同的管理员登录可以看到自己负责的节点。

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第13页共149页

IT管控系统技术方案

2IT集中监控系统

2.1逻辑架构设计

IT集中监控管理系统着重于及时发现用户的IT基础设施和业务系统的各类

告警和性能异常,进行数据分析和整合,同时以适当的形式进行展现;另一方面,

维护人员借助该系统能够进行相关操作,及时完成维护职能。

根据“集中监控、集中维护、集中管理”的原则,以及用户IT环境的特点,

我们建议IT集中监控管理系统采用如下的架构:

在监控子系统的组成结构设计中,包含采集层、数据处理层及展现层三个

层面。

采集层由监控产品组成,包括网络、主机硬件、操作系统、中间件、数据

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第14页共149页

IT管控系统技术方案

库、Web服务器、备份、存储以及各种业务应用等各种监控对象的监控模块。

处理层包括应用响应时间处理、IT基础架构及应用可用性和性能数据处理、

事件及告警处理、服务影响管理等模块。IT基础架构及应用可用性和性能数据

处理、应用响应时间处理模块通过采集层的各种采集模块将采集到的数据进行处

理,并提交到展现层进行性能数据的展现及报表分析;同时将告警数据提交到事

件及告警处理模块进行告警分析,并将分析的结果事件进行邮件、短信、声音等

通知动作,同时转发到服务影响管理模块中进行服务影响分析,将服务影响分析

的结果和事件提交到展现层做展现。为了创建服务影响管理中需要的服务模型,

在此部分还需要自动发现工具模块和CMDB模块,通过自动发现工具发现IT基

础架构和应用的配置信息、,并将其存储到CMDB中构建服务模型。另外,通过

服务影响分析的告警数据也可以在技术支持子系统中创建事件工单,触发事件管

理流程,实现技术支持子系统的各种相关流程管理。

展现层包括门户和报表管理模块,将处理层的各种处理数据统一存储在数

据库中,进行集中展现和报表分析。展现层负责综合展现经过处理层处理的可用

性、性能、告警、服务影响等数据。

2.2物理架构设计

在本项目中,我们可以通过实施高可用性架构的方案,使监控平台具体更高

的稳定性和容灾能力。

高可用性的架构设计如下:

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第15页共149页

IT管控系统技术方案

-集中监控服务器(集中监控Server)

集中监控服务器可以安装于双机的环境中,支持WindowsCluster或者是

Oracle针对OracleSolaris提供的双机软件。在双机环境中,集中监控服务器(物

理或虚拟)的配置如下:一个是主节点(Primary),另一个是备节点(Secondary)。两

个服务器共享一个逻辑IP地址和cluster名称,同时访问一个共享存储池。

集中监控服务器必须安装在共享存储上,且在主节点中需要启用逻辑IP/主

机名。当主节点宕机时,备节点将会从共享存储中进行接管。

-集成服务器(IntegrationServiceNode)

集成服务从PatrolAgent获得性能及事件数据。PatrolAgent配置时能够设置

主要及次要的集成服务。当主集成服务宕掉时,PatrolAgent将会自动连接次集

成服务,并在主集成服务恢复后再连回主集成服务。

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第16页共149页

IT管控系统技术方案

-远端事件采集器(RemoteCell)

RemoteCell主要负责采集事件及影响信息。RemoteCell支持被配置为高可

用模式,其配置方式是通过RemoteCell的配置文件进行设置。

2.3采集层

采集层主要功能是完成对数据层中的平台(包括网络设备、防火墙、服务

器、SAN交换机、存储柜、PC服务器、刀片服务器、UPS、空调以及存储备份

系统)和业务进行数据采集,采集的内容包括:告警数据、性能数据、配置数据、

其他数据等。

2.3.1操作系统监控模块

能够支持广泛的操作系统类型,如HP-UX,IBMAIX、Solaris.Linux.

WindowsNT/2000/2003/2008.AS400等多种系统平台。

通过在被管的服务器上安装监控代理,可实现对被管服务器上操作系统运行

情况的监控。它可以自动监控CPU,硬盘,网卡,操作系统日志文件,内存及

交换区等诸多参数的工作情况,为操作系统提供不间断监测,发现问题时提出警

告,并提供自动修复功能,不仅使管理员从费时的重复工作中解脱出来,专心于

其它任务关键的活动,而且帮助系统管理员从被动的事后管理转化为主动的事前

监控,从而保障了系统的高可用行和高可靠性。

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第17页共149页

IT管控系统技术方案

|[>PATROtCentralUnbttedlgt[。鹏孙维叱主机魔阻一参数[ADa)BSl31Ul:HAAGIlMGJIAAESw3bsejj

PATROLCen&dA叮Q1卷区k?8^空目夕即

④cpu/cpu/a»ucpuuta

fction•i)ew•二电F

The:2006年3月9日16:39:00

目PATROLManMep(Ptorte:触,C上

V^ue:100,00

S§Tasks

日©呻数辆务耨

£泅A1XDBSJ_318J

#二阚酬彘务黑模修

*_|1甥数提去景务署致将声

尊王崛关神教

图笏施方密控关健孝期

F与LWH根务船

*LINUX31OCMDOMA1\

-「LWR|g务四WeH网关f

与二JJDBCS8

32JJW

a

3二IWeb应用

场bssezer应用好务器H

整bsswver应用展务器H

3f"server应用6各器W

%bsserver应用后.务鄢

-⑤明小雅务翳作系统的

1CFV®用的骸伏况

%6J利用率百分比(%

钻CW用尸鹤百分选

J使用就资网的

看SWAP空晒百分H

⑥内存使用的以%)

J内存蜿㈱镰城

%可用内存岫

B文件笈物wme空间供

文作系统使用的健够

前翻盘近哈线效

监的盘城每秒馁写蔻

»网络M包数

E句查诲最务署

I遍QUERYDB3181

*-J查遒盘务薪酷系好知.

“,3・,蕾次f就却;gffH皆二1

AManHOpetalot

FdrHelp,pfe$$Fi2006-3^1638NUM

图:Unix操作系统监控

Unix操作系统监控主要功能:

♦直接连到操作系统的核心,提供快捷方便的对系统核心的存取。

♦利用BMC的数据点技术,该技术使管理员能够迅速检索附加的与上下文

数据相关的参数值。

♦自动监控CPU的综合利用率及CPU的各详细资源使用情况。通过监测

CPU的利用情况识别可能降低系统性能的用户生产率的活动。这有利于

去除或重新安排那些使资源萎缩的无必要活动,提高系统的性能和吞吐

量。

♦自动监测系统内存的使用情况,识别由过多分页和交换(或数据被装入

卸出内存的频度)所带来的性能问题。问题被发现之后就会通知管理员

采取措施。

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第18页共I49页

IT管控系统技术方案

♦实时监控交换区SWAP,确定SWAP空间的使用情况。识别由于SWAP

剩余空间过少而引起的系统性能问题。可以及时采取措施,保障系统的

高可用性。

♦监测TCP/IP上的通信状况,通过研究网络使用趋势分析中有用标准值来

测量网络的运行情况。如果发现问题,KMforUnix就通知管理员,如高

数据冲突率(可降低网络性能和阻碍通信。利用提供的信息,管理员可

加强网络性能,例如,NFS的通信能力就可从客户一端的缓冲受益,提

高用户生产率)。

♦监测文件系统的使用情况,确定哪个磁盘被占用得很多,可能没有自由

空间。这条信息可帮助系统管理员迅速识别和消除潜在的瓶颈,减少丢

失数据和磁盘错误的危险,提高系统可用性。同时可以自动监控操作系

统的日志文件。

♦在系统级提供安全监控,包括口令、探测不恰当的权限设置和以及系统

级日志方式存取等。这些都与己有Unix安全设施不冲突,但是加强了管

理控制以阻止未授权的系统存取。

♦自动监测打印队列的大小,在满之前通知管理员,从而避免了不必要的

打印错误和用户效率损失。KM与Berkeley和SVR4打印管理系统完全

兼容,通过对行业标准的支持提供灵活性。

♦监测磁盘I/O和占用情况,定位网络中的热超限使用的磁盘。热磁盘可

能成为系统瓶颈,或者更严重的导致昂贵的系统错误。有了这些信息,

管理员就可以有效地将数据文件分散到多个磁盘上,或使文件系统分布

在几个磁盘上,从而降低不可预计的故障时间和支持企业范围内的更高

的系统可用性和吞吐量。

♦跟踪系统用户数和精确决定正在运行的进程数。管理员可以确定哪个进

程占有对系统资源的最多请求。当请求不太多时,KM,可自动提示管理

员,促使管理员在系统能力极限达到之前,在系统性能未显著下降之前

采取措施。

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第19页共149页

IT管控系统技术方案

♦通过每一个监控参数报警阈值和相关报警条件的定义,一旦触发报警时,

告警信息将实时传送到管理控制台。可根据用户定义的值在本地保存指

定天数的告警信息和性能数据。

Window操作系统监控主要功能:

♦监控服务器的可用性,包括CPU、内存、进程、磁盘I/O、页面文件、

Cache,网络吞吐量的使用情况;

♦监控WindowsService和WindowsProcess的状态和资源占用情况;

♦允许管理员通过Windows性能计数器增加WindowsNT、Windows

2000、Windows2003.Windows2008的额夕卜性能参数;

♦允许管理员通过WQL语言增加WindowsNT>Windows2000>Windows

2003、Windows2008的额外性能参数;

♦提供对Windows事件日志的监控;

♦提供对COM+、ActiveDomain,DNS等的监控功能;包括与AD的集

成,对DNS的DHCP地址池监控等。

♦支持Cluster环境;

♦提供对指定文件的监控功能,支持自定义关键字,以及监控文件的大小

等额外监控功能;

♦通过每一个监控参数报警阀值和相关报警条件的定义,一旦触发报警时,

告警信息将实时传送到管理控制台。可根据用户定义的值在本地保存指

定天数的告警信息和性能数据。

2.3.2主机硬件监控模块

BMC对主机硬件监控的模块可以实现对被管服务器硬件系统运行情况

的监控,如主机电源、风扇、CPU、内存、电压、温度等监控,当硬件发生

故障时,进行告警。

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第20页共149页

IT管控系统技术方案

0Hardwareonoa

B0BladeEndosure:BladeSystemc3000Endosure

B|Blades

申|Blade:1(FERMAT-1-ProLiantBL260cG5)-OK

E|Blade:2(fermat-2.mternal.sentrysoft-ProLiantBL260cG5)・OK

S|Blade:5(FERMAT-3-ProLiantBL260cG5)-OK

臼■Fans

ffl0Fan:2

由dFan:4

S■Fan:5

由0Fan:6

BWOtherDevices

由WICSwitch-Ethernet:1(HP1GbEthernetPass-ThruModuleforc-Cla;

日/PowerSupplies

由■每

aPov<erSupply:1(1200VV)

QPowerSupply:4(1200W)

Temperatures

•卡Temperature:BladeBayl

(EjWTemperature:BladeBayZ

产Temperature:BladeBay5

S®.产Temperature:Endosure

a•产Temperature:IC1

产Temperature:OA1

;玲PovverConsumption

Status

白,SelectedConnectors

EJConnectorfor:HPBladeSystem-Teinet/SSH

QHardwareonlocalhost

□j)Computer:HPProLiantBL260cG5

E♦DiskController:PrimaryIDEChannel=1

(±].Fans

SOMemoryModules

国NetworkInterfaces

S至OtherDevices

由Processors

由…磨Temperatures

图:硬件监控

将主机硬件的监控与操作系统、数据库、应用、存储等的监控集成在一

起,实现集中统一的监控,并将监控到的设备故障事件转发到集中事件管理

平台进行集中的事件处理。

产品支持基于第三方服务器硬件监控软件(旧MDirector、HPInsight

Manager、DellOpenManager)的整合。

2.3.3虚拟化监控模块

BMC不仅能对物理主机进行监控管理,而且还能对虚拟环境进行监控

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第21页共149页

IT管控系统技术方案

管理。可以监控的虚拟环境包括:

-AIXLPAR/WPAR

-CitrixXenServer

HPUXnPar/vPar/VMHost/VMGuest

MicrosoftHyper-V

SunSolarisZones/ContainersandLogicalDomains

VMWare(vCenter,ESX,ESXi)

RedhatKVM

BMC对虚拟环境的监控通过监控知识模块采用API连接VirtualCenter

或ESXServer采集相关数据,再通过集中监控进行统一的展示和处理,包括

动态基线的产生、告警的触发和处理、报表的产生。

1.自动发现所有的虚拟主机

D亶VrtuaiServers

B•/$mdcY-vc2_vrtuaiccrtei4VMwareVirtualCenterconneaion

㈠能pcho.bnrconi_E5X4host(ESXserver)

SQ*DbkPerformance

ffl-命Merroty

0§NetworkFerFcrmance

百鸟virtualMachine:4virtualmachinecontainer

:臼国c2_p:ho_vm0]

3当DiskPctformancc

:帝Memory

由自Netwcrkindividualvirtualmachines

associatedwiththishost

电Status

2麴pd_o_vm_2h3web

:4担pcbo^mjAizkjRrqtauo

3搜w_vmD$chhesc

Instate

混Comm_9:atu5

闩蹴/52.bmc.ccni_\,Ccrtci

XCoirnnStatus

图:总体视图

2.自动提供虚拟资源和物理资源的映射,便于发现虚拟资源和物理资源的

关系。

3.监控集群、资源池、虚拟主机、具体的虚拟机的运行情况,监控的指标

涵盖了运行状态、存储、网络、CPU、内存等各方面的性能和状态参

数。

本文档仅广州咨元信息科技有限公司和被呈送方内部使用,未经双方许可,请勿扩散到第三方。

第22页共149页

IT管控系统技术方案

loc&lKost..locald.omain_ESXS3VirtualServers

Dat<xtor*S■192.168.60.77_ESX

DisicP«ir£or*m«xtc«

-

MemoryBCJhadatacenter

N«tworlcP«x*£ox*n**nc«3localhost.localdom&in_ESX

P1*OC«XSO1"0口Datastore

vmwai-«

00DiskPerformance

bppm.bmc.com_90

?T)d<v«lop_82®Memory

0oNetworkPerform&nct

目DiskTxx£oz*mion

GBHH«rddisk10aProcessor

S3DiskPer£ox*m<rtc«BOvmwtre

^5MemoryES3bpp®.bmc.com_90

Acti

Balloon&,develop_82

Fx-ee田■ngP_75

Gx*<xit.«d&3report,deno.com_169

%Vt.i1ixion&J3Solaris10.94

由Network

至UN«twox-kadapter1ffiOVM-WIND0WS2003-BEIM7300_

Px-oc«ssot*用25VM-WIND0WS2003-Remedy75_

*?ucp^a_O

由£3weblogic_98

cpvi_l

&:53Win2003_remedy_220

cpti_2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论