智能化数据中心运维项目技术方案_第1页
智能化数据中心运维项目技术方案_第2页
智能化数据中心运维项目技术方案_第3页
智能化数据中心运维项目技术方案_第4页
智能化数据中心运维项目技术方案_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 智能化数据中心运维项目技术方案目 录 TOC o 1-3 h z u HYPERLINK l _Toc528136393 1项目概述 PAGEREF _Toc528136393 h Error! Bookmark not defined. HYPERLINK l _Toc528136394 1.1现状分析 PAGEREF _Toc528136394 h Error! Bookmark not defined. HYPERLINK l _Toc528136395 1.2需求分析 PAGEREF _Toc528136395 h Error! Bookmark not defined. HYPER

2、LINK l _Toc528136396 2总体方案 PAGEREF _Toc528136396 h Error! Bookmark not defined. HYPERLINK l _Toc528136397 2.1平台逻辑架构 PAGEREF _Toc528136397 h Error! Bookmark not defined. HYPERLINK l _Toc528136398 2.2平台部署架构 PAGEREF _Toc528136398 h Error! Bookmark not defined. HYPERLINK l _Toc528136399 3软件平台功能 PAGEREF

3、_Toc528136399 h Error! Bookmark not defined. HYPERLINK l _Toc528136400 3.1可视化IT系统关系管理 PAGEREF _Toc528136400 h Error! Bookmark not defined. HYPERLINK l _Toc528136401 3.1.1功能概述 PAGEREF _Toc528136401 h Error! Bookmark not defined. HYPERLINK l _Toc528136402 3.1.2IT架构和流程管理 PAGEREF _Toc528136402 h Error!

4、Bookmark not defined. HYPERLINK l _Toc528136403 3.1.3数据中心管理 PAGEREF _Toc528136403 h Error! Bookmark not defined. HYPERLINK l _Toc528136404 3.1.4地理信息可视化管理 PAGEREF _Toc528136404 h Error! Bookmark not defined. HYPERLINK l _Toc528136405 3.1.5流程可视化管理 PAGEREF _Toc528136405 h Error! Bookmark not defined. H

5、YPERLINK l _Toc528136406 3.1.6运维管理视图 PAGEREF _Toc528136406 h Error! Bookmark not defined. HYPERLINK l _Toc528136407 3.1.7运维分析视图 PAGEREF _Toc528136407 h Error! Bookmark not defined. HYPERLINK l _Toc528136408 3.1.8综合搜索 PAGEREF _Toc528136408 h Error! Bookmark not defined. HYPERLINK l _Toc528136409 3.1.

6、9用户运维桌面 PAGEREF _Toc528136409 h Error! Bookmark not defined. HYPERLINK l _Toc528136410 3.2协同编辑和视图管理 PAGEREF _Toc528136410 h Error! Bookmark not defined. HYPERLINK l _Toc528136411 3.2.1功能概述 PAGEREF _Toc528136411 h Error! Bookmark not defined. HYPERLINK l _Toc528136412 3.2.2功能模块 PAGEREF _Toc528136412

7、h Error! Bookmark not defined. HYPERLINK l _Toc528136413 3.2.3在线编辑 PAGEREF _Toc528136413 h Error! Bookmark not defined. HYPERLINK l _Toc528136414 3.2.4视图和场景管理 PAGEREF _Toc528136414 h Error! Bookmark not defined. HYPERLINK l _Toc528136415 3.2.5对象定位和路径查询 PAGEREF _Toc528136415 h Error! Bookmark not def

8、ined. HYPERLINK l _Toc528136416 3.2.6视图关联和组合管理 PAGEREF _Toc528136416 h Error! Bookmark not defined. HYPERLINK l _Toc528136417 3.2.7视图模板和自动视图管理 PAGEREF _Toc528136417 h Error! Bookmark not defined. HYPERLINK l _Toc528136418 3.3可视化引擎 PAGEREF _Toc528136418 h Error! Bookmark not defined. HYPERLINK l _Toc

9、528136419 3.3.1功能概述 PAGEREF _Toc528136419 h Error! Bookmark not defined. HYPERLINK l _Toc528136420 3.3.2可视化元素管理 PAGEREF _Toc528136420 h Error! Bookmark not defined. HYPERLINK l _Toc528136421 3.3.3自动布局引擎 PAGEREF _Toc528136421 h Error! Bookmark not defined. HYPERLINK l _Toc528136422 3.3.42D/3D渲染引擎 PAG

10、EREF _Toc528136422 h Error! Bookmark not defined. HYPERLINK l _Toc528136423 3.4综合搜索 PAGEREF _Toc528136423 h Error! Bookmark not defined. HYPERLINK l _Toc528136424 3.5可视化场景调用接口 PAGEREF _Toc528136424 h Error! Bookmark not defined. HYPERLINK l _Toc528136425 3.6告警事件处理平台 PAGEREF _Toc528136425 h Error! Bo

11、okmark not defined. HYPERLINK l _Toc528136426 3.6.1功能概述 PAGEREF _Toc528136426 h Error! Bookmark not defined. HYPERLINK l _Toc528136427 3.6.2功能模块 PAGEREF _Toc528136427 h Error! Bookmark not defined. HYPERLINK l _Toc528136428 3.6.3事件处理引擎 PAGEREF _Toc528136428 h Error! Bookmark not defined. HYPERLINK l

12、 _Toc528136429 3.6.4事件控制台 PAGEREF _Toc528136429 h Error! Bookmark not defined. HYPERLINK l _Toc528136430 3.6.5事件处理策略管理 PAGEREF _Toc528136430 h Error! Bookmark not defined. HYPERLINK l _Toc528136431 3.6.6影响分析和根源诊断 PAGEREF _Toc528136431 h Error! Bookmark not defined. HYPERLINK l _Toc528136432 3.6.7可视化

13、告警分析 PAGEREF _Toc528136432 h Error! Bookmark not defined. HYPERLINK l _Toc528136433 3.7运维数据整合管理 PAGEREF _Toc528136433 h Error! Bookmark not defined. HYPERLINK l _Toc528136434 3.7.1功能概述 PAGEREF _Toc528136434 h Error! Bookmark not defined. HYPERLINK l _Toc528136435 3.7.2功能模块 PAGEREF _Toc528136435 h Er

14、ror! Bookmark not defined. HYPERLINK l _Toc528136436 3.7.3运维数据管理 PAGEREF _Toc528136436 h Error! Bookmark not defined. HYPERLINK l _Toc528136437 3.7.4通用数据操作 PAGEREF _Toc528136437 h 48 HYPERLINK l _Toc528136438 3.7.5外部数据接口 PAGEREF _Toc528136438 h 49 HYPERLINK l _Toc528136439 3.8数据接口平台 PAGEREF _Toc5281

15、36439 h 49 HYPERLINK l _Toc528136440 3.8.1功能概述 PAGEREF _Toc528136440 h 49 HYPERLINK l _Toc528136441 3.8.2功能模块 PAGEREF _Toc528136441 h 50 HYPERLINK l _Toc528136442 3.8.3运维工具接口 PAGEREF _Toc528136442 h 51 HYPERLINK l _Toc528136443 3.9外部接口平台 PAGEREF _Toc528136443 h 55 HYPERLINK l _Toc528136444 3.9.1功能概述

16、 PAGEREF _Toc528136444 h 55 HYPERLINK l _Toc528136445 3.9.2功能模块 PAGEREF _Toc528136445 h 55 HYPERLINK l _Toc528136446 3.10后台管理 PAGEREF _Toc528136446 h 58 HYPERLINK l _Toc528136447 3.10.1运维数据管理 PAGEREF _Toc528136447 h 58 HYPERLINK l _Toc528136448 3.10.2用户和统一认证管理 PAGEREF _Toc528136448 h 60 HYPERLINK l

17、_Toc528136449 3.10.3事件处理策略管理 PAGEREF _Toc528136449 h 61 HYPERLINK l _Toc528136450 3.10.4外部数据源管理 PAGEREF _Toc528136450 h 63项目概述现状分析运维平台经过多年建设,形成了较为完整的监管控体系架构,在各管理领域使用了多种专业工具,此种方式优势在于管理平台专业性强,实现对各领域的深度管控。但造成了运维平台结构复杂,异构性强,数据分散,指标不统一,不易管理,无效告警过多,同时当前系统使运维人员无法直观有效的了解整体业务、应用、网络、系统等整体运行的状态,缺少有效的跨领域的故障诊断手段

18、,在判断故障根源时耗费时间较高,另外监控作为整体运维管理平台的一部分,无法与流程、自动化等系统进行有效集成。具体问题表现在以下几个方面:监控范围有限、管理分散缺乏事件关联分析、故障根源定位速度慢缺少全面直观的运维管理视图缺乏有效的统一资源及配置管理缺乏统一的运维管理平台,难以适应主动管理、集中管理要求需求分析针对需求和运维现状,本项目旨在实现一体化的IT运维管理,建立整体的运维平台体系,从而实现从系统、应用到业务的端到端运行状态的全面管控,实现跨技术领域的运维数据处理和关联分析,提高故障定位的效率。通过此次项目建立统一的运维平台体系,综合反映整个业务系统运行状况,有效的管理内部的IT资源运行情

19、况、性能状况等,使各级管理人员和技术人员能迅速了解系统架构及运行状态,聚焦所关心的问题,满足不同层次人员对系统的运维管理需求。实现面向业务服务的IT管理,提高整体的IT运维效率和水平。具体目标:有效整合分散的运维数据、资源和信息当前运维数据包括告警数据,性能数据和状态数据。资料信息包括各种运维文档。项目将通过技术手段将告警数据、性能数据、状态数据以管理对象为核心,进行有效整合,实现统一的数据管理。同时,建立资料信息搜索机制,提升各类运维信息的使用效率和运维价值。统一资源配置管理资源管理对使用的专业工具提供的运维数据及资源配置信息,进行统一管理。并提供方便灵活的配置方式以便与运维平台数据结构进行

20、有效衔接。同时,实现配置数据与可视化运维场景的无缝整合。围绕运维场景建立管理模型,达到快速定位故障,提升故障诊断效率的目的利用统一的监控指标管理与管理,实现面向不同的被监控领域的事件的汇总、重复事件压缩、事件的相关性处理;通过可视化系统实现统一的业务、应用和系统架构状况的实时监控和展现;输出故障关系图提高定位故障的效率使生产支持更快地做出反应,解决故障;建立端到端运维全景视图,对业务、应用、系统、基础设施等各层面进行统一管理,整合运维数据为了更加直观的展示运维整体情况,此项目将采用业界领先的可视化技术,构建基于配置和资产信息的一体化立体运维模型,在可视化场景中将业务、应用、中间件、数据库、服务

21、器、存储和网络,直到硬件所部属的位置进行统一展现,帮助运维人员了解整体运行状态。并通过灵活的接口与监控系统进行有效整合,集成告警和性能信息,联动自动化运维工具,形成闭环的运维处理过程。统一架构,实现运维视图的自助生产和共享根据需求分析,当前运维系统缺少有效地管理工具,统一管理系统架构和各类管理视图,无法使运维数据信息进行有效共享,同时,架构视图与实际运维数据脱节,不能反映真实的系统环境,更无法通过关系自动生成管理视图。因此,统一运维平台将搭建自助式的架构管理平台,实现运维视图的自由创建、分享和积累,管理内容包括各类运维关系图,配置数据和相关系统资料。通过此项目中的统一运维门户达到关系图在线编辑

22、,信息快速发布并进行高效检索。将整个运行中心的数据进行有效发布与交互。在发生故障时为运维人员提供大量的有价值的数据进行分析,有效预防故障产生,加快解决故障效率。基于策略的跨领域故障处理策略,提升故障处理能力通过分析告警事件所关联的场景,利用运维数据处理平台提供的事件处理引擎,定制告警关联规则,实现对于告警的关联分析功能,并提供友好的交互界面是策略制定简单化,透明化。减少无效告警的发生。同时,通过告警分析规则的积累,构建起可扩充的故障分析库和应急处理预案。总体方案平台逻辑架构一体化运维平台,包含数据接口、运维数据处理、运维数据仓库、外部接口和统一运维门户5部分。其中:数据接口平台:作为统一运维管

23、理平台的主要数据入口,对接运行环境中孤立的管理工具,整合分散的运维数据,包括配置数据、性能数据、报警数据、流程数据以及业务数据等其他相关的IT管理数据。运维数据处理平台:负责运维数据的实时分析处理,主要包括运维数据集成处理、监控指标分析处理以及核心的统一事件处理引擎,将多维度的运维数据通过管理对象统一管理,并根据不同维度数据的特征,提供专业的处理引擎,并将处理结果存储在运维数据仓库中。运维数据仓库:存储了IT运维中涉及的对象/关系、监控指标、报警事件、流程工单、用户以及运维场景等多维度的运维信息,并通过统一的管理对象标识,实现逻辑融合。针对运维数据不同的类型和运算特征,选择业界领先的数据库技术

24、组合,提供稳定、高性能、高扩展性的运维数据仓库,并通过接口封装提供标准的数据服务。外部接口平台:处理与外部系统的交互,包括自动化工具调用、消息通知、流程工单同步等主要工具接口,提供统一的管理功能,控制调用过程,记录调用结果。统一运维管理门户:为系统用户和外部系统提供统一的交互平台,用户可以通过该门户,统一访问运维信息,调用运维管理接口,并创建和发布适用于日常运维的可视化管理场景,基于运维场景,执行日常所需的数据分析和运维管理任务。统一运维门户基于业界领先的图形专利技术,并提供了自助式的管理场景创建、发布、订阅等可视化管理功能,赋予用户更灵活的运维管理能力,显著提升管理工具价值和运维效率,并促进

25、专家经验的积累,和整体运维管理能力建设。平台部署架构针对一体化运维平台在日常工作中的业务关键性,本项目在物理架构设计中考虑系统高可用性、可扩展性和性能需求,具体设计如下:集成接口平台:利用3台集成接口服务器,部署uAPI接口模块,构建高可用、可扩展的集成接口集群,负责与外部系统交互,执行数据同步、动作调用等任务,并将过程数据发送至数据处理平台和运维数据仓库。数据处理平台:本期项目,利用3台应用服务器,部署uEP分析处理模块,接收集成接口平台采集的运维数据,执行实时处理,同时,系统具备横向扩展能力,在长期运行过程中,可根据负载增长,灵活的对系统进行扩容。运维数据仓库:本期项目,部署3台数据库服务

26、器,构建高可用集群,运维数据仓库组合多种数据库技术,实现多台数据库服务器的数据同步和负载均衡,确保系统处理性能和数据的安全性。运维门户:部署2台web服务器,通过负载均衡构建高可用负载均衡集群。各部署模块间不存在运行时冲突,因此,在项目建设一期,可以考虑将集成接口平台、运维数据仓库和数据处理平台实现多组件的合并部署。软件平台功能可视化IT系统关系管理功能概述在日常运维管理中,不同角色的运维人员管理着不同的资源对象,面对不同的管理场景,相应的也有不同的可视化需求。运维管理平台提供了三种可视化的运维管理场景:IT架构和流程管理、数据中心管理、地理信息管理,满足不同运维人员的可视化管理需求。IT架构

27、和流程管理运维管理平台为应用管理员、系统管理员、网络管理员提供了IT架构和流程可视化管理场景,直观的呈现业务交易、应用架构、系统架构、网络拓扑等复杂的IT环境,为日常运维提供准确、清晰的作战地图。业务交易可视化管理可视化内容:从业务处理视角,展示业务的端到端处理过程,实现业务交易流的可视化管理。管理功能:为业务部门和IT管理人员提供统一的业务运行实时信息,提供交易监控可视化、业务指标可视化、交易路径及交易拓扑管理,以及运行异常时的业务影响范围的可视化分析和故障组件定位功能。业务交易可视化应用架构可视化管理可视化内容:从应用集成和组件视角,展现应用系统间的数据集成关系以及应用系统内部组件的架构情

28、况。管理功能:实现应用系统集成关系的可视化管理,实时监控各集成接口和内部组件的运行状态。当应用接口或组件出现问题时,可直观反应对业务的影响范围和可能的故障根源。应用系统组件架构可视化系统架构可视化管理可视化内容:从服务器视角,展示应用中服务器和网络设备的部署架构。管理功能:提供以应用系统为单位的管理视图,支撑应用系统部署架构可视化,及部署环境中的中间件、数据库、应用程序等组件实例可视化管理,提供实时监控,报警关联及可视化分析等功能。应用系统架构可视化 物理机与虚拟机可视化 存储拓扑可视化 网络拓扑可视化管理:可视化内容:从网络管理视角,展示IT环境中网络设备间的连接关系。管理功能:支撑网络设备

29、的可视化管理, 提供实时监控,报警关联及可视化分析等功能。网络拓扑可视化IT端到端架构可视化管理可视化内容:利用组合视图功能,可以将多个2D平面视图组合成一个3D端到端IT全景视图。管理功能:辅助业务影响分析和根源故障诊断。数据中心管理利用3D实时互动引擎技术,数据中心管理系统为机房管理员形象再现数据中心内的多样化资产,降低了机房管理员进行设备定位、容量规划、配置管理的难度,加快了响应速度,缩短了处理时间。资产可视化管理:可视化内容:以3D方式展示资产的物理位置。管理功能:可通过关键字搜索快速定位资产,并可以查看资产的配置信息。容量可视化管理:可视化内容:展示机房和机柜的空间、承重、电力利用率

30、情况。管理功能:提供机房容量报告能力,可根据设备的U高、重量和功率,实时计算机房和机柜的空间、承重、电力利用率。提供机房容量规划能力,可按容量需求查询符合条件的机柜空间。机房环控可视化管理:可视化内容:与机房环控系统集成,实时展示PDU、UPS和空调的电流电压情况,以及机房的温度云图。可以与门禁系统和监控视频系统集成,展示机房的进出记录和监控视频。管理功能:能够按时间回溯机房的温湿度变化情况,实现机房环境的可视化管理。地理信息可视化管理为业务和应用管理员提供了基于地理位置的业务量统计、分析视图。能够清晰展示不同省市的销售量和交易量情况。当IT基础设施发生故障时,可通过地理信息视图,快速分析业务

31、影响程度和影响范围。流程可视化管理变更过程管理将变更整个过程进行有效管理,从变更申请、变更构建、变更审批、变更实施到最后的变更结束进行统一可视,实时了解相关变更进度,与所变更组件对系统的影响关系。应急场景管理针对日常应急场景进行汇总,并在出现故障时启动应急场景视图,使运维人员清楚了解,应急每个时间段所需要步骤,并调出协同编辑平台中相关故障系统的信息。运维管理视图运维管理场景功能为运维人员提供了基本的可视化的管理场景。将可视化管理场景与实时的运维管理信息结合,能够在管理场景中实现多维度数据分析、展示以及自动化操控能力,大幅提升运维管理人员的工作效率。监控仪表盘将监控信息接入可视化管理场景,能够直

32、接在视图中查看管理对象的监控仪表盘。报警事件控制台将事件信息接入可视化管理场景,能够直接在视图中查看管理对象的告警事件。通过报警事件控制台,可以对事件做进一步处理,如,确认事件、关闭事件、事件升降级、告警通知等操作。多维度信息面板在架构图中以多维度信息面板形式展示来自流程、监控、自动化等多种管理工具的数据,全面展示管理对象的管理现状和运行状态,帮助运维人员及时发现管理漏洞、快速识别风险和处理故障。自动化操控面板在各种可视化管理场景中,可以直接调用后端自动化操控工具,提升运维人员的操控效率。运维分析视图对象定位在3D可视化场景中,能够快速定位服务器或网络设备在机房中的物理位置。报警和状态标识能够

33、以不同的颜色标识对象的报警状态。实时指标通过“仪表盘”展现管理对象的实时监控指标。容量统计通过与监控系统集成,在管理视图中实时展现应用系统的性能容量情况。综合搜索可视化平台提供综合搜索能力,不但能基于配置项的属性进行模糊检索,还能够按可视化运维场景名称检索。用户运维桌面运维管理门户为用户提供自定义运维桌面的能力协同编辑和视图管理功能概述uITA视图管理平台为用户提供统一的在线协同工作平台,实现管理对象的配置数据、视图数据、运维数据等多维度信息的综合呈现及管理。配置数据,直接对配置对象信息进行管理的同时,可自行设置对象显示效果样式,以及对象延伸实现链接关联、视图关联、遍历关联对象。视图数据,具备

34、常规视图编辑管理能力的同时,还可实现背景图设置、多种模式切换、多种自动布局设置、多种导出存档功能,并提供一系列画图辅助工具。运维数据,通过相关接口获取视图对象相关运维数据,在视图上进行关联展示。功能模块协同编辑和视图管理主要涵盖在线编辑、视图和场景管理、视图关联和组合管理,以及视图模板和自动视图管理几大功能模块。在线编辑:是协同编辑和视图管理的基础模块,基于图标库、一系列对象级菜单和视图级菜单功能可同时针对配置对象和非配置对象进行在线视图绘制。视图和场景管理:针对绘制完毕的视图按场景定义的视图架构树统一进行管理,以实现进一步的视图数据消费。视图关联和组合管理:基于视图对象可进一步建立视图间关联

35、关系,或将相关联的视图进行组合管理。视图模板和自动视图管理:基于配置库中存在的配置对象及关系数据,可通过遍历查询,并通过将层级、分类、关系等模板化,自动生成视图,通过选定相关对象,在场景画布中实现数据驱动的自动关系视图。在线编辑在线编辑提供一套可自定义图标库,供视图编辑使用,用户可通过后台配置数据、自定义对象数据进行IT架构和管理视图的在线绘制,并可以实现对操作结果的保存和展现效果设置。在线协作管理架构图纸针对传统的离线架构图分散管理、无法检索浏览、无法协作编辑维护等薄弱点,在线协作功能旨在将分散在各团队的离线架构视图汇聚在统一管理平台,并实现灵活的发布和分享:线下转线上:不同于线下视图的维护

36、难度,在线维护可实现协同工作并一定程度上确保视图的实时性。版本回溯:在线编辑视图可实现版本记录,在需要时可选择性版本回溯。发布共享:在线编辑视图完成后,可保存发布、实现共享降低团队间信息壁垒。视图和场景管理视图和场景管理为用户提供统一视图管理界面:直接在视图管理导航栏中可以进行视图架构树和视图常规管理。选择指定视图,在右侧画布区域可以对视图和视图对象进行设置调整。视图管理和发布对于绘制完毕的视图可依据场景,定义视图分类架构,实现分级视图管理,并提供个人私有视图,和公共视图发布等功能。展现模式切换默认视图展示为图标视图,图标下显示图标对象名称。可依据需要进行视图、标签、表格三种视图数据查看模式间

37、进行切换,满足效果及功能的多样性。对象定位和路径查询通常在较为复杂技术架构视图中,可通过对象定位和路径查询功能来查询高亮定位管理对象及其相关关系连线,以及高亮显示管理对象之间的最优关联关系路径。视图关联和组合管理基于视图对象可进一步建立视图间关联关系实现视图钻取,或将相关联的视图进行组合展现管理,以获得系统全面地可视化呈现体验。逐层关联视图各层次技术架构图或关联子视图可通过“添加关联视图”功能实现视图间的关联,支持跨层次技术架构的钻取操作。实现层次性的技术架构、系统性地管理和数据关联性消费。组合视图管理组合视图由关联视图组成综合关联视图,可实现2D模式下视图切换查看,或3D模式下拖动查看、并可

38、开启监控模式作为日常运维界面。视图模板和自动视图管理针对配置库对象关系数据,可通过遍历查询按层级、分类、关系类型模板化生成视图,或将相关对象拖动到画布实现数据驱动生成关系视图。遍历关联生成视图选择一个起点对象,设置需要遍历的方向层级数量、分类对象、关系类型自动生成所需关联架构视图。由数据驱动生成视图通过管理数据和可视化模板,将对应关系对象拖动到画布中实现批量自动生成视图,减轻人工工作量。可视化引擎功能概述可视化引擎支持更多的弹性数据展示效果,并且通过规范图形库,以互动的方式丰富运维数据分析的展示结果。可视化元素管理对于视图绘制提供丰富的图形元素,包括业务、应用、系统、网络等IT管理元素清晰简洁

39、图标、图标文字、对象间连线、通用图形进行标准化定制管理。图标库管理图标库为视图编辑提供视图图标元素,图标库包含三部分:配置图标:设置一套配置分类对象默认图标,用户可在后台管理对图标进行增删改查。自定义图标:用户自定义上传的图标元素,可以是svg、jpg、png、gif格式的图形文件。通用图形: 系统默认提供的一套日常通用的图形,可在基础图形的基础上进行样式的重设置。视觉元素管理提供对系统中所展现的可视元素进行维护,包括图标、连线、字体等对象的样式,提供如下选择设置:填充颜色、字体颜色、边框颜色、边框宽度、阴影作用于通用图形图标,字体大小、字体名称、透明度、图标修改作用于所有图标库对象。自动布局

40、引擎提供对选中视图如下布局的一键布局调整:横向布局、纵向布局、有机布局、圆形布局、垂直堆栈、水平堆栈布局方式。2D/3D渲染引擎拥有自开发的图形渲染引擎T3D。T3D全称Treasure 3D,是一款三维浏览器插件,它综合了游戏技术、虚拟现实技术、浏览器插件技术等,以Javascript为接口,提供简单高效的框架和丰富的模型库,具有类似WebGL的使用特点,但又提供较高层次的对象封装,目标是快速开发三维Web应用。目前已用于数据中心可视化、化工厂可视化、消防预案可视化、产品展示等领域。同时,通过组合业界领先的2D/3D页面渲染技术,形成了一套以T3D为核心的渲染引擎体系,形成IT可视化管理平台

41、的基础。综合搜索提供综合搜索接口,跨层次跨系统搜索视图、管理对象信息和所关联的技术架构视图。基于运维管理库基础信息,能够实现管理对象相关配置信息、告警事件、监控指标等日常运维信息的统一呈现。可视化场景调用接口对于发布后的视图可通过获取的URL地址、直接进行外部访问查看对应视图的实时监控状态,作为订阅运维视图。 告警事件处理平台功能概述告警事件是运维过程的关键信息,告警事件处理保证系统出现异常时,快速发现、通知相关人员,并辅助其快速评估故障影响,定位故障根源,以尽快恢复故障,降低或消除影响。事件处理平台,负责处理由事件发生至关闭的整个生命周期管理,为运维人员提供统一的事件管理平台,接收和处理来自

42、分散的监控事件源的各类事件。同时,内置专业的自动化分析处理引擎,提供事件合规性检查、丰富和标准化、过滤和屏蔽、重复压制、自动通知、升降级、关联分析、自动开单、自动修复、转发和清除等实时处理能力,以及周期性的跟踪事件状态,通过规则定义触发自动化操作。功能模块事件处理平台从数据集成平台实时获取由事件源产生的事件,经过实时处理后,统一存储至运维数据仓库中,并定根据规则对运维数据仓库中的事件数据进行自动化分析处理,并与外部运维工具实现接口整合,根据策略或人为触发运维工具动作,达到一体化运维的目标。告警事件处理平台由事件预处理和缓存、事件处理引擎、事件控制台和系统管理4个模块组成。事件预处理和缓存:负责

43、事件接入处理,将外部数据源事件转化为运维管理平台告警模型,并通过实时缓存实现高性能的接入整合。事件处理引擎:是事件处理平台的核心模块,提供可定义的处理规则引擎和处理流程引擎,对进入事件管理平台的事件执行实时和周期性的事件自动化处理。事件控制台:面向系统用户,提供事件基本操作、分析处理、个性化定制等能力。系统管理:面向系统管理员,提供事件分类和指标管理、监控配置管理、外部接口管理、事件处理策略管理、用户及安全管理、用户视图管理,数据结构和字典管理等功能。事件处理引擎事件处理引擎是事件处理平台的核心,提供了可配置的完备的事件处理功能,实时处理从事件源接收到的事件,同时也提供定时事件处理规则功能。包

44、括:处理规则说明实现事件标准化通过映射表定义,标准化事件字段内容,关键字段包括严重级别、对象标识、指标标识等,如严重级别映射,从netcool”CRITICAL“到”紧急“(统一级别、对象、指标标识等)事件标准化程序通过事件字段和相关数据字典进行匹配和映射,各事件源与集中事件管理平台建立映射字典表。事件预过滤在入库前实现对事件的预过滤通过过滤规则定义,将不符合格式等基本要求的事件过滤,存入错误日志归档。基于事件策略定义,符合过滤条件的事件入历史归档。事件内容丰富在接收到的原始事件内容基础上,增加相关的数据字段信息通过关联外部数据源,主要是配置信息表和监控指标信息表,获取事件所属部门、人员、应用

45、,以及指标详细说明等内容,完成预处理阶段的事件内容丰富事件压缩同一事件的重复发生时,将新发生的事件压缩,避免重复报警根据事件策略定义,自动完成特定事件的特定压缩标示填充,对于同样压缩标示的事件进行压缩处理,重复事件将不产生新记录,根据规则,更新部分事件字段,并累加计数器维护期压制(事件压制)对于特定时段的特定事件进行压制,避免无效报警根据事件策略定义,在特定情况下(包含变更维护期管理),自动更新事件压制标示,在后续事件通知和自动处理动作中,忽略压制事件,入历史归档,提供回溯功能事件压制对入库后的事件进行压制操作事件适配器根据事件策略定义,在特定情况下(包含变更维护期管理),自动更新事件压制标示

46、,事件引擎会根据该标示,将新入库事件入历史归档,提供回溯功能事件通知将符合事件通知条件的自动通知给管理员或者值班团队事件处理引擎初始化时载入通知规则表以及联系人信息,通过规则定义,将符合通知条件的事件,按照约定报文格式发送给通信平台。事件升降级在事件入库时,或事件存在特定时间段后,仍未处理的情况下触发自动升降级操作事件升降级操作由事件实时库和事件处理引擎共同完成,新入库事件会直接由事件处理引擎完成升降级操作。对于需要在事件入库后一段时间才触发的操作,由事件实时库的触发器发出处理信号完成处理。事件自动恢复接收来自监控数据源或外部工具的事件状态更新,并实时完成事件恢复或更新操作根据事件策略定义,对

47、于特定事件标示或序列号的事件执行状态更新消息所指示的恢复或更新操作维护期恢复维护期结束时触发自动化恢复动作,将仍然存在的告警恢复并触发相应处理流程维护期定义结束时,定义时间信号触发器,由单一事件处理引擎接收触发信号,根据事件策略定义,对于在维护期中被压制的特定事件,如模拟交易、轮询指标等周期性采集指标,如果仍然未恢复到正常状态,则产生报警供触发正常处理流程事件关联分析对于在同一时间窗口发生的各类报警事件,自动区分根源事件和表象事件。事件处理引擎与业务影响分析平台整合,将入库后的事件实时发送给业务影响分析接口,并接收来自业务影响分析平台回复的分析结果,存储在事件关联关系表中。自动工单特定事件自动

48、生成事件流程工单根据事件策略定义,对于符合自动工单条件的特定事件执行自动建单操作,获取事件的必填字段,通过外部集成接口发送给流程管理平台。自动化运维特定事件触发相应的自动化运维场景根据事件策略定义,对于符合自动化场景定义的特定事件执行自动化动作,获取事件的必填字段,通过外部集成接口发送给外部的自动化运维工具。事件控制台事件控制台为最终用户提供统一的事件管理界面,根据不同团队、不同角色和管理权限的用户,提供相应的事件列表及管理视图,以完成事件监控、查询、分析、通知、自动操作等处理。事件列表事件列表提供对事件的查看、确认、关闭等基本操作。在统一事件列表中可查看来自各个事件源的事件信息,统一编码等。

49、不同的运维团队查看不同范围的事件,同时,可以灵活定义视图,显示关注的信息。列表中的事件在监控模式下,根据配置的时间间隔进行自动刷新,通过停止刷新操作,进入处理模式。事件搜索事件控制台提供了人性化的多维度模糊搜索功能,用户可以直接搜索关注的事件,进行处理。用户视图用户可根据需要定义符合使用习惯和场景的事件视图。热点事件关注事件的分组排行以及各类事件所占的比例。事件操作对于选中的事件,可以选择“详细信息”,“确认事件”,“关闭事件”,“导出事件”等基本功能,“业务影响分析”,“故障根源诊断”,“知识库查询”等分析诊断功能,以及“自动化调用”,“创建工单”等处理功能。事件详细信息查看:选中单个事件,

50、可以查看该事件的详细信息。事件确认和关闭:对事件执行确认和关闭操作。事件分析:分析报警事件对于系统运行的各项指标的影响程度,以及该报警的关联对象和关联指标。知识库查询:事件管理控制台可以以监控指标编码为关键字,与知识管理平台里的知识条目关联检索。事件通知:将告警事件通过短信、邮件等发送给相应的处理人员。事件工单:事件管理平台具备与工单系统的集成接口,可以半自动或自动的生成流程平台事件工单。自动化操作:事件管理平台具备外部工具的集成接口,调用外部工具执行动作。事件处理策略管理系统管理模块为系统管理员提供完善的事件分类和指标管理、监控配置管理、外部接口管理、事件处理策略管理、用户及安全管理、用户视

51、图管理,数据结构和字典管理等功能。其中,事件处理策略管理为用户及系统管理员提供了图形化的设置方式,可根据需要实现自助式的处理策略设置。用户可灵活定义一组事件的组合,并触发相应的处理动作,包括:事件标准化策略:通过映射表定义,标准化事件字段内容,关键字段包括严重级别、对象标识、指标标识等。事件丰富策略:在接收到的原始事件内容基础上,增加相关的数据字段信息。事件过滤策略:在入库前实现对事件的预过滤,对入库后的事件进行压制操作。事件维护期管理:对于特定时段的特定事件进行压制,避免无效报警;维护期结束时触发自动化恢复动作,将仍然存在的告警恢复并触发相应处理流程。事件压缩策略:对于重复发生的事件进行压缩

52、。事件升降级策略:在事件入库时,或事件存在特定时间段后,仍未处理的情况下触发自动升降级操作。事件关联策略:对于在同一时间窗口发生的各类报警事件,自动分析关联关系。事件通知策略:将符合事件通知条件的自动通知给管理员或者值班团队。自动工单策略:特定事件自动生成事件流程工单。事件自动化处理策略:特定事件触发相应的自动化运维场景。事件恢复策略:接收来自监控数据源或外部工具的事件状态更新,并实时完成事件恢复或更新操作。事件清除策略:定期清除事件库中符合条件的事件。影响分析和根源诊断告警事件处理平台,将IT软硬件组件故障与业务服务联系起来,建立起IT组件的性能、容量和可用性监控指标与业务的性能、可用性的关

53、联关系,当监控系统监测到报警事件后,自动分析:发生报警的IT 组件是什么,对相关的IT组件的影响范围和程度是什么;发生报警的IT组件对所支持的业务服务、业务用户的影响范围和量化指标变化比例;当多个IT组件都发生报警时,根源组件是什么;当多个报警事件发生时,根源报警事件是什么。业务影响分析过程分为以下5个处理阶段:阶段说明1事件关联业务影响和故障诊断功能模块针对标准化的事件(包含了统一的对象标示(CI_ID)和指标标示(KPI_ID)进行实时分析。2对象关联根据对象标示(CI_ID),将告警事件与业务影响模型包含的管理对象相关联,根据告警事件级别推算出对象状态。3状态传递基于业务影响模型中反映的

54、影响依赖关系、方向和权重,将新发生事件的对象状态传递给所影响的关联对象。4业务影响分析对受到影响的业务交易和应用对象,从业务和应用监控平台获取该对象的实时监控指标信息和基线信息,并计算影响差距,同时可视化的呈现在业务影响分析平台界面。5事件根源诊断根据对象和指标双维度的关联关系,对新发生的事件,根据所关联的上下层对象,判断上层影响对象的事件是否为表象事件并标注;判断下层根源对象的事件是否为根源事件并标注。同时在事件关联表中,添加事件关联关系。整个过程由集中监控平台触发,依赖两个核心数据模型和一个集成监控数据源:模型说明1业务影响对象模型业务影响模型描述了监控对象之间的关联影响关系,将业务对象和

55、IT组件通过影响关系连接起来形成分层的网状模型,目的是支持业务影响分析平台进行影响状态传递运算,该模型描述了业务对象和IT组件对象,以及对象之间影响关系。包含对象和关系两类数据,其中对象标示与集中监控平台一致;关系数据仅反映影响关系,包括影响方向、权重、算法信息。数据源为配置管理数据库信息、应用交易监控信息、手工梳理模型信息等,数据存储为图形数据库形式,支持高效的遍历和寻路接口。2监控指标关联模型监控指标关联规则描述了告警指标与告警指标之间的关联关系,目的是支持监控事件关联和二次过滤。监控指标关联规则基于集中监控平台的监控指标信息,以监控指标为关联对象,积累已知的、确定的关联规则,并不断扩展,

56、该关联规则主要以关联对象类及其直接关联对象类的监控指标合集为分析范围,为避免错误过滤,不支持两层以上跨层事件关联。监控指标关联规则以人工梳理为主,梳理面向特定的监控场景,在初始化阶段会由专业团队分析监控事件指标,并根据历史事件进行验证。3应用和交易监控数据应用和交易监控是与业务关系最密切的监控系统,提供了分客户(分行视图)、分渠道(发送点视图)、分业务类型(交易码视图)的交易量、业务成功率、系统成功率、响应时间、长交易数量等监控信息。当业务影响分析判断某个业务对象受影响后,将从外部系统集成应用和交易监控实时信息和基线信息。可视化告警分析端到端告警视图业务/交易监控视图从业务服务开始,梳理数据中

57、心业务系统对外的IT服务提供渠道,以及支撑业务运转的后台接口系统,形成业务的交易全景图,识别在全景图中各条线的关键业务系统,形成系统间的影响分析框架。应用监控视图在交易全景图的基础上,针对应用系统进行拆分解构,理清数据中心应用系统的应用组件及关联关系,在应用系统内部,完成交易流向的梳理。系统监控视图由应用组件逐层开始向下查找支撑IT组件,将支撑应用组件运行的各类软件实例依照其高可用集群关系组织,完成软件环境的依赖关系搭建。基础设施监控视图完成业务和应用层面的梳理后,可视化管理模型继续向IT层扩展,依次完成系统平台层的配置识别和管理,以及存储、网络、服务器,以及物理硬件等IT基础设施的组件识别和

58、关系梳理。围绕业务服务的,建立起跨系统,并关联软硬件基础设施环境的立体层次模型。故障树分析通过对象间的关联关系,针对一个报警对象,自动生成故障根源树。熟悉系统:要详细了解系统状态及各种参数,绘出工艺流程图或布置图。调查事故:收集事故案例,进行事故统计,设想给定系统可能发生的事故。确定顶上事件:要分析的对象即为顶上事件。对所调查的事故进行全面分析,从中找出后果严重且较易发生的事故作为顶上事件。确定目标值:根据经验教训和事故案例,经统计分析后,求解事故发生的概率(频率),以此作为要控制的事故目标值。调查原因事件:调查与事故有关的所有原因事件和各种因素。画出故障树:从顶上事件起,逐级找出直接原因的事

59、件,直至所要分析的深度,按其逻辑关系,画出故障树。分析:按故障树结构进行简化,确定各基本事件的结构重要度。运维数据整合管理功能概述可视化数据仓库产品uVMDB,针对运维过程中多类型多维度的海量数据,利用适合不同管理场景的数据仓库技术组合,实现高性能、高可靠性、高扩展性的运维数据仓库解决方案,集成来自不同运维管理工具的静态配置数据和动态过程数据,通过IT管理对象实现多维度运维信息的融合,并形成统一的数据消费平台为各类运维场景提供数据支撑。功能模块运维数据仓库由主数据管理、运维数据管理、数据引擎和数据接口四部分组成:主数据管理:负责管理配置信息、监控指标、用户场景等描述数据,实现对IT系统的整体数

60、字化描述,通过主数据可以获取管理对象全景、多维度管理配置、运维用户以及特定管理场景等基础运维信息,是运维数据仓库的基础。运维数据管理:存储IT环境产生的实时和历史运维数据,并实现与主数据的映射,运维数据包括动态变化的监控、告警、流程工单、运维操作等多维度的信息,综合描述IT环境的运行状态。数据引擎:实现运维数据与主数据的映射和自动发现,同时,提供针对原始数据的配置分析、指标分析以及事件分析的处理功能,并将分析处理结果存储至运维数据仓库。数据接口:接收来自集成平台、数据处理平台的运维数据,并提供面向最终用户的数据管理接口,实现对数据的管理。同时,向运维平台管理门户以及其他外部系统提供高性能的数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论