机房DCIM方案_第1页
机房DCIM方案_第2页
机房DCIM方案_第3页
机房DCIM方案_第4页
机房DCIM方案_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据中心基础设施监控管理(DCIM)解决方案V1.02015年06月12日 / 目 录第1章项目概述31.1.项目背景31.2.需求分析41.3.项目目标4第2章系统设计52.1.设计概述52.2.设计依据52.3.系统关键参数62.4.系统架构72.4.1.物理架构72.4.2.功能架构8第3章DCIM系统亮点10第4章DCIM系统功能114.1.个人工作台114.2.基础设施监控子系统114.2.1.可监控的设备114.2.2.设备展示功能184.2.3.告警功能194.3.能效管理子系统214.3.1.能效展示224.3.2.能耗分析244.3.3.能效控制264.4.资产管理子系统264.4.1.仓库资产管理274.4.2.在架资产管理284.4.3.办公资产管理284.4.4.资产维保信息管理294.4.5.其他资产相关功能294.4.6.U位检测系统布署预留294.5.容量管理子系统294.5.1.容量建模294.5.2.容量展示304.5.3.容量预分配304.5.4.趋势分析314.6.变更管理子系统314.6.1.流程逻辑说明314.6.2.变更流程控制324.6.3.变更风险控制324.6.4.变更数据管理324.7.可用性管理子系统324.8.报表管理334.8.1.预定义常用报表报告模板334.8.2.自定义报表报告模板功能334.8.3.报表报告管理33第5章客户收益345.1.基础设施监控回报345.2.能效管理回报345.3.资产管理回报355.4.容量管理回报35第6章应用场景举例376.1.统一监测376.2.报警定位:复杂事件分析CEP376.3.节能:幽灵服务发现376.4.批量资产预占与上架376.5.资产盘点386.6.功耗控制与容量优化38第1章 项目概述1.1. 项目背景在当前高速信息化发展的时代背景下,数据中心是整个社会信息化的基础。数据中心础设施直接影响了数据中心安全、高效、环保、稳定的运行。如何维护好机房,及时发现隐患和排除故障,降低管理成本,提高运维效率,控制机房能耗,成为管理者关注的重点。对机房管理者来说,存在下列痛点:管理效率低投产后的数据中心最关注的是稳定和高效,稳定与管理团队的日常运维相关,高效与科学化的监控管理系统相关,此中包含的三要素就是:数据中心监控管理系统管理团队。由此可知,监控管理系统相当于数据中心和管理团队之间的纽带,管理人员通过监控管理系统去感知数据中心的各项指标参数正常与否,结合数据调整运维流程,应对突发事件。目前,绝大多数数据中心投入使用的监控管理系统繁多复杂,且各系统间的相互独立造成信息孤岛;另一方面,现有的许多监控管理系统自动化、智能化程度不够,造成日常运维管理对人力依赖大。资产难管理数据中心管理诸多管理工作中,涉及IT资产上架、下架、维护、盘点等工作十分头疼。现有对IT资产的管理主要是依靠人工+简单系统统计来实现,例如定期对在架的资产盘点,在缺乏智能资产管理系统的状态下,处理这些工作对人手依赖程度高,工作内容简单重复,很难保证操作与记录的准确性,导致账实不符。容量利用率低数据中心的配电容量、制冷容量、机柜U位容量决定了该数据中心的计算能力。在缺乏有效的管理工具的状况下,IT设备部署需求与数据中心容量实际供给情况难以匹配,导致基础设施容量实际利用率低。据Gatener,90%以上的数据中心容量利用率不到70%。故障定位难数据中心管理人员对监控系统的核心关注点在于告警准确性,但实际上因为数据中心本身复杂性高,当一台设备出现故障时,经常引发并发告警。因此,在基础设施的管理层面,必须依靠监控系统来精准定位故障,以确保管理人员第一时间知道后迅速处理恢复。鉴于以上数据中心管理者所面临的各种痛点,应当采用一套可将:基础设施、资产、容量、日常运维、机房安全性作出统一管理的系统。数据中心基础设施管理(DCIM)系统就应运而生,亦是当前数据中心行业发展的必然趋势。共济DCIM定义如下:通过监控、分析数据中心基础设施的运行信息(如状态、参数、配置等),帮助数据中心管理者掌握数据中心基础设施运行情况(当前与趋势),管理数据中心资产、基础设施资源(空间、电力、冷量等)、能耗,提高基础设施可用性、资源利用率、管理效率与能效。1.2. 需求分析据与用户初步交流,此次机房改造,需完成如下工作:1、 集成原有动环监控系统;2、 新增xxx节蓄电池监测、x台UPS监控;3、 增加移动巡检系统、资产管理、容量管理等管理功能;4、 全部子系统接入DCIM系统,通过DCIM平台对各子系统进行的统一管理。1.3. 项目目标为机房布署数据中心基础设施管理系统。实现以下目标:1) 实现数据中心基础设施集中监控,全面直观展示数据中心基础设施运行状态,精准定位故障,分析预防故障。2) 实现数据中心资产全生命周期智能管理,给客户提供面向企业内部统一的资产管理平台。3) 提供机房实物资产自动化盘点工具,并为机房容量管理、配置管理等IT服务管理提供数据接口,协助管理员高效运维机房业务。第2章 系统设计2.1. 设计概述DCIM系统通过统一的操作平台和统一的通信平台,完成对动力系统(供配电系统)、环境系统、安防系统(包括视频监控系统、红外报警系统)各子系统无缝数据集成,实时获取各子系统监控数据,通过对各子系统监控数据处理、分析及逻辑判断,实现上述各子系统的集中视图、集中监控、集中告警、集中数据分析和统一运维管理。对于各子系统集成,采用分布式部署、分散控制原则通过分布式部署系统采集网关,完成各子系统数据采集和分散控制交互,从而达到子系统之间的数据无阻塞交互、各子系统之间实现互通互联。DCIM系统作为开放式信息交互平台,能够采用多种方式实现不同子系统厂商产品的信息接入及功能集成,如采用OPC、SDK、Webservice、Socket等多种方式。针对机房内分散、相对独立的系统,通过独立部署系统采集网关的方式经由运维网络实现各系统之间的互联互通。所有信息汇聚至DCIM系统,DCIM系统对外提供B/S分布式远程访问,在运维网络的任意一台工作站上,运维人员均可采用B/S方式对自身授权范围内的子系统系统进行实时操作。整体操控界面采用组态方式,提供多种展示工具,实现动态图形、文字、图像相结合,满足运维人员的查看、查询及管理需要。DCIM系统通过系统网关完成各子系统之间的协议对接、标准协议转换、数据转换,实现综合监控系统与各子系统间的通讯联网和数据交互。2.2. 设计依据电子信息系统机房设计规范(GB 50174-2008)电子信息系统机房施工及验收规范(GB50462-2008)电子计算机场地通用规范(GB/T 2887-2000)数据中心基础设施监控白皮书数据中心基础设施管理白皮书综合布线系统工程设计规范(GB50311-2007)供配电系统设计规范(GB 50052-2009)2.3. 系统关键参数参数类型参数说明容量单台服务器50万测点并发访问200个用户数量大于5000报警数据采集小于6秒命令下发控制小于5秒变化数据采集小于6秒页面响应速度小于1秒在架资产盘点小于10秒运行网络环境内部网络不低于百兆带宽;如需外网方位,需VPN网络做安全控制运行服务器环境不低于如下配置:CPU:Intel Core I5以上内存:8G以上硬盘:1T以上操作系统:CentOS 6.42.4. 系统架构2.4.1. 物理架构 DCIM系统物理架构图 数据采集处理层数据采集处理层设计为系统的数据入口,是系统管理所需基础设施数据的来源,其通过提供标准接口及协议,接收原有的监控控系统、新增的资产容量系统以及蓄电池检测系统的监控数据。 管理服务层管理服务层以下服务:基础设施监控服务、能效管理服务、资产管理服务、容量管理服务、告警告知服务、移动巡检管理服务。通过对采集数据进行二次计算,形成上层管理所需的数据。随着数据中心管理成熟度的提高,增加功能模块扩展方式拓展运维管理功能,易满足数据中心管理需要,系统支持拓展增加工单管理等模块。管理服务层相当于发布各种监视和管理的核心层,作为数据采集层和展示层之间的关键环节,“DCIM系统”是发布上述服务功能的核心。 展示层展示层提供丰富的展示媒介,包括手机终端、PC浏览器等;提供2D/3D展示效果;提供友好的用户界面。随着应用设备的发展,根据应用需要,在应用层增加展示应用模块。2.4.2. 系统性能(1) 测点容量:DCIM系统数据处理容量最大500,000点;(2) 系统中断自恢复:当系统因供电及其他意外非正常中断运行时,系统将从软、硬件两个方面进行自动恢复,即服务器立即重新启动,软件自动启动运行;(3) 系统架构:系统采用分布式、模块化架构;数据的采集、传输、处理相互独立,互不干扰;具有热插拔和主设备倒换功能,技术成熟,运行稳定可靠;(4) IE客户端:最大支持200个IE客户端并发访问;(5) 移动客户端:最大支持50个移动客户端并发访问;(6) 报警数据采集周期:小于5s;(7) 命令下发控制:小于5s;(8) 变化数据采集:小于4s;(9) 页面响应速度:小于4s(远程监控刷新时间);(10) 报警方式:支持页面报警、电话报警、短信报警(短信网关)、语音报警;(11) 告警发出:小于20s;(12) 数据管理:运行状态、报警信息、系统日志全部记入数据库,可通过数据管理查询。DCIM系统实时、准确的显示所有监控信息,系统采样时间由管理人员设定。2.4.3. 功能架构系统采用模块化的架构进行设计,确保系统的稳定可靠运行,任何模块出现故障不会影响同级别的其他模块的正常工作;系统采用分布式系统架构,确保系统后续的扩容能力和系统反应速度。DCIM系统基于网络分布式部署,运维网络内的任意一台或多台集成工作站,运维人员权限相同时,系统将以相同的界面操作,管理整个机房权限范围内的子系统,并具备授权的所有操作功能。当需要增加监控工作站时,可在机房区内的任何地方的运维网上增加网络点、工作站即可,通过系统提供的B/S方式进行管理,以最大限度保护投资,完成监控功能。第3章 DCIM系统亮点1) 监控全覆盖,可视化展示基础设施实时状态2) 精细化微环境检测,监控每台IT设备的进风温度3) 复杂事件分析处理,准确定位故障;大数据分析,智能预警4) 资产自动检测,线下资产变更,线上信息自动更新5) U位级资产定位,资产部署维护准确高效6) 在架资产实时盘点,及时提交准确报表7) 数据中心全方位资产生命周期管理,资产说得清、管得住8) 可视化容量管理,直观展示容量使用情况及趋势分析,扩容决策及时准确9) 批量设备预占快速匹配,多套精细部署方案,减少容量碎片10) 设备部署合理,平衡各维度容量综合利用率,避免单项容量短板11) 精细化能效管理,监控每台耗电设备能耗,能效指标计算与对标12) 内置能效分析工具,多维度进行能效数据分析13) 提供多种节能控制方案,包含手动控制和自动控制14) 节能方案进度跟踪,节能效果验证,输出节能报告15) 变更活动统一规范管理,变更风险管控,降低变更带给业务的影响16) 基础设施可用性实地建模,精确计算可用性变化,实时掌握可用性状况17) 准确提供灾备系统迁移依据或启动数据中心应急预案18) 提供多维度运行分析报告,为运营决策提供数据支持第4章 DCIM系统功能4.1. 个人工作台共济数据中心基础实施监控管理系统可建立不同角色,不同角色拥有自己对应的个人工作台,在工作台中,显示自己关注或与自己相关的监控管理工作,以便只要打开DCIM客户端,就能立即查看自己所关心的、自己所要做的工作。不同的用户角色,不同的权限看到不同的内容,执行不同的操作。个人工作台会把和每个人相关的任务推送给他,也会把执行任务所需的信息和他所关注的信息推送给他。进入个人工作台就能够完成任务,当需要更多信息时才进入到各个模块中。基于对用户的管理,系统在展示界面中以“个人工作台”体现角色的分配,根据人员所处的“管理”、“决策”、“执行”层级自行定义用户的工作台界面。4.2. 基础设施监控子系统4.2.1. 可监控的设备本次机房DCIM系统监控的设备,只包括原有的动环里的设备,以及清单里面的设备。序号监控分类监控对象监控指标1动力监控低压进线总柜低压进线总柜:监测其三相电的相电压、线电压、相电流、频率、功率、电度参数,以及断路器的分/合状态;具有设备参数显示、故障波形捕捉、事件记录监控;监测其三相不平衡度、零地电压、谐波含量参数。ATS自动切换开关ATS自动切换开关:监测ATS设备的常用、备用电源线电压、频率参数,以及常用、备用电源的开/关状态。(ATS应自带通讯接口,同时需ATS厂商开放通讯协议)UPS输入配电柜UPS输入配电柜:监测其三相电的相电压、线电压、相电流、频率、功率、电度参数;监测断路器的分/合状态。低压配电柜低压配电柜:监测三相电的相电压、线电压、相电流、频率、功率、电度参数;监测断路器的开/合状态。UPS不间断电源UPS不间断电源:监测UPS三相输入电压,三相输入电流、输入功率、输入频率、三相输出电压、三相输出电流、输出功率、输出频率、电度、旁路电压、旁路电流参数,UPS输入、旁路、逆变器、整流器状态及电池充放电状态;宜监测电池后备时间参数。不对UPS进行控制。(UPS应自带通讯接口,同时需UPS厂商开放通讯协议)蓄电池组蓄电池组:监测蓄电池组总电压、单体电压、充放电电流以及单体表面温度参数;监测蓄电池单体内阻参数。UPS输出配电柜UPS输出配电柜:监测其三相电的相电压、线电压、相电流、频率、功率、电度参数;监测断路器的分/合状态。列头柜列头柜:监测其三相电的相电压、线电压、相电流、频率、功率、电度、各支路电流参数、各支路分/合状态以及断路器的分/合状态。(列头柜应自带通讯接口,同时需列头柜厂商开放通讯协议)柴油发电机柴油发电机:监测发电机三相输出电压,三相输出电流,输出频率,输出功率参数,以及其工作状态(运行、停机)、工作方式(自动、手动)、市电故障状态;宜监测其油罐的液位、润滑油油压、润滑油油温参数;宜监测发电机的转速、水温(水冷)、皮带断裂(风冷)、启动失败,过载状态。(发电机应自带通讯接口,同时需列头柜厂商开放通讯协议)PDUPDU电力分配单元:监测PDU主输入的电压、电流、功率、电度、各支路电流。(PDU应自带通讯接口,同时需PDU厂商开放通讯协议)STSSTS静态转换开关:监测输入、输出线电压,输入、输出相电流,频率,功率因数参数,以及双路电源的开/关状态。(STS应自带通讯接口,同时需STS厂商开放通讯协议)2环境监控精密空调精密空调:监测其开、关状态、送风温度/湿度、回风温度/湿度参数;控制其开、关机。(精密空调应自带通讯接口,同时需精密空调厂商开放通讯协议)普通空调普通空调:监测普通空调的开、关机状态,控制其开、关机、温度设置;实现来电自启动。新风机新风机:对机房的独立新风机进行监控;机房如与其他功能用房建于同一建筑内,并与其他功能用房共用新风系统,宜通过集成方式获取有关机房新风系统的监控数据;应监测新风机启/停、过滤网压差状态;宜控制新风机的启、停,同时确保新风机与压差的联动。温湿度温湿度:监测主机房内的温度值、湿度值;漏水漏水:监测机房内有水源区域的漏水状态,显示具体漏水位置。避雷防雷器:监测机房配电设备的各级防雷装置的工作状态。加湿器加湿器:监测加湿器的开、关机、工作状态,以及湿度参数,控制加湿器的开、关机。(加湿器应自带通讯接口,同时需加湿器厂商开放通讯协议)微环境系统微环境系统:监测机柜温湿度、机柜级电源、机柜烟雾、机柜门状态、机柜附近人员活动情况。3安防监控视频监控视频监控:包含视频探测、图像实时监视和有效记录、回放;对多路图像信号实时传输、切换显示,应能定时录像、报警自动录像,报警自动录像应包含预录像功能,对云台、镜头预置和遥控;显示、记录、回放的图像质量及信息保存时间应满足机房管理要求,每路视频存储时间应30天或以上。门禁门禁:监测主机房、支持区出入口的开/关状态,自动记录、存储各种刷卡、报警事件;系统应满足紧急逃生时人员疏散的相关要求,在紧急逃生时,能自动开门;对受控区域的位置、通行对象及通行时间等进行实时控制,能远程控制开关门。消防告警消防告警:监测消防告警主机的告警信号。防盗入侵防盗入侵:安装入侵探测设备,构成点、线、面、空间或其组合的入侵报警系统;显示和记录报警部位和有关警情数据,提供与其它子系统联动的控制接口信号。4IT设备监控服务器使用资产检测条:在架位置使用IT监测:实时功耗、进风温度、利用率、硬件错误报警(风扇故障)远程开关机、远程控制功耗交换机使用资产检测条:在架位置使用IT监测:实时功耗、进风温度存储设备使用资产检测条:在架位置使用IT监测:实时功耗、进风温度远程开关机、远程控制功耗5第三方系统集成消防系统消防系统:基础设施监控管理系统应通过集成方式获取消防系统的监控数据;监测消防系统的各种参数和报警事件,不对消防系统进行控制;消防系统提供集成接口及协议。高压变配电系统高压变配电系统:基础设施监控管理系统应通过集成方式获取高压变配电系统的监控数据;监测高压变配电系统内各种配电设备的参数、状态及报警事件,不进行控制;高压变配电系统提供集成接口及协议。配线系统配线系统:基础设施监控管理系统应通过集成方式获取楼宇自控系统的监控数据;展示配线路由,监测配线设备参数、状态及报警事件,不进行控制。配线系统提供接口及协议。楼宇自控系统楼宇自控系统:基础设施监控管理系统应通过集成方式获取楼宇自控系统的监控数据;监测楼宇自控系统内各种设备的参数、状态及报警事件,不进行控制;楼宇自控系统提供集成接口及协议。智能照明系统智能照明系统:基础设施监控管理系统应通过集成方式获取数据中心的智能照明系统监控数据;应监测智能照明系统的灯光状态;进行开关控制、场景切换、亮度调节及联动控制;智能照明系统应对第三方系统提供集成接口及协议。4.2.2. 设备展示功能在系统中可动态的展示机房内重要设备的关键参数,展示方式有2D和3D展示模式。 2D展示监控平台界面显示为全中文界面,采用图形化设计。界面的结构、层次清晰明了,页面风格可以按照用户需求进行定制,能够实时直观地显示设备的运行数据和运行状态。通过软件界面可直观的展示出机房内的情况,包括整体结构、空调、PMM柜、服务器机柜的摆放位置都要在图中体现出来。根据设备的种类分配每一个子系统,例如:电力子系统 通过一张电力拓扑图,能快速掌握机房的电力系统,并通过该拓扑图帮助电力运维工程师管理机房内电力设备,在日常运维中发现风险点,保障机房供电安全。 3D展示本次机房DCIM系统不包括3D展示。传统数据中心监控系统主要采用“示意图+图例+数据”的展示方式,随着数据中心的日益扩大和用户需求的不断提升,这种方式已无法满足大型数据中心群的展示需要。为提高数据中心群的客户体验,我们推出了一套可将数据中心平面监控转化为具有高度现场感、仿真感的立体监控系统。通过前期的建模,将现实的建筑和设备模拟成3D模型,并在模型中动态显示出设备的关键参数。4.2.3. 告警功能系统提供灵活多变的告警管理功能: 报警机制:系统对报警事件按优先级的高低进行处理,并具备过滤机制。 报警方式:灵活多样,可以根据报警事件的报警级别提供不同的报警方式:短信、电话(此项不包括在此次DCIM系统中)等告警模式,同时告警信息可以限次播放,而且在两次告警间的停顿时间可以设置。 定时信息发送:系统可通过短信等方式定时或按指定时间段发送机房相关信息,如:每天8点至24点期间逢整点发送指定测点温度、定时(每天中午12点及晚上8点)发送机房整体运营状况等。(此项不包括在此次DCIM系统中) 排班管理:根据预先设置的规则自动调整值班班次,实现自动短信通知值班人员进行上班提醒、值班情况考勤管理等功能。可与报警系统进行关联,还可以针对值班顺序作相应的报警发送,避免发生报警骚扰。(此项不包括在此次DCIM系统中) 按管理范围、值班情况报警:可以根据排班情况进行报警,报警只发给值班人员,休假时可以免除收到报警,避免形成“骚扰”;并可根据管理员管理范围划分进行报警,设置好后只会收到管辖范围内的报警,避免引起管理混乱。(此项不包括在此次DCIM系统中) 报警屏蔽:可以屏蔽掉不重要的报警信息,增强系统的灵活性、提高对数据的可信度。 报警级别:报警信息可分级管理,用户可以根据实际发生的报警情况的紧急程度,选择不同的报警级别,对不同的报警级别,系统会以不同的报警方式对外报警。 报警升级:当一条报警信息在规定时间内没有得到确认,变会以升级的方式向上一层用户报警。主要有人员升级与设备升级两种方式。人员升级是指第一级报警接收人员在规定时间内没有确定报警信息,报警信息便发送给系统中设定好的上一级用户,以使报警信息能够得到及时处理。设备升级是指当使用第一种报警方式发出的报警信息在规定时间内没有得到确认,系统便自动使用设定好的新一级报警方式发送报警信息,以使报警信息能够得到及时处理。 报警对象的准确定位:对报警的设备、事件、内容等进行准确定位,例如:“XX机房的当前温度为27.5度,温度过高,请立即查看”“XX机房UPS组电压偏低,请立即检查”。 报警过滤机制:例如当某台UPS市电供入出现故障,可能会产生一系列的故障事件,如组电压偏低、单相参数为零、逆变器参数骤变等等,报警过滤机制则通过智能化的分析手段,对故障告警进行过滤,可准确定位故障为“UPS市电供入断开”,而不会发出一系列无关的告警事件,防止短信骚扰管理人员。 短信查询:可以向监控系统发送短信获取设备数据。(此项不包括在此次DCIM系统中) 报警跟踪:系统提供对于任意一条报警信息的状态进行跟踪统计,包括报警时间,报警内容,确认时间,处理时间,处理日志以及处理人等情况的统计。并可对各项报警信息进行及时度统计。(此项不包括在此次DCIM系统中) 未恢复报警事件列表:提供设备报警状态的显示列表,可查看哪些设备有报警,是否报警恢复。 设备屏蔽的邮件提醒解锁功能:对设备屏蔽报警后,可设置多长时间后通过邮件方式提醒管理人员进行解锁,且下次任何人员登录时系统自动显示所有已屏蔽的设备列表。(此项不包括在此次DCIM系统中) 预警管理:设备告警支持预警功能。用户可为关键的数据点设定预警阀值,系统通过趋势判断,在设备产生真正的告警之前先产生预警,提醒用户及时处理,避免真正告警的产生。(此项不包括在此次DCIM系统中) 告警发送记录与查询:告警平台支持对所有告警发送任务的跟踪和记录,并提供方便的查询界面,便于用户对历史的发送情况进行管理。 双向短信查询系统支持双向短信查询,可以查询设备的实时数据、状态,也可以查询指定时间段、指定级别的系统事件。查询内容可由用户自行定义。每一组查询都有权限控制,只有经过授权的手机才可以执行相应的查询。(此项不包括在此次DCIM系统中)4.3. 能效管理子系统信息化发展使数据中心能耗逐年上升,运行费用成为重大经济负担,巨大的碳排放也污染了环境;数据中心高能耗已经成为公众关注的社会问题。能效管理子系统包含三大功能:能效展示、能效分析、能效控制。通过这三个模块实现数据中心的能耗可知可控。4.3.1. 能效展示1)PUE展示PUE(电源使用效率)值已成为国际上比较通行的数据中心电力使用效率的衡量指标。PUE值是指数据中心消耗的所有能源与IT负载消耗的能源之比。PUE值越接近于1,表示一个数据中心的绿色化程度越高。PUE是衡量一个机房是否节能的关键指标之一。l PUE计算公式:a) PUE=总用电/IT设备用电。b) pPUE=局部机房总用电/局部机房IT设备用电。l 历史PUE查询PUE会存储到系统数据库内,方便用户随时检索以往任何时间点的PUE值,方便用户把历史PUE和当前实时PUE进行对比,可以了解机房电源能效比的变化。2)分子系统能效统计能效管理系统数据来自与机房的UPS、UPS配电柜、市电输入柜、精密配电柜、发电机等配电设备,通过能效管理模块就可以实时显示每个耗电系统(精密空调、冷水机组、照明、IT系统等)当前的耗电情况,实时监测数据中心总能耗、IT设备能耗、空调设备能耗等,数据显示支持数据列表、折线图、柱状图和饼状图等,用户可以根据需要自行定义。系统提供24小时能耗曲线,也可以查询这些设备的历史功率。3)分模块电能管理整个数据中心分成多个模块机房,模块机房内分为多个冷通道,通过在每个模块机房的供电总进线安装电量仪统计该模块机房当前的耗电情况,并24小时能耗曲线。通过列头柜或者电能采集器统计每个机柜当前的耗电量和负载,由冷通道内IT设备与制冷设备用电情况计算出冷通道内PUE参考值。4.3.2. 能耗分析首先需要统计出数据中心的能耗系统图,了解各个模块能耗情况。如能源输入能耗、变配电能耗、负载能耗等。其次对各个分项能耗进行精细化分析,如对单台IT设备能耗进行统计,制冷子系统能耗、通风子系统能耗、变配电子系统能耗、照明子系统能耗等。数据采集完成后,通过能效分析管理平台分析,为我们提高数据机房的电源使用效率指明方向。分析思路如下:l 显示对标显示对标分为长期分析对标和短期测量对标。长期测量对标主要是记录一个相对长的时间周期,并且形成相应能效数据并且进行比对,可以分析在不同时间段的能源消耗情况,可以更直接有效地呈现数据中心能源消耗情况。l 节能策略分析及能效分析方案输出通过能耗分析引擎,迅速找出能耗使用突破点,根据匹配的能耗知识库,关联出相应的节能改进建议;并支持通过共济云服务平台,一键导入能耗使用数据,由后台专家成员在线分析,输出人工能耗改进建议。l 服务器能效分析(预留功能)业务系统是运行在服务器上的,由于业务系统的迁移或冗余,数据中心在运行一段时间后往往会产生没有承载业务量的高能低效的服务器,我们称之为“幽灵服务器”,这些服务器消耗了大量能源却没有产生作用,因此把它们下架节省能源和空间是合适的选择。共济DCIM系统通IT设备监控读取服务器的能耗,CPU利用率等参数进行实时监测,通过一段时间的分析可以找出幽灵服务器(即CPU利用率一直不高但依然耗能的服务器),再通过变更管理对这些服务器进行下架操作,最终达到IT设备节能的目的。4.3.3. 能效控制l 空调节能控制通过对机房的温度分布与仿真,通过预设的空调控制逻辑实现空调的最优运行。结合空调变频控制器,实现对空调的组群运行控制,设定开关机、温度调节、风量调节等,核心思路是通过自动化控制将空调送出的冷量与IT设备实际需要的冷量进行匹配,避免大马拉小车或小马拉大车的情况产生。l 节能方案结合能效展示,系统采用大数据的分析逻辑自动分析各系统能耗使用分布,梳理出数据中心运行过程中的能耗消耗点,给出节能建议。l 幽灵服务器的发现与控制(预留功能)在发现幽灵服务器后,通过IT监控自带带外控制可选择远程对服务器进行休眠或关闭,从而大幅降低整体机房IT设备的功率。l 服务器功率使用限制(预留功能)通过IT监控可对服务器的功耗使用上限进行设定,例如:一台服务器额定功耗为500W,可设定服务器功耗不超过300W。在几乎不对服务性能造成影响的前提下,一方面可确保单机柜可放置更多服务器,一方面可对服务器能耗进行节省。4.4. 资产管理子系统数据中心日常运维的工作核心是保障业务系统不间断运行,而承载这些业务的物理载体是各类IT设备,所以对IT资产的管理显得尤为重要。然而,由于缺乏有效的技术手段,数据中心运行一段时间后,普遍出现数据中心资产管理工作普遍遇到信息维护难、资产定位难、资产盘点难、生命周期管理难等各种困扰,导致资产管理的混乱、信息不准确,管理效率低下,出现资产闲置、浪费,造成客户的运维成本高,影响到业务系统的健康运行。资产管理模块是共济科技IT服务管理解决方案的特色功能模块之一,旨在对机房相关实物资产(库存资产、在架资产、办公资产等)进行全生命周期管理,给客户提供面向企业内部统一的资产管理平台,提供机房实物资产自动化盘点工具,并为机房容量管理、配置管理等IT服务管理提供数据接口,协助管理员高效运维机房业务。4.4.1. 仓库资产管理对于库房新增的资产,其资产从入库到出库的管理流程如下图: 入库:由资产使用单位发起入库申请,填写资产信息,申请入库。仓库管理员收到入库申请后进行审核,发放条形码,确认资产入库。 标签制作:标签制作功能为设备制作条形码,便于仓库资产及非机柜资产的标识和快速盘点。该功能支持按照客户需求,设置和调整标签内容及打印格式,以便满足不同用户的个性化格式需求。 出库:由资产使用单位填写出库申请,资产管理员收到并审核确认。资产出库类型分为资产上架、个人领用、个人借用和资产维修四种。4.4.2. 在架资产管理对于机架内的资产设备,其管理流程如下图: 资产上架:将资产放入指定机柜的指定位置。 位置变更:当资产的位置需要变动时,有资产使用者填写位置变更申请,获得资产管理员确认后,将资产放入新的位置,系统自动更新资产位置。 资产下架:资产下架包括资产退回到仓库、资产维修处理、资产报废以及其他需要将资产下架的管理活动。4.4.3. 办公资产管理对于办公设备的管理,其流程如下: 办公资产领用:包含领用和归还两个流程,确保资产责任人明确; 办公资产盘点:通过移动资产盘点终端盘点个人使用中的办公资产和库存里的办公资产,保证办公财产安全。4.4.4. 资产维保信息管理系统管理各种维保合同,包含维保合同所覆盖的各项资产、维保设备对应的厂家、联系方式以及维保日期等信息,通过对这些信息的统计和分析,可以做到对设备的过保统计和过保提醒功能,敦促用户及时续保。4.4.5. 其他资产相关功能1) 资产报废对于到达使用年限的资产由系统发起报废,对于功能达不到相应要求或损坏的资产,由使用人发起报废,并在系统中注销相应的资产信息。2) 接口定制作为开放的平台,智能资产管理系统为第三方集成提供了多种数据服务(Webservice,RESTful等),可实现与其他平台的高效对接,能被更高层次的管理系统所集成,可与电网综自系统按照特定规约实现数据互联互通。4.4.6. U位检测系统布署预留系统预留U为检测系统的建设和接入,该系统可实现机柜内U位级的资产信息识别和动态管理,实现资产的线上实时管理。4.5. 容量管理子系统4.5.1. 容量建模容量建模部分是容量管理功能的内核,旨在建立数据中心各物理层级SPC容量模型,以便精细分析、处理与显示各层级容量数据。综合U空间、供电、制冷、承重、电力口、光口、网口等因素构建容量模型。涵盖数据中心、机房、虚拟机房、列、机柜等不同层级。4.5.2. 容量展示经前端的数据统计计算,按容量模型,分管理层级或设施物理层级在页面上实时显示SPC等容量数据、预警与告警信息。4.5.3. 容量预分配容量预分配功能模块旨在对数据中心的容量分配进行管理,可以提供可用机位、机柜位的搜索、预占、审核和上线功能。对于已经预占的机位和空间,考虑不同项目的优先级,管理员可以审核、取消、编辑和再分配,以确保高优先级项目的顺利执行,并避免资源的随意占用和资源闲置。1) 预占管理预占管理模块旨在根据工程项目需求,对机房或机柜的可用空间进行查询、浏览、预占。根据项目实际情况,管理员可以对已占空间进行调整,以实现场地的有效管理,避免随意占用和资源浪费。2) 预占审批在机柜或机房预占操作之后,需要由管理员进行审核,审核确认后容量预占才生效。经审批,优先级高的预占可以插队。此模块包括的功能有资源预占审批、预占申请详情展示、审批历史查询等功能。3) 上线管理设备上架后,容量预占状态变成已上架(已占),之后高优先级的项目将无法搜索和使用相关的容量。能自动检测的主要容量信息(SPC、承重)自动更新,次要容量信息(网络端口、电力端口)可由工程实施人员更新。4.5.4. 趋势分析系统对所有在一段时间内容量使用情况变化进行统计分析。4.6. 变更管理子系统4.6.1. 流程逻辑说明变更管理流程管控任何造成或导致IT环境的变化行为与活动,通过相应管理层面的授权,充分揭示潜在风险,已达到变更对业务的影响最小化、及时相应业务需求的目标。以下为变更管理流程逻辑说明:4.6.2. 变更流程控制借鉴行业成熟方法论ITIL及国际标准ISO20000,变更管理流程可划分为以下4个阶段:1. 变更创建基于管理要求需要,设计详尽的变更基本信息,通过精细化风险评估,定义变更级别;根据变更类型、分类、级别,自动匹配相关角色及流程;2. 变更审批可进行多级审批及CAB多角色成员独立审批;审批可对变更进行撤销,审批通过后方可进行变更实施;3. 变更实施与回退跟踪变更实施时间,记录变更实施过程,并在回退发生时进行回退过程的记录;4. 变更回顾与关闭对变更执行过程进行回顾与关闭。4.6.3. 变更风险控制针对数据中心的变更任务有风险评估,变更带给业务的影响清晰明了,便于管理者和决策者进行变更任务的审批,多样化的审批授权方式也确保变更的风险得到控制。4.6.4. 变更数据管理通过日历格式,展示变更发生日期及实施持续时间,方便使用者根据变更窗口,对变更进行排程。4.7. 可用性管理子系统我国GB50174-2008电子信息系统机房设计规范按机房的可用性将机房分为A、B、C三级。可用性分析旨在通过实施监测直观描述机房整体、单个主机房、单一子系统(电力、UPS、空调)的可用性级别判断。例如:一个大型A级数据中心,其设计为A级,当出现一路市电断电时,在系统中可显示可用性降低的提示,通过该提示可定位到什么故障导致了整体可用性的下降。4.8. 报表管理4.8.1. 预定义常用报表报告模板提供告警事件统计报表报告模板;提供资产统计报表报告模板;4.8.2. 自定义报表报告模板功能共济数据中心基础设施监控管理系统,根据日常管理所需,提供客户自定义报表报告模板的功能。客户可根据自己的需要,定义模板中显示的数据内容,定义模板中数据显示的方式,定义报表报告模板的名称,定义日报、季报、月报、年报等。内置多种维度的报表报告,包括设施监控,资产管理,容量管理,能效管理,变更管理等各方面的报表报告。4.8.3. 报表报告管理客户可使用预定义的、自定义的报表报告模板,生成所需的报表报告,可保存此报表报告,以便随时调用查看,可对过期无用的报表报告进行删除。第5章 客户收益5.1. 基础设施监控回报共济DCIM系统提供一整套的对数据中心基础设施进行监控管理的有效工具,使用起来简单方便。内置的复杂事件分析引擎能够快速过滤掉大量不必要的报警事件,当接收到前端发来的大量报警事件时,能够根据设定好的过滤策略,过滤掉大量不必要的报警,精确定位到故障根源。报告到对应负责人,节省大量排查故障的时间。另外复杂事件处理引擎允许配置多种过滤策略,准确率和效率大大提高。 客户收益:1) 简单好用的工具,节省大量的人力和时间。2) 提高机房的运行效率,快速定位故障根源。3) 提升机房管理水平,保障基础设施可用性。4) 避免大量告警发送带来的人力浪费。5) 减少大量故障排查的时间和工作量。6) 过滤策略可配置,满足多种场景需求。5.2. 能效管理回报共济DCIM系统通过精细化的能效管理,配合前端的能耗采集,能够监控每台耗电设备的能耗,清楚地知道数据中心的能源消耗在哪,知道电费高在哪,并通过内置的能效分析工具,把IT设备与其他设备的能耗对比分析,找出PUE高的原因,再进行相应的节能活动节省数据中心的能源成本,降低PUE。 客户收益:1) 清楚地了解基础设施(IT设施+场地设施)的能耗情况。2) 通过能耗分析工具找出能耗高,PUE高的原因。3) 可采取相应的活动进行节能控制。4) 可通过能效分析工具进行各种对比分析,找出节能空间。5) 可通过多种节能策略进行节能活动。6) 节能效果验证,持续进行节能优化。5.3. 资产管理回报共济DCIM系统通过软件和硬件两方面的人性化设计让资产管理变得简单好用,在硬件方面,共济专利的资产检测技术能够做到资产自动检测,实时盘点,U位级资产定位,资产是否在架自动检测,位置变化自动检测,对于在架资产可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论