数据中心运维管理培训概述_第1页
数据中心运维管理培训概述_第2页
数据中心运维管理培训概述_第3页
数据中心运维管理培训概述_第4页
数据中心运维管理培训概述_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1数据中心运维管理培训概述2目录数据中心基础设施主要架构如何看数据中心的运维数据中心运维目标、对象、要求数据中心运维相关标准数据中心机房运维管理流程、各种规章制度、规范数据中心运维所面临的一些关键问题数据中心基础设施架构柴油发电机动力配电不间断电源电气工程设备环境控制系统弱电工程建筑机房装修工程专用空调系统辅助空调系统通风系统系统空调系统监控中心控制系统漏水报警系统综合布线系统照明配电系统电源防雷接地机房接地自动报警系统门禁CCTV安防工程分区气体灭火系统分区水喷淋系统配电设施主要组成:

配电设备

受电柜

馈电柜PDU(PowerDistributionUnit)作用:

正常:接受/分配电能

故障:迅速切断故障,维持系统正常运行.柴油发电机柴油发电机:

发电机是将其他形式的能源转换成电能的机械设备,它由柴油机做为动力机械驱动,将燃料燃烧产生的能量转化为机械传给发电机,再由发电机转换为电能。ATS开关ATS组成ATS一般由两部分组成:开关本体+控制器。而开关本体又有PC级(整体式)与CB级(断路器)之分。

PC级

能够接通、承载、但不用于分断短路电流的ATS

CB级

配备过电流脱扣器的ATS,它的主触头能够接通并用于分断短路电流。如果过电流故障引起开关断开,ATSE将不会转换。PC级与CB比较CB级是由断路器组成,而断路器是以分断电弧为己任,要求机构快速脱扣一般采用四连杆机构。四连杆机构易存在滑扣、再扣不可靠因素:而PC级机构不存在该方面问题。因而PC级产品的可靠性远高于CB级产品。

CB级ATS的电动操作机构一般是通过微电机带动减速齿轮机构对断路器进行合分工作,又因断路器机构的限制,微电机必须工作到堵转后,靠行程开关才断开控制回路。众所周知,微电机堵转工作后,其寿命会大大降低。因而,CB级ATSE电动操作机构可靠性较低。

而PC级ATS的电动操作机构一般为短时工作电磁铁.由于电磁铁结构简单,工作可靠好,所以PC级ATSE电动操作机构的可靠性较高。什么是UPSUPS(UninterruptiblePowerSystem):交流不间断电源,是一种利用电池化学能作为后备能量在市电断电或发生异常等电网故障时不间断地为用户设备提供交流电能的一种能量转换装置。它广泛的应用在银行、医疗、邮电、国防、工业控制、机要机关等部门。UPSUPS不停电供电全面改善供电质量精密空调

空调--就是空气调节的简称。精密空调空气有四大指标:

温度,湿度,速度和洁净度。空调作用 ——就是调节温度,湿度,速度和洁净度。四个指标,人为地创造一个舒适的生活和工作环境。精密空调空调送风方式图例1)风机2)电气控制系统3)盘管4)过滤网5)压缩机1243521345ExampleforDX-Amodels下送风上送风精密空调机房分级标准A级标准电子信息系统运行中断将造成重大的经济损失。电子信息系统运行中断将造成公共场所秩序严重混乱。电子信息系统运行中断将造成公共场所秩序严重混乱。场地设施应按容错系统配置,在电子信息系统运行期间,场地设施不应因操作失误、设备故障、外电源中断、维护和检修而导致电子信息系统运行中断B级标准电子信息系统运行中断将造成较大的经济损失电子信息系统运行中断将造成公共场所秩序混乱。场地设施应按冗余要求配置,在系统运行期间,场地设施在冗余能力范围内,不应因设备故障而导致电子信息系统运行中断。C级标准不属于A级或B级的电子信息系统机房应为c级。场地设施应按基本需求配置,在场地设施正常运行情况下,应保证电子信息系统运行不中断。

机房分级的标准配电系统的整体架构配电设施机房配电系统框图变压器1ATS配电总柜市电配电柜UPS输入配电柜UPS2UPS1UPS3UPS输出配电柜列头配电柜STS配电柜ATS切换柜UPS4发电机1变压器2ATS切换柜发电机2双回路输出单回路输出供电设备:精密空调、新风机、市电照明等市电设备2目录数据中心基础设施主要架构如何看数据中心的运维数据中心运维目标、对象、要求数据中心运维相关标准数据中心机房运维管理流程、各种规章制度、规范数据中心运维所面临的一些关键问题案例分享2从数据中心的生命周期管理看运维规划数据中心蓝图,评估当前状态,制定未来的蓝图.规划设计迈进绿色环保型数据中心通体系过设计,提供数据中心工程与体系结构的详细设计及预算建造借鉴国际先进管理最佳实践及自动化管理工具,建立数据中心管理体系运营基于业务需求变化,对数据中心软硬设施做心要的改造,以适应发展的需要改造IT在企业中位置应用架构技术架构

系统服务能力实施硬件网络基础设施应用

业务架构业务流程

工作流交易实施战略目标需求目的测量程序项目性能智能

IT架构是为企业架构提供技术支撑和保障,是企业提高管理水平、工作效率、降低成本的实现方式不同时期不同发展阶段,IT部门定位和作用不同如果IT部门能在企业业务信息化过程中发挥关键作用,IT部门价值会得到更广泛的提升2数据中心运维的一些特点数据中心运维的管理是从数据中心规划建设阶段开始。基础设施建设的质量影响了数据中心运维的好坏。不同行业的数据中心面临的问题不同不同的发展阶段的数据中心面临的问题不同不同的人对问题的看法不同2目录数据中心基础设施主要架构如何看数据中心的运维数据中心运维目标、对象、要求数据中心运维相关标准数据中心机房运维管理流程、各种规章制度、规范数据中心运维所面临的一些关键问题案例分享2数据中心运维面临的一些关键问题体系技术能力基础设施2目录数据中心基础设施主要架构如何看数据中心的运维数据中心运维目标、对象、职责数据中心运维相关标准数据中心机房运维管理流程、各种规章制度、规范数据中心运维所面临的一些关键问题2什么是数据中心基础设施管理从数据中心角度来看,数据中心运维管理就是:为提供符合要求的基础设施系统服务,而对与该基础设施服务有关的数据中心各项管理对象进行系统的计划、组织、协调与控制,是基础设施服务有关各项管理工作的总称。数据中心运维是数据中心生命周期中历时最长的一个阶段。所谓生产运维期指的是从数据中心项目交付使用,直到项目废除的全过程,也就是项目进行生产运维活动,收回投资,以实现预期投资目标的周期。在此阶段的运维管理,将依托于数据中心已交付的基础设施,通过科学的管理,最终使数据中心得以实现服务与经济上的目标。简单地说,运维管理就是用好、管好已建设交付的数据中心。2数据中心基础设施目标

合规性

可用性

安全性

服务性

经济性2数据中心基础设施运维的基本策略及时规范

安全

可用

2数据中心基础设施基本策略及时采取适应的手段满足服务承诺(SLA)指标的实现。2数据中心基础设施基本策略规范

通过建立适当的服务管理流程、服务活动指导文件或实施原则,以保证服务过程的规范运行。

建立有效的服务管理流程。建立有效的交付管理流程。建立数据中心相关管理制度。对于非例行性操作服务(响应支持、优化改善、咨询评估),应在实施前,制定详细的实施方案过程有效管理

2数据中心基础设施基本策略

安全

应采取各种安全手段和措施,有效地控制数据中心运维的各个环节,保护数据中心运维服务中的物理安全、设备设施安全和数据安全。

建立适当的信息安全管理机制,以规范数据中心运维服务人员的信息安全行为,信息安全管理可参照GB/T22080GB/T22081ISO27001.

应对数据中心运维服务人员进行相关安全管理及安全要求培训,并进行适当的检查,以确保服务人员了解并遵守数据中心、保密相关规定。应充分关注数据中心业务安全需求,结合信息安全技术与管理标准,进行适当的安全评估,提供相应的安全建议,并对服务对象进行适当的监控和保护。应对安全设施、网络系统进行监控、分析、报告,把安全风险控制在可接受的范围内,防止安全事件的发生。应建立有效的安全通报机制,以及时通报安全事件相关情况和相应防范处理措施等。2数据中心基础设施基本策略

可用

冗余和备份的启用规范,建立相关的作业流程和响应机制。进行合理的人员岗位设置,重点岗位保证专人专岗并设置人员备份。

应配备具有相应能力的人员和必要的工具,并定期进行培训

应选择适用的运维技术,以保证服务的可用性

足够的资源,避免由于资源缺失导致对服务的可用性带来的影响2数据中心基础设施运维对象

供电设施UPS

配电设备

高压变压器

发电机PDU环境设施

精密空调

漏水检测

新风机

安防与消防

门禁控制

温感、烟感探测设备

监控录像

气体灭火设施

综合布线IT微环境

环境监控

2数据中心基础设施运维组织结构2数据中心基础设施运维组织结构管理层总经理执行层基础设施维护基础设施建设网络。。。执行层供配电空调。。。主管主管工程师工程师数据中心基础设施运维组织结构34数据中心运维的主要内容环境监控场地UPS柴机空调安防例行操作响应支持优化改善咨询评估IT基础设施例行操作监控

预防性检查常规作业响应支持故障及应急处理

优化改善适应性改进

增强性改进预防性改进咨询评估服务对象活动35数据中心的运维主要内容服务对象监控内容空调系统环境温度、湿度、出风温度、回风温度,告警情况等供配电系统电流、电压、功率因数、有功功率、无功功率等发电机启停情况、电流、电压、负载率、控制系统供电情况等UPS系统输入电流电压、输出电流电压、频率、功率因数、负载率、温度、报警情况等消防系统报警情况等安全系统门禁状态、告警情况、监控录像等例行操作监控

预防性检查常规作业响应支持故障及应急处理

优化改善适应性改进

增强性改进预防性改进咨询评估36数据中心的运维主要内容例行操作监控

预防性检查常规作业响应支持故障及应急处理

优化改善适应性改进

增强性改进预防性改进咨询评估服务对象性能检查内容脆弱性检查内容空调系统高压压力、低压压力(风冷系统),冷冻水压力、温度,冷却水压力、温度(水冷系统),风机运行情况,灰尘情况等机房热点情况、室内机漏水检查、室外风机运转情况、加湿罐阳极棒检查、过滤网检查等供配电系统接地电阻、零序电流、器件发热情况等导线、器件发热情况,防浪涌器件情况等发电机转速、发热情况等油位,吸气、排烟通道等UPS系统器件发热情况、电池情况(外观、液位、接线柱)等器件、导线发热情况,电池放电时间等消防系统钢瓶压力、有效期、探头污染等启动瓶、管道开关、气体压力等安全系统器件灵敏度、画面清晰度(不同照度情况下)、平台运行等器件灵敏度、监控死角问题等37数据中心的运维主要内容例行操作监控

预防性检查常规作业响应支持故障及应急处理

优化改善适应性改进

增强性改进预防性改进咨询评估服务对象基础类操作测试类操作数据类操作空调系统启停机、开清洗更换滤网、清洗更换加湿系统、清洁冷凝器等漏水报警测试等运行日志备份,报警记录备份、清除等供配电系统除尘、合闸、分闸等互投测试等发电机更换三滤、清洁等空载测试、带载测试、切换演练等运行日志备份,报警记录备份、清除等UPS系统旁路、清洁等旁路测试、电池放电测试等运行日志备份,报警记录备份、清除等消防系统探头清洗等启动测试、探头测试等报警记录备份、清除安全系统门禁授权等器件灵敏度、画面清晰度(不同照度情况下)、云台运行等出入记录导出、备份,监控图像记录备份、清除,报警记录备份、清除等38数据中心的运维主要内容例行操作监控

预防性检查常规作业响应支持故障及应急处理

优化改善适应性改进

增强性改进预防性改进咨询评估服务对象处理内容空调系统故障排查、关闭部分机组以维持机房最低温湿度指标、关闭新风系统等;供配电系统故障排查、投入备用电源回路、关闭非重要回路等发电机故障排查、启动发电机、油料补充;UPS系统故障排查、旁路系统、关闭非重要输出等;消防系统故障排查、系统启动、报警联动、疏散警示等;安全系统故障排查、手动开启或关闭门禁系统、检查告警或监控记录等39数据中心的运维主要内容例行操作监控

预防性检查常规作业响应支持故障及应急处理

优化改善适应性改进

增强性改进预防性改进咨询评估服务对象处理内容空调系统调整温湿度参数等、调整机组位置等;供配电系统更换开关、导线以适配负载容量等;发电机调整启动方式等;安全系统调整授权模式、报警模式、调整云台运转周期等。40数据中心的运维主要内容例行操作监控

预防性检查常规作业响应支持故障及应急处理

优化改善适应性改进

增强性改进预防性改进咨询评估服务对象处理内容空调系统增减机组供配电系统增加回路、增加ATS设备等发电机增加主机数量、增加电池数量安全系统增加报警联动、增加终端数量、增加存储容量等41数据中心的运维主要内容例行操作监控

预防性检查常规作业响应支持故障及应急处理

优化改善适应性改进

增强性改进预防性改进咨询评估服务对象处理内容空调系统调整机组位置,调整出回风方式等供配电系统更换开关、更换导线、调整回路等42数据中心的运维主要内容例行操作监控

预防性检查常规作业响应支持故障及应急处理

优化改善适应性改进

增强性改进预防性改进咨询评估服务对象处理内容空调系统机房环境指标分析及改进建议、机房热点分析及布置改进建议、机房送风、回风方式改进建议,辅助制冷单元配置建议等;供配电系统机柜供电分析及改进建议、机房回路调整分析调整建议、机房扩容建议等;发电机发电机负荷分析及调整建议等安全系统UPS运行分析及扩容建议等安全系统图像监控系统分析及改进建议(如增加存储、增加摄像头等)、报警系统运行分析及改进建议等。43数据中心的发展三个阶段规范化标准化工具化44数据中心运维管理体系的流程体系环境监控场地UPS柴机空调安防通用管理制度流程规范操作指导书IT基础设施检查表单45数据中心的运维管理的通用管理制度机房管理制度(内、外部管理,定义)客户服务沟通机房值班及交接班管理制度客户财产管理及服务规范机房出入管理制度安保控制制度通用性管理制度流程规范操作指导书检查表单46数据中心运维管理流程体系几种形式通用性管理制度流程规范操作指导书检查表单监控流程巡检流程维护流程故障处理流程应急处理流程配电柜维护保养规范ATS维护保养规范UPS维护保养规范柴油发电机维护保养规范电池维护保养规范精密空调维护保养规范新风系统维护保养规范安防系统维护保养规范环境监控系统维护保养规范消防系统维护保养规范应急处理预案应急处理演练数据中心运维管理流程体系几种形式*******数据中心UPS设备日常检查表(1次/天)

实施时间:年月日

机组型号:

设备序列号/机组编号

使用测试工具:温度测试仪

位置检查项目基准值实测值评价基准值实测值评价UPS室室内温度20℃-25℃

□正常□异常

□正常□异常室内湿度40%~55%

□正常□异常

□正常□异常UPS异常声音

□正常□异常

□正常□异常输入电压A相380V±15%

□正常□异常

□正常□异常输入电压B相380V±15%

□正常□异常

□正常□异常输入电压C相380V±15%

□正常□异常

□正常□异常输入电流A相

□正常□异常

□正常□异常输入电流B相

□正常□异常

□正常□异常输入电流C相

□正常□异常

□正常□异常输入频率50Hz/60Hz±5%

□正常□异常

□正常□异常输出电压A相380V±2V

□正常□异常

□正常□异常输出电压B相380V±2V

□正常□异常

□正常□异常输出电压C相380V±2V

□正常□异常

□正常□异常输出电流A相

□正常□异常

□正常□异常输出电流B相

□正常□异常

□正常□异常输出电流C相

□正常□异常

□正常□异常输出功率A相

□正常□异常

□正常□异常输出功率B相

□正常□异常

□正常□异常输出功率C相

□正常□异常

□正常□异常有功功率

□正常□异常

□正常□异常功率因数80%

□正常□异常

□正常□异常外观面板指示灯显示为绿色

□正常□异常

□正常□异常停电次数次

数据中心运维管理流程体系几种形式应急架构组织结构职责电力组织结构职责环境空调组织结构职责防火应急流程应急流程电力应急流程环境空调应急流程防火应急演练演练计划电力环境空调防火演练实施演练评估演练计划演练实施演练评估演练计划演练实施演练评估应急管理主要内容数据中心运维管理流程体系几种形式50数据中心运维的流程体系基础设施管理事件管理流程问题管理流程变更管理流程发布管理流程配置管理流程报告51数据中心运维的流程体系52数据中心运维的流程体系编号优先级解释1.低影响范围为某台客户设备2.中影响范围为某一机房内区域3.高影响范围为某一机房4.最高影响范围为整个数据中心,如网络的核心路由出现故障,如机房双路市电中断故障。53数据中心运维的流程体系我们所运营的数据中心有几类事件级别/分类电力系统消防系统空调系统门禁监控网络链路Voice系统其它非常严重事件市电中断严重事件某组服务器电力中断机房火灾门禁系统失效网络链路出口中断外部网络攻击一般事件机房水灾,少量渗水空调故障,无法制冷CCTV监控系统故障网络链路拥塞语音中断超过5分钟服务器病毒感染日常事件无证人员闯入机房语音通话有短暂延时垃圾电子邮件事件分级说明:非常严重事件,造成或可能导致D.C.服务中断8小时以上,影响全部机房。严重事件,造成或可能导致D.C.服务中断4小时以上,或者影响到核心区域。一般事件,造成或可能导致D.C非核心区域服务中断。日常事件,其它没有造成机房明显服务中断的事件。2目录数据中心基础设施主要架构如何看数据中心的运维数据中心运维目标、对象、要求数据中心运维相关标准数据中心机房运维管理流程、各种规章制度、规范数据中心运维所面临的一些关键问题数据中心运维的标准ISO20000ISO270001ITILITSM•InformationTechnologyServiceManagement,意为信息技术服务管理•IT服务管理(ITSM)是一种以流程为导向、以客户为中心的方法,它通过整合IT服务与业务来提高组织IT服务支持和服务交付的能力及其水平•来源于国外信息组织与机构对于信息技术从管理向服务转向过程的最佳实践•希望将信息技术从成本中心转向价值中心•根本目的是改进服务,提高满意度,提升信息技术的价值•相关的国际标准与实践:ISO20000、ITIL、COBIT、ISO27001、ISO17799等数据中心运维的标准ITIL•ITIL(InformationTechnologyInfrastructureLibrary)信息技术基础架构库•ITIL被广泛的用于建立并提高组织的服务管理能力。ITIL提供了一套业绩最佳实践来指导组织达到ISO20000标准。促使组织使用正确的方法,通过使用IT服务来达到业务的效力和效率。•UseITILinwhole,orinpart–it’suptoyou数据中心运维的标准ITIL简史•在20世纪80年代末期,英国商务部(OGC,OfficeGovernmentCommerce)发布了ITIL。•Version1—1986~1999年原始版,主要是基于职能型的实践•Version2—1999~2006年ITILv2版,主要是基于流程型的实践•Version3—2004~2007年基于服务生命周期的实践数据中心运维的标准ISO20000,5大类,13个管理流程数据中心运维的标准ITSM三级阶段数据中心运维的标准

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论