IDC机房运维管理_第1页
IDC机房运维管理_第2页
IDC机房运维管理_第3页
IDC机房运维管理_第4页
IDC机房运维管理_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

机房运行维护管理中国计算机用户协会机房设备应用分会副理事长美国可用性探讨中心亚太区主任沈卫东内容运行维护管理的意义提高牢靠性提高可用性提高平安性提高经济性运行维护管理的本质人员技能的提高(技术的驾驭)制度流程的建立、执行运行维护管理的技术手段环境监控设备监控运行维护管理的意义提高牢靠性:降低故障率提高可用性:削减宕机时间提高平安性:削减灾难提高经济性:增长设备寿命运行维护管理的本质人员技能的提高技术培训阅历沟通运行维护管理的本质制度流程的建立、执行机房运维制度的建立机房运维制度的执行管理机制机房运行管理制度一.值班制度二.巡察制度三.日常管理制度四.运行维护制度五.平安保密制度一.值班制度机房昼夜要有人值班值班人员要遵守值班守则值班守则二.巡察制度机房环境的巡察机房设备的巡察1.机房环境的巡察机房门窗的关闭状况机房的卫生状况机房的灯光状况机房的空气清爽度状况2.机房设备的巡察对网络运行保障设施要常常巡察巡察供电系统、UPS、电池巡察空调的工作状况巡察新风机和空气净化器的工作状况巡察消防报警系统三.日常管理制度常常留意保持机房的环境卫生不得将食品、饮品带入机房机房内禁止吸烟不得在机房内乱扔物品四.运行维护制度配电柜一年进行至少2次维护检查UPS一年进行2次巡检机房专用空调每月进行一次巡检新风机每年2次维护空气净化器每季度维护一次机房消防系统每年一次检测机房防雷设施每年一次检测机房每年进行2次保洁五.平安保密制度1.门禁管理2.防雷击、防火、防水、防盗、防虫害3.网络运行平安管理4.系统设备平安管理5.细致遵守国家的各项保密制度1.门禁制度机房要设有门禁机房门禁7X24小时保持运行机房门禁的2个作用机房工作人员需持卡进入机房非机房工作人员进入机房需登记2.防雷击、防火、防水、防盗、防虫害防雷击防火、防水防盗防虫害3.网络运行平安管理防入侵防病毒涉密网4.系统、设备平安管理进入机房不得带拷贝工具和便携机机房内全部服务器应设有开机密码、系统登录密码机房内全部服务器都应设有带密码的屏幕疼惜非网管人员不得私自操作任何服务器5.细致执行国家的保密制度涉及政务、金融、高科技、网上交易定期集中销毁废弃的涉密纸、物非机房工作人员在机房工作时必需有机房值班人员陪伴机房内各类服务器应由专人分类管理建立设备、资料责任制应用举例附件《机房运行管理制度》机房内的危机管理史蒂文•芬克(StevenFink)的《危机管理》(CrisisManagement-Planningfortheinevitable):组织对全部危机发生因素的预料、分析、化解、防范等等而实行的行动。罗伯特•希斯(RobertL.Heath)的《危机管理》(CrisisManagementforManagersandExecutives):管理者考虑如何削减危机情境的发生、如何做好危机管理的准备、如何规划以及如何培训员工应对危机局面、如何从危机中很快复原。危机管理的PPRR模式Prevention(预防)观念、流程Preparation(准备)人力物力资源Response(响应)应急预案,消退危机的短期影响Recovery(复原)阅历总结,消退危机带来的中长期影响应急预案事前“马后炮”“一旦发生XX事故,管理员应当在XX分钟之内实行以下措施:一、XX;二、XX;。。。”第一步:列出危机或称风险例如,IT系统宕机、火灾、空调漏水、机房温度超高等。其次步:解除不存在的风险第三步:将各种风险列举在应急预案的风险书目第四步:横向分类与纵向分级横向分类:将书目中类似的风险进行分类,比如可将机房的风险划分为的灾难风险(如火灾)、生产中断风险(如宕机)、平安隐患风险(室温过高、接地不良)、财产风险和人力资源风险等等。纵向分级:按各类风险的大小和威逼程度排序,从而建立起风险管理的优先依次。比如可将IT系统宕机定为I级风险,而将室温上升定为II级风险,将湿度过低定为III级风险。第五步:设计针对这些风险的预先和应急处理措施1.对可以预见且时间和资源允许处理的风险,实行排出和缩减。2.对可以预见但可能发生概率较低的风险,可以进行风险转移。如,将火灾风险转移给保险公司,将UPS停机风险转移给UPS厂商或UPS服务商。3.对现在没有表现出来,但其爆发总存在确定征兆的风险,实行建立预警系统对其监控。4.对那些发生时间完全不行预料的风险,则必需建立起一个协调人力资源的“危机处理机构组织结构图”以及一个指导人员操作的“危机应对表”,使运维管理人员和相关部门、人员能够在危机发生时有组织地、按部就班地执行。“危机处理机构组织结构图”的建立预先协调跨部门的资源“危机应对表”管理人员依据对各种可能出现的危机设想,设计出的应对措施。环境监控机房电力质量监测机房温度监测机房湿度监测新风风量监测IT微环境监测机架电力质量监测机架温度监测机架湿度监测运行维护管理的技术手段—监控对象故障预料:防止故障的发生故障报警:缩短故障复原时间运行维护管理的技术手段

—监控目的

故障预防1/15/202328-2-101234发觉隐患实行措施设备将发生故障设备发生故障的时间被推迟

故障复原10234567故障发生服务商收到详细报警信息管理员收到详细报警信息服务商判断故障部件服务商携带部件赶到现场服务商更换部件系统恢

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论