下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1. 用户现状与需求1.1. 用户系统现状用户现有系统包括数据库、应用、邮件等系统,虽然是双机架构,但是其稳定性和可 靠性都没有达到核心系统应该具备的标准,而且直连的存储架构对于性能和管理型都有一定 的局限性。业务数据是企业业务的生命线,如何保护好计算机系统里存储的数据,保证系统稳定可 靠地运行,并为业务系统提供快捷可靠的访问,是系统建设中最重要的问题之一。为了保护 业务系统的关键业务数据,我们必须对这些数据进行有效的备份,并支持快速恢复。通过备份的方式将文件、数据库等重要数据做一个副本,只能在本地建立数据保护。但 因意外(如火灾、地震等)停止工作时,随之而来的损失更是不可估量,为避免类似风险
2、的存 在,就需要建立异地容灾系统,整个应用系统可以切换到另一处,使得该系统功能可以继续 正常工作,保证业务稳定运行。1.2. 用户需求.建设目标从容灾的级别来说,可以规划数据级容灾和应用级容灾,根据业务种类多,业务方式多样化的特点,仅建设一个数据级容灾是不够,容灾发生时,业务快速的恢复是容灾系统的一大需求。应用级容灾是建立在数据级容灾的基础上,在容 灾切换时,除了切换核心的数据库数据外,还包含了地址切换(按客户需要选择), 中间件服务,用户级业务。应用级容灾从流程上实现了全业务的连续性需求。从我们的灾难系统建设经验出发,有限公司可以考虑以下业务连续性计划目标: (最大允许数据丢失时间):零数据
3、丢失(最大允许宕机时间):30分钟应用级容灾需求1.2.2.需求分析用户需要保障数据的长期安全可靠的,数据对于灾难的安全性和可恢复性: 灾难切换时间要求 灾难系统切换时间不超过 30 分钟,最好在 10 分钟内实现。 多种灾难切换方式 提供自动灾难系统切换和手动灾难切换方式计划内维护要求 提供计划内维护支持能力,计划内维护切换时间不多于 10 分钟 数据丢失性要求 原则上要求零数据丢失,可以依据情况进行调整数据同步方式 提供同步和异步两种方式 备份和灾难备份方式 采用物理备份方式实现 物理部件失败要求 支持部分磁盘, 文件系统,主机,磁盘柜等各种物理部件失败导 致的失败保护。站点失败要求 支持
4、由于火灾,电力以及其他因素导致站点失败的数据保护。 逻辑失败要求 支持由于数据块腐败导致的数据库无法启动, 数据丢失等逻辑失败保 护人类错误失败要求 支持由于人类误操作以及入侵等导致人类错误失败导致的数据 保护或者恢复。生产系统的性能影响要求 生产系统性能影响不超过 5% 生产系统可用性要求 容灾系统不会降低生产系统可用性 网络链路分钟级别短暂故障 要求不会对生产系统产生影响 网络链路小时级别长期故障 要求不会对生产系统产生影响 网络链路密集的秒级别短暂故障 要求不会对生产系统产生影响 网络链路容错 支持网络链路的容错,可以利用网络的备份链路,比如多路网卡等 灾难系统的硬件故障 由于灾难系统硬
5、件故障导致的灾难系统不可用不会对生产系统 产生影响,比如网卡,磁盘以及控制卡等灾难系统的软件故障 由于灾难系统软件故障导致的灾难系统不可用不会对生产系统 产生影响,比如灾难系统管理软件部件等网络协议 采用网络实现网络带宽 一般的百兆或者千兆带宽要求 要求在 10 以内即可满足要求,可以容忍部分时间的 30响应 在线实施要求 要求在备份系统实施期间保持生产系统运行 存储系统失败的原址运行 在生产系统主机可用的情况下可以支持系统原址运行 部分文件失败的原址运行 在部分文件失败的情况下可以支持系统原址运行2. 建议方案2.1设计原则通过对用户具体环境和需求的分析,我们在针对性的方案设计上应遵循以下
6、原则:最高的性价比,根据用户的实际需求,提供合适的解决方案,在有限的 资金许可范围内提供符合需求的方案。优化的策略,关键业务系统和一般应用系统优先级的策略化,需要确保 关键业务系统的数据不丢失。广泛的适用性,支持异构平台,产品可以适应不同类型的应用、数据以 及主机存储设备。容灾方案设计目前有很多种容灾技术,分类也比较复杂。根据用户应用系统特点的不同, 应用系统持续服务紧迫性的区别,应有针对性的选择容灾系统方案。灾备主机应用系统生产主机 应用系统数据库卷管理器数据库卷管理器存储系统存储系统(1) 基于应用程序容灾解决方案 应用程序在本地、远端双写;该方案能够实现业务系统在发生灾难时自动切换,保证
7、业务的完全连续性;方案缺点*投资非常高,容灾软件价格昂贵;.实施复杂,应用系统需要重新搭建;.该方案完全由软件实现,需消耗主机系统资源,效率底;(2) 基于数据库复制的远程容灾解决方案*数据库本身的远程复制();*实施相对简便,支持异构存储;方案缺点*只能复制数据库文件,实现数据库容灾;需要重新调试、安装数据库;*停机时间较长;(3) 基于主机的远程数据复制软件容灾解决方案复制软件在卷管理器层面截获,远程复制*支持异构存储;* 可以实现应用的实时、自动切换;方案缺点*需要重新配置存储卷,停机时间较长;*新增容灾系统需要增加软件授权;(4) 基于存储的远程数据复制谷灾解决万案智能存储远程数据复制
8、,技术较成熟;.设备、软件投资费用低;实施简便,应用系统仅需短时间停机;不需要对应用、数据库重新安装调试; 方案缺点*只支持同一厂商同一系列存储;*不能实现应用的实时、自动切换;根据用户的应用特点:建议使用基于存储的容灾方案系统整体架构宜匸1业务乂业齧3EH舸本地灾备中心服务器均采用原有服务器,所有服务器配置卡,连接至用户现有光纤交换机;新增存储加入网络,存储空间可根据业务需求,自由划分给多套系统使用;新增一台备份服务器,安装服务端,新增一台虚拟带库作为备份介质保存备 份数据,实现备份主数据中心和灾备中心之间通过高速光纤链路连接, 为数据复制和备份提供 了很好的链路基础。利用 容灾管理软件实现
9、磁盘阵列之间数据的复制。建立同 城异地容灭系统, 通过数据同步保证在总部运行中心出现重大灾难故障时, 能启 用灾备中心进行正常交易。异地备份中心容灾中心新增容灾服务器、容灾交换机,新增的 2100 作为容灾存储设备, 该备份中心只需要保存业务系统数据一份可用的备份。 当本地机房瘫痪时, 容灾 服务器接管及交易系统。3. 灾备中心运行维护方案3.1.解决方案选择保持业务持续性,恢复业务处理的方法可以包括与冷、温或热站点供应商签 订商业合同、移动站点、镜像站点、与内部或外部机构签订互惠协议、与设备供 应商签订服务水平协议()。另外,在制定系统恢复策略时应该考虑诸如独立磁 盘冗余阵列()、自动故障切
10、换、不间断电源()和镜像系统等技术。业务持续性计划必须包括在比较长的期间在备用设施中恢复和执行系统运 行的策略。通常,有三种备用站点可供选择:由机构拥有或运行的专用站点与内部或外部实体签订的互惠协议或协议备忘录商业租用设施无论选择哪种类型的备用站点,设施必须能够支持应急计划中所定义的系统 操作。三种站点类型可以根据运行的准备程度进行分类。这样的话,站点可以被确定为冷站点、温站点、热站点、移动站点和镜像站点。根据的结果和银联对业务持续性的要求,选择的解决方案可以描述为:(1)建立异地容灾中心将完全复制生产中心的数据,并实现两中心间的数 据实时同步,其功能为:a正常工作状态下,灾备中心将配置为生产
11、中心的完全数据复制,以保证 当生产中心发生灾难时,数据的完整性。b.当生产中心的存储系统及数据不可访问时,可以通过对备份数据中心的数 据的访问。(2)建立灾备中心,生产中心的数据将完全复制到灾备中心,允许存在一定的时间差,但应满足和要求。灾备中心配置有与生产中心架构相同的服务器系 统,在生产中心无法运行的情况下接替生产中心的生产业务,实现对业务持续性的要求。a正常工作状态下,备份中心将配置为生产中心的数据复制源,以最大限度的不影响生产中心的主机和存储系统的性能。b.当生产中心灾难发生时,灾备中心的完全复制数据将用于生产数据中心 的数据同步,以保证当生产中心灾难发生时, 灾备中心没有数据丢失;
12、业务可以 恢复运行。3.2. 业务持续性策略3.2.1.日常运行状态在没有任何异常情况发生的情况下, 系统按照正常的运行状态运转, 工作人 员按照各自的岗位职责开展工作。 定期将工作内容和工作结果向上级管理人员汇 报并接受上级管理人员的监督和检查。3.2.2.切换流程切换流程分计划内切换流程和计划外切换流程,首先讨论计划为切换流程。1. 发现并确定灾难情况 运行中心运行保障室是负责发现可能导致业务系统灾难的事件的主要部门。同时,网络维护室、 系统维护室和安全管理室等其它部门应该将所发现的可能导 致灾难的时间随时向运行保障室报告。2. 通知负责恢复的人员 运行保障室按照预定程序通知业务持续管理小
13、组的值班人员, 值班人员需要监控事件的发展,必要时将向业务持续小组负责人通报。当发生可能导致业务处理中心的情况后,需要通知以下人员: 信息中心主管业务持续管理小组负责人 业务持续行政小组负责人 负责维护发生以外事件的系统的部门负责人3. 判断异常影响程度,启动计划启动计划是业务持续管理小组和 /或业务持续行政小组的职责。通常由业务持续管理小组和 /或业务持续行政小组的负责人宣布计划的启动。在被授权的组织会负责人确定需要启动灾备站点后,宣布计划启动。按照所定义的工作内容,损害评估小组和灾难恢复小组开始工作。4. 激活灾备站点 在通知恢复的人员过程中,灾备站点的值班人员必须被通知并立即投入工 作,
14、做好业务运行环境的检查等工作。 关闭可能对恢复业务运行有影响的任何应 用系统,做好恢复业务运行的准备。在收到启动的通知后, 按照所定义的操作流程, 与生产中心陪着或独立执行 业务恢复工作。5. 发布公告 业务持续管理小组的相关成员按照所定义的工作内容向外发布公告6. 提供业务恢复所需的服务在业务恢复以及业务在灾备站点运行期间, 内部和外部的支持团队以及相关 工作人员按照所定义的工作内容为业务的持续运行服务。对于计划内切换流程, 其大部分内容与计划为流程相同, 通常由通知负责恢 复的人员开始, 直到提供业务恢复所需的服务。 计划内切换可能是由于演习或需 要进行站点级的设备维护造成的, 有很强的计
15、划性, 灾备站点人员应该提早完成 恢复业务运行的准备工作,如所有工作人员到位等。3.2.3.非切换异常处理流程切换流程用于处理不会导致业务切换的异常事件, 如部分设备的损坏没有影 响业务处理的正常运行,或备份中型和 /或灾备中心发生异常等。虽然这些异常 事件不会对业务的运行造成直接影响, 但是使系统整体的稳定性降低, 业务运行 的风险加大了,而且这样的事件大量存在, 应该引起足够的重视。 初步计划的非 切换异常处理流程如下:1. 发现并确定灾难情况 运行中心运行保障室是负责发现可能导致业务系统灾难的事件的主要部门。 同时,网络维护室、 系统维护室和安全管理室等其它部门应该将所发现的可能导致灾难
16、的时间随时向运行保障室报告。2. 通知负责恢复的人员运行保障室按照预定程序通知业务持续管理小组的值班人员,值班人员需要监控事件的发展,必要时将向业务持续小组负责人通报。当发生可能导致业务处理中心的情况后,需要通知以下人员:信息中心主管业务持续管理小组负责人业务持续行政小组负责人负责维护发生以外事件的系统的部门负责人3. 判断异常影响程度业务持续管理小组和/或业务持续行政小组的负责人在判断异常影响程度的 基础上,做出不启动的决定。4. 异常处理在通知恢复的人员过程中,发生异常的站点的值班人员必须并立即投入异常 恢复工作,并与内部和外部的支援团队取得联系,获得相应支持。4. 灾难恢复预案容灾系统建
17、成之后,必须能够发挥相应的效益。鉴于本次容灾项目为数据级 的容灾系统,在发生系统故障的时候,需要手工对应用系统进行切换,因此,我 们应对各种系统状况提前做出操作预案,这样才能保证容灾系统真正发挥效益。4.1. 计划内和计划外停机的切换步骤.计划内停机生产中心操作:检查生产中心和容灾中心所有的主机、存储、网络、卷复制软件是否都正常;正常停止生产中心的所有应用;断开产中心和容灾中心的复制关系;容灾中心操作:阵列上的卷给容灾中心的主机;手工启动应用系统;4.1.2. 计划外停机生产中心不能做任何操作的情况;容灾中心操作:阵列上的卷给容灾中心的主机; 手工启动应用测试;4.2. 设备故障的影响和处理4
18、.2.1. 生产中心主机故障I 一台主机问题;应用切换到另外的一台主机;对应用有小切换的影响; 两台主机问题或者问题;数据切换到容灾中心;在容灾中心启用应用;对 应用有大切换影响;4.2.2. 生产中心存储系统故障I阵列自己的冗余功能;替换故障备件;对应用无影响; 阵列不能冗余问题(2块控制器故障;多块硬盘同时故障),数据切换到容 灾中心;在容灾中心启用应用;对应用有大切换影响;.复制链路故障数据复制中断;对应用无影响;链路恢复后数据正常复制;.容灾中心设备故障容灾中心设备故障对应用系统无影响。4.3.实施风险提示根据的业务应用需求,本方案旨在用最低的投资达到所需在60分钟心实现应用系统切换的
19、系统容灾效果,无法规避如下风险因素:应用系统的自动实施切换本方案在需要切换系统时,必须人工干预,无法实现自动切换;数据库数据异常当数据库数据存在异常时,容灾系统在进行切换时首先需要进行数据数据的 回滚才能启动数据库,回滚时间视数据库的数据量而定,可能会超出60分钟的恢复时限。(所有容灾方案均无法规避该问题)同城灾难本容灾方案无法规避地震、电网大规模断电等覆盖全市的灾难恢复;5. 应急管理预案5.1. 紧急响应策略5.1.1. 紧急相应策略概述紧急响应策略包括三个部分:紧急事件响应、恢复和复原。紧急事件响应包 括为保护生命和减轻损失所采取的最初行动策略。恢复是指继续支持关键业务所 采取的步骤。复
20、原是回到业务的运行状态。紧急响应策略是用于减少紧急事件对业务连续性造成负面影响的一套机制、计划、方法和规程。紧急响应策略包括建立和管理紧急事件运作中心,该中心用于在紧急事件中发布命令。紧急事件响应方式概述紧急事件响应方式根据不同类别的紧急事件,由有关部门组成紧急事件响应 指挥中心,用户主管领导人担任总指挥,统一领导、统一指挥紧急事件处理,协 调、调动相关力量和资源,决定采取处理紧急事件的重大措施;确定对外口径, 指导对外新闻发布;其中容灾工作委员会的主要指责是组织开展对紧急事件的监测与报告、分析和预警;需要启动紧急事件紧急预案时,提请决策层批准,进行组织和协调专业技术机构及其人员进行现场调查与
21、处理,实施现场撤离与抢修等紧急处理措施;组织制定有关的调查方案、技术标准和规范;依照条例规定 及时对紧急事件评估;发布、通报紧急事件信息,可以授权其他部门向社会发布 本行政区域紧急事件信息;开展健康教育、技术人员培训和演练;会同有关部门提出物资和经费储备计划;检查督导紧急事件紧急预案的落实情况等。5.1.2. 紧急响应和运作的需求1、识别潜在的紧急事件类型和所需的响应(如火灾、危险物质泄漏、疾病 等)2、识别现有的、正确的紧急事件相应规程通知规程:(1)内部的(逐级规程),包括本地的、机构的。(2)外部的(响应规程),包括公共机构和媒体、产品和服务的供应商事件前的准备:(1)根据灾难的类型:自
22、然事件、事故、有意的破坏(2)管理和职权的连续性(3)指定人员的角色紧急措施:(1)疏散(2)医疗和人员咨询(3)危险材料响应(4)灭火(5)通知(6)其他设施的稳定:消减损失:测试规程和责任:3、建议制定还没有的紧急事件规程,规程包括以下内容: 人员的保护:(3)人员集合的位置以及确保所有员工识别和安全的过程,如果需要包 括适当的逐级过程(4)认识和了解充分和更严格地履行任何相关法律要求的重要性(5)识别直接部署和后续合同的选项(6)了解法律规定的内在意义事件的控制:(1)了解拯救和控制损失的原则(2)了解用于控制业务影响的紧急事件服务工作进行补充的可用选项(3)了解业务功能本身控制灾难影响
23、的可能性后果的评估:(1)分析形势并提供有效的评估报告(2)评价事件对机构的直接影响(3)将形势通报给相关设施和机构其他地点中的员工(4)提供对媒体可能关注事项的理解并与现存的公共关系和 /或市场部门 联合制定响应方案决定最适宜的行动:(1)了解在建议或决定连续性选项过程中需要考虑的事项(2)了解紧急事件服务的角色(3)维护安全的原则(人员、物理和信息)4、将灾难恢复、业务连续性规程与紧急事件规程整合起来5、识别管理紧急事件的命令和控制需求 设计和装备紧急事件运作中心 在事件中命令和决策的职权角色 通信载体(如邮件、无线电、信使和移动电话等)6、建议制定对角色、职权进行定义的命令和控制规程以及
24、管理紧急事件的 通信规程开启紧急事件运作中心 紧急事件运作中心的安全 紧急事件运作中心团队的进度安排 紧急事件运作中心的管理和运作关闭紧急事件运作中心7、紧急事件响应和分类救护 制定、实施和演练紧急事件响应和分类救护规程, 包括确定紧急事件中行动 的优先顺序制定、实施和演练分类救护规程,如急救和医疗;确定地点和制定到附近医 院的运输规程8、拯救和复原需求集合适当的团队:(7)了解通过电话进行有效诊断的需要(8)了解在受到影响的地点对相关资源进行有效集中的需要(9)制定内部逐级规程以便在事件 /响应展开的现场提供所需等级的资源 定义初始现场的行动策略:(1)了解对直接消减损失和拯救需求进行识别的
25、需要(2)了解其需求并在需要的情况下准备站点保安、安全和稳定措施计划(3)识别保护现场资产的适当方法,包括设备房产和文档(4)认识建立与外部机构联络的潜在需求(如法律法规、紧急事件服务 如消防部门以及警察、保险公司、损失理赔等)(5)了解业务需求和对其进行解释以协助物理资产的恢复( 6) 与公共当局建立设施访问的规程(7) 与第三方服务提供商尽力规程,包括适当的合同协议9、确保紧急事件响应规程与公共当局的要求相统一5.1.3. 紧急响应场所的分类和功能、建设描述紧急响应场所至少包括避难所( )、紧急操作中心( )、紧急事件运作中 心( );紧急响应场所建设描述, 包括建设内容、 设备需求、场地
26、需求、环境需求等; 紧急事件运作中心是紧急指挥体系的首脑部门, 也是紧急事件处理指挥的场 所。实现对紧急事件的分析、计划、组织、协调和管理控制等指挥功能。紧急事件运作中心的总体目标是: 面对紧急事件, 能够为指挥首长和参与指 挥的业务人员和专家,提供各种通讯和信息服务,提供决策依据和分析手段, 和 指挥命令实施部署和监督方法能及时、有效地调集各种资源,实施事故、 灾难控 制和抢修救治工作, 减轻紧急事件对生命安全和业务造成的威胁, 用最有效的控 制手段和最小的资源投入,将损失控制在最小范围内。紧急事件运作中心基本功能包括:1. 紧急事件的评估与触发启动,根据对各种资料数据的分析评估,对事件进行
27、级别判定,经核实后向相应级别的部门提出预案启动建议。2. 指挥功能:指挥现场为参加指挥首长提供会议设施、桌面终端网络、电 话系统。参谋人员为首长提供各种辅助决策信息。3. 通讯功能:利用专线、因特网、卫星网络、电话设备、移动通讯设备与 及其他相关单位的通讯网络。4. 信息收集分析功能:收集、整理各种相关信息资源。紧急事件运作中心应急指挥系统具有以下六大功能:(1)可实现针对特定事件的特定范围内资源实时调度方案的辅助制定,合 理配置有关资源,及时控制事件蔓延。(2)可实现对特定范围内紧急事件的实时监测,及时发现突发事件。(3)可生成针对不同应急事件的多种处理预案。(5)可实现具有真实感的虚拟环境
28、下的事件演化模型,并对处理方案的预 期效果进行模拟。(6)可实现相关资源管理业务和信息管理的统一性和一致性,并实现网络 化远程调度管理,从根本上提高管理效率。5.1.4. 紧急场所设施使用人员的权限分配建议制定对角色、 职权进行定义的命令和控制规程, 考虑管理和职权的连续 性。5.1.5. 紧急事件发生前的监测、监控与预警系统监测、监控与预警系统是紧急预警处理的基础。 平时细致有效的监测与监控 是第一步。一旦发现有紧急事件出现, 对局部事件进行实时监控, 就可以展开及 时的调查和分析,防止事件的扩散, 在全面分析和科学判断的前提下, 发出预警 信号,提醒企业和社会进行相关的应对和准备工作,防患
29、于未然。监测预警主要包括:火灾监测供电监测监测急救监测 影响区域监测以上部分根据风险分析来完善。预警系统是指对监测数据进行整合、分析和判断,建立诊断和预测模型, 对 易造成重大危害的分布状态及危险因素进行早期报告。紧急事件紧急预警处理系统要想达到高效、 快速反应, 首先必须形成完全覆 盖,不留漏点。 但完全覆盖必然涉及到社会的方方面面, 其中包括许多单位和行 政、事业单位。5.1.6. 紧急事件发生后的紧急事件响应程序紧急事件的一般响应程序是:紧急事件 应急预案 转入准备状态制定技术标谁和规范发布 通报 信息启动其它抢 修、预防及相 关措施应急处理预案结束紧急事件的一般处理程序包括事件通知、事
30、件评估、紧急预案启动及相关措 施;5.1.6.1事件通知通知规程事件的发生可能有先兆也可能没有先兆。 例如,飓风将影响某个地区或计算 机病毒会在某日发作经常会得到实现通知。 但是,设备故障或者犯罪活动就可能 没有先兆。 通知规程应该在计划中包含这两种情况。 适当的通知对减少系统的影 响是很重要的; 在一些情况下, 它可以为允许系统人员正常关闭系统避免系统崩 溃赢得足够的时间。 在灾难发生后, 应该通知损害评估小组使其能够确定事态的 严重程度和下一步将要采取的行动。 损害评估完成后, 应该通知相应的恢复和支 持小组。可以通过各种方法完成通知,包括电话、传呼、电子邮件或者移动电话。由 于无法确定能
31、否有效恢复, 所以通过电子邮件发送通知应该谨慎从事。 在工作时 间发送的通知应该发送到办公地址, 在局域网停顿的事件中可以使用个人电子邮 箱传送消息。在影响广泛的灾难事件中, 有效的通知工具是电台、 电视广播和网 站。通知策略应该定义在事件发生后人员无法联络时的规程。 一种通知方法是呼 叫树。这种技术指定特定人员执行通知任务, 此人负责通知其他的恢复人员。 呼 叫树应该包括主要的和备用的联络方法, 应该讨论在某个人无法联系时应该采取 的规程。下面是一个呼叫树(举个例子) :需要通知的人员应该在计划附录中的联系清单中标明。 这个清单确定人员在 其团队中的职位、姓名和联络信息(如家庭、工作电话号码
32、及传呼号码、电子邮 件地址和家庭地址)。通知还应该发给会因为不知情而受到负面影响的外部机构或者互联的伙伴 系统。根据中断类型的不同,可能具有恢复能力。所以,与外部机构相连的每一 个互联系统应相互协助, 协助的方式应该根据所提供的系统互联协议确定。 这些 应该被列入计划的附录中。通知中所传递的信息类型应该在计划中载明。 所传递的信息数量和详细程度 可依据被通知的团队而定。根据需要,通知信息可以包括以下内容:所发生或者将发生的紧急情况的性质 死亡或者受伤情况任何已知的评估结果响应和恢复的细节 何时何地召集会议介绍简况或者听取进一步的响应指令 在评估期间进行重新部署准备的指令使用呼叫树完成通知的指令
33、(如果需要)5.1.6.2.损害评估要确定紧急事件后如何实施紧急计划, 对系统损害性质和程度的评估是非常 重要的。这个损害评估应该在能够确保人员安全这个最优先任务的前提下尽快完 成。所以,如果可能,损害评估小组是第一个得到时间通知的小组。损害评估规 程对于不同的系统是不同的;但是应该涉及到以下领域: 造成紧急情况或者中断的原因 潜在的附加中断和损失 受到紧急情况影响的区域 物理架构(如计算机室结构的完整性、电源、电信、以及制热、通风和 空调)的状况设备的总量和功能状态设备及其存货的损失类型 被更换的项目(如硬件、软件、固件或者支持材料) 估计恢复正常服务所需的事件在书面计划无法得到的情况下 ,
34、具有损害评估职责的人员应该了解和能够执 行这些规程 .一旦系统的影响被确定 ,就应该将最新信息和对此情况的响应计划通 知给适当的团队。通知应该按照通知规程进行。5.1.6.3.计划的启动只有当损害评估的结果显示一个或多个系统启动条件被满足时, 紧急计划才 应该被启动。如果满足启动条件, 紧急计划协调人或者应启动计划。 各机构的启 动条件各不相同, 应该在紧急计划策略条款中予以说明。 条件可以基于以下方面: 人员的安全和 /或设施损失的程度系统损失的程度系统对于机构使命的影响程度 预期的中断持续时间一旦明确了系统损害, 紧急计划协调人就可以选择适当的恢复策略并通知相 关的恢复团队。5.1.6.4
35、.通知和启动阶段模板本阶段涉及到用来探测和评估由(系统名称)中断造成的损害的最初行为。 基于对事件的评估,可以通过紧急计划协调人启动计划。在紧急情况下, 在执行通知和启动规程前(机构名称) 的最优先任务是保护 人员的健康和安全。关联人员的联络信息列在附录中,通知顺序如下: 最初的反应是通知紧急计划协调人。 所有已知的信息被传递给紧急计划 协调人。(系统负责人) 与(损害评估小组负责人) 联系并将事件通知他们。(紧 急计划协调人)指示团队负责人开始评估规程。(损害评估小组负责人) 通知小组成员并指导他们完成以下评估规程以 确定损害的范围和预计的恢复时间。 如果由于安全条件的限制无法在本 地继续损
36、害评估,(损害评估小组)可以遵循以下指导。损害评估规程:应该列出详细的行动规程,包括确定中断原因、确定潜在的附加中断或者损 害、确定受影响的物理区域和物理设施的状态、 确定包括需要更换的设备在内的 设备的功能和总量的状态、预计将服务恢复到正常运行状态所需的时间。接到(紧急计划协调人)的通知后(损害评估小组负责人)应该.(损害评估小组)应该.备用评估规程:接到(紧急计划协调人)的通知后(损害评估小组负责人)应该.(损害评估小组)应该.当完成损害评估后,(损害评估小组负责人)将结果通知(紧急计划协调人)(紧急计划协调人)对结果进行评估并确定是否启动紧急计划以及是否需要 重新进行配置。依据评估结果,
37、在适当的情况下(紧急计划协调人)将评估结果通知国家紧 急情况相关人员(如警察、消防)。以下一个或者多个标准得到满足将启动紧急预案:1、(系统名称)超过规定时间内无法使用。2、设施受损并且超过规定时间内无法使用。3、其他适当的标准。如果要启动紧急预案,(紧急计划协调人)要通知所有团队的负责人并 将事件的细节以及是否需要重新配置通知他们。收到(紧急计划协调人)的通知,团队负责人要通知各自团队。应该将 所有适当信息通知团队成员,团队成员应该做好响应和重新配置的准 备。(紧急计划协调人)要通知(离站存储设施)发生了紧急事件并且(损 害评估确定的情况下)将所需材料送到(备用站点)紧急计划协调人) 要通知
38、(备用站点) 发生了紧急事件并要求其为 (机构)的到达进行准备。(紧急计划协调人)要将事件的大致情况通知剩余人员(通过通知规 程)。5.1.6.5.局部事故紧急响应预案局部事故应急预案指企业单位针对本单位存在的现实危险和有可能发生的 事故,在积极预防的基础上, 为避免和防止事故中人员伤亡和财产损失扩大而实 施应急救援的组织方案和行动计划。(一)应急预案的编制原则1、应根据本单位危险源的特点编制,要有较强的针对性。2、救援措施、避险要领应该简洁明了,有较强的可操作性。3、应急救援预案的编制应遵循企业自救与社会救援相结合的原则。(二)应急预案的主要内容1、危险源辨识及评价结果。2、事故类型及可能造
39、成的危害分析。3、事故应急救援及紧急避险措施。4、事故应急救援组织指挥机构、救援队伍及职责分工。5、事故应急救援器材、装备。6、需请求社会救援的事项。7、事故应急预案演练的考核评价标准。8、事故应急预案管理制度。(三)应急预案制定的基本程序及要求 应急预案的制定是针对各项事故应急措施 (含信息 )、程序和行动计划的文件 化过程。预案的制定应按如下程序及要求进行。1、危险源评估。通过辨识危险因素和危险部位,确定危险 (危害 )类型。2、事故类型与危害分析。事故类型与危害分析是在危险源评估的基础上对24 / 31其可能发生的危害类型进行分析认定, 从而科学地预测可能发生事故的类型及事 故产生危害的
40、大小,以此作为制定事故应急措施的依据。3、制定应急措施。根据不同的事故类别、事故危害等,研究制定相应的应 对措施。对可能发生无法直接施救或可产生较大次生灾害的事故要给予特别关 注,制定紧急疏散等应急措施,防止盲目施救导致伤亡扩大。4、根据事故应急措施需要,制定应急救援装备、器材配置方案。主要包括 抢险器材设备、人员防护装备、通讯设备、救护器材设备的种类和数量等。5、制定应急救援组织指挥机构和应急救援队伍方案,并明确职责分工。保 证事故应急救援组织指挥机构在发生事故时能根据事故状况实施有效的协调指 挥;应急救援队伍能够实施有效的应急抢险、排险、救援、救护等工作。6、分析确定需社会救援的事项。为了
41、在发生重、特大事故时能够及时得到 有效的社会救援支持, 应依据可能发生的事故类型及危害, 分析确定需要社会救 援的事项,纳入预案管理。7、制定有关人员培训内容和预案演练考核标准。为使应急指挥人员和救援 队伍掌握应急指挥与救援要领, 危险岗位工作人员掌握事故状态下应急抢险或避 险逃生的要领,应研究制定相关培训内容和预案演练考核标准。8、形成预案。在上述工作的基础上,经过专家评审和领导审批后,作为执 行性文件。特大事故应急救援预案应报有关管理部门备案。(四)预案措施的落实与管理 应急救援预案确定后,企业单位的主要负责人要组织预案措施的落实工作。(五)预案演练预案演练是保证一旦发生事故, 预案可以有效发挥作用的重要环节。 演练的 主要内容:1、事故报告与接报。 包括第一时间的事故现场人员或事故发现人员的报告; 事故单位接报响应; 事故单位向当地政府及其应急保障系统报告, 请求外围应急 救援支援及其接报响应。2、事故发生后第一时间的现场应急抢险或避险。3、事故应急调度指挥部指挥与抢险。包括指挥部人员迅速赶赴现场预定位 置指挥抢险工作; 通
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东梅州市丰顺县2026年初三调研试题(二)语文试题含解析
- 人工气道感染的控制与预防
- 孙子兵法保险销售管理手册
- 学校后勤产业管理部门设置及人员设置调查表模板
- 学校安全管理实施细则
- 外出营销商户方案(3篇)
- 兰州活动营销方案(3篇)
- 幸运营销方案(3篇)
- 地摊营销方案探讨(3篇)
- 店铺营销方案-模本(3篇)
- 双重预防体系培训试题(含答案)
- 病媒生物防制培训资料
- 《城市管理学(统设课)》机考题库
- DB53∕T1010-2021 滇黄精林下栽培技术规程
- (17)义务教育劳动课程标准日常修订版(2022年版2025年修订)
- 矿山测绘基础题库及答案
- 肝素类抗凝药药理及临床应用指南
- 腹直肌分离教学课件
- 钢结构高栈桥施工监测监控措施
- 2025版煤矿安全规程学习培训课件
- 工地安全用电知识培训课件
评论
0/150
提交评论