数腾电力行业调度部门指导手册_第1页
数腾电力行业调度部门指导手册_第2页
数腾电力行业调度部门指导手册_第3页
数腾电力行业调度部门指导手册_第4页
数腾电力行业调度部门指导手册_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数腾电力行业调度部门指导手册上海数腾软件科技有限公司2015.3版本V1起草人李红群1. 简介电力行业业务系统介绍和描述31.1 D5000业务系统31.1.1 SCADA系统41.1.2 FES系统51.1.3 PAS系统51.1.4 AGC系统61.1.5 AVC系统61.1.6 DSA系统71.1.7 WAMS系统71.1.8 GIS系统81.1.9 IALARM系统91.1.10 监控系统101.2 DTS系统111.3 EMS系统121.4 OMS系统122. 电力行业调度部门机房安全现状和未来发展132.1 电力行业调度机房存在的风险(产品可以解决的)132.2 其他问题142.3

2、 电力行业服务器及业务系统保护现状及未来趋势153. 电力行业调度机房问题解决方案153.1 “D5000保障平台”实现一对多应急保护163.2 “D5000保障平台”能改善备份和恢复机制163.3 “D5000保障平台”实现服务器的在线迁移173.4 “D5000保障平台”业务升级和新员工培训利器173.5 “D5000保障平台”减轻机房工程师的工作压力184. “D5000保障平台”应用部署和产品配置184.1 应用部署184.2 方案配置清单225. 调度部门进行方案介绍需要注意的问题255.1 “仿真平台”和DTS的区别255.2 恢复和迁移不是同一个的概念265.3 备份、应急、恢复

3、需要严格区分265.4 自动接管和手动接管的区别265.5 工作效率取决于网络和服务器的性能275.6 保障平台对D5000有没有影响276. 数腾D5000保障产品特色(我们和传统保护模式的区别)281. 简介电力行业业务系统介绍和描述 本章主要介绍电力行业的主要业务系统,电力行业的主要业务系统包括D5000(智能电网调度技术支持系统)以及DTS(电网调度员培训仿真系统)、EMS(能量管理系统)、OMS(电网调度生产管理信息系统)等,下面具体描述每个业务系统的组成架构和在电力行业的作用。1.1 D5000业务系统D-5000平台直接承载着实时监控与预警(新EMS)、调度计划(OPS)、安全校

4、核(SCS)和调度管理(OMS)四大应用平台,对提高电网的调度运行水平、加快调度机构的标准化建设和提高调度业务精益化的管理具有重要而深远的意义,是电网调度部门核心的业务系统。 图1 总体结构图 平台包括电力中间件、调度计划应用和调度管理类应用系统,实现了电网运行实时监控、在线稳定性分析、调度业务管理等功能。子系统包括:能量管理系统、动态稳定预警系统、广域相量测量系统、电力计划管理系统、调度员培训模拟系统、水调自动化系统、继电保护及故障信息管理系统、调度生产管理信息系统、电力调度数据网络系统、雷电监测系统、电网稳定自动控制装置、微机继电保护装置、电网仿真计算系统、变电站自动化系统、发电厂计算机监

5、控系统等。1.1.1 SCADA系统 SCADA系统(Supervisory Control And Data Acquisition系统,即数据采集与监视控制系统)作为D5000系统的一个主要的子系统,有着信息完整、提高效率、正确掌握系统运行状态、加快决策、能帮助快速诊断出系统故障状态等优势,现已经成为电力调度不可缺少的工具。它对提高电网运行的可靠性、安全性与经济效益,减轻调度员的负担,实现电力调度自动化与现代化,提高调度的效率和水平中方面有着不可替代的作用,它的主要系统模块如下图:图2 SCADA系统1.1.2 FES系统 FES系统是D5000的前置机系统,实现D5000和场站与其他调度

6、中心与外部系统之间的数据采集和交换。接收变电站的通讯管理器发送的远动信号,前置机处理后发给后台系统。由前置服务器和数据采集子网段、数据采集接口设备等组成。前置的基本任务是信息交换、命令传递、规约的组织和解释,通道的编码和解码、采集资源的合理分配。报文监视和保存、维护界面管理的任务。具体架构如下:图3 FES系统1.1.3 PAS系统 电力调度自动化系统高级应用系统(PAS)的功能主要是利用调度自动化系统SCADA采集的电力系统各种信息,在实时型和研究型模式下,对电力系统的运行状态进行分析,帮助调度人员了解和掌握电力系统的实际运行状态,预测和分析电力系统的运行趋势,对电力系统运行中发生的各种问题

7、作出正确处理。PAS在提高电力系统的安全性和经济性方面,正发挥着重要的作用。1.1.4 AGC系统 AGC(系统自动发电量控制系统 Automatic Generation Control)是能量管理系统EMS中的一项重要功能,它控制着调频机组的出力,以满足不断变化的用户电力需求,并使系统处于经济的运行状态AGC系统。具体架构如下:图3 AGC系统1.1.5 AVC系统AVC是自动电压控制(Automatic Voltage Control)的简称。它是利用计算机和通信技术,对电网中的无功资源以及调压设备进行自动控制,以达到保证电网安全、优质和经济运行的目的。AVC装置的功能是:装置作为电网电

8、压无功优化系统中分级控制的电压控制实现手段,是针对负荷波动和偶然事故造成的电压变化迅速动作来控制调节发电机励磁实现电厂侧的电压控制,保证向电网输送合格的电压和满足系统需求的无功。同时接受来自省调度通讯中心的上级电压控制命令和电压整定值,通过电压无功优化算法计算并输出以控制发电机励磁调节器的整定点来实现远方调度控制。1.1.6 DSA系统DSA(在线动态安全评估和预警系统 dynamic security assessment )。基于电力系统在线数据和实时动态信息,在给定的时间间隔(5-10分钟)内对电力系统做出安全评估,给出稳定极限和调度策略。以保障电力的安全稳定运行。1.1.7 WAMS系

9、统 WAMS系统 (电网广域监测系统 Wide Area Measurement System)对全网同步相角及电网主要数据的实时高速率采集。采集数据通过电力调度数据网络实时传送到广域监测主站系统,从而提供对电网正常运行与事故扰动情况下的实时监测与分析计算,并及时获得并掌握电网运行的动态过程。具体架构见下图:图4 WAMS系统1.1.8 GIS系统GIS(地理信息系统geographic information system)是将电力企业的电力设备、变电站、输配电网络、电力用户与电力负荷和生产及管理等核心业务连接形成电力信息化的生产管理的综合信息系统。它提供的电力设备设施信息、电网运行状态信息

10、、电力技术信息、生产管理信息、电力市场信息与山川、河流、地势、城镇、公路街道、楼群,以及气象、水文、地质、资源等自然环境信息集中于统一系统中。通过GIS可查询有关数据、图片、图象、地图、技术资料、管理知识等。架构如下图:图5 GIS系统1.1.9 IALARM系统IALARM系统是智能告警系统,架构如下图:图6 LALARM系统1.1.10 监控系统监控系统主要就是对省网和全网的电厂、变电站进行实时监控,并反馈到图表中,具体见下图:图7 监控系统图8 集中监控图9 省调监控1.2 DTS系统调度员培训模拟系统(Dispatcher Training Simulator,简称 DTS)是一套数字

11、仿真系统,它运用计算机技术,通过建立实际电力系统的数学模型,再现各种调度操作和故障后 的系统工况,并将这些信息送到电力系统控制中心的模型内,为调度员提供一个逼真的培训 环境,以达到既不影响实际电力系统的运行而又使调度员得到身临其境的实战演练的目的。 调度员培训仿真系统通过模拟电力系统和控制中心为调度员提供了一个逼真的环境,以便培训在系统正常、故障和恢复情况下的操作。基本组成部分如下: (1) 控制中心模型(CCM)。控制中心模型应与实际控制中心的环境一致,并且具有 EMS 的各种功能。为达到逼真的效果,SCADA/EMS仿真系统可以模拟在线 SCADA/EMS 所有的功能,并尽可能地做到一致,

12、包括监控系统和在线应用软件,具有相同的显示、相同的人机界面、实现相同的控制和操作。 (2) 电力系统模型(PSM)。电力系统模型模拟电力系统网络及各种设备的响应,包括 网络拓扑、动态潮流、频率计算、稳态计算、继电保护、自动装置、操作培训等模型。 (3)教练员系统(IS)。教员系统具有监视和控制培训过程的功能,包括初始化参数、调整控制参数、教案管理和制作、仿真过程控制、事件处理和数据申报等功能。 教员系统具有灵活的培训支持功能,教员可灵活的设定各种事件、编制各种教案、建立 初始条件进行演示和培训;培训过程中可方便地进行事件的设置、插入、修改和删除,并具 备暂停、恢复、快放和慢放等功能,使教员台操

13、作灵活。1.3 EMS系统EMS能量管理系统是现代电网调度自动化系统(含硬、软件)总称。其主要功能由基础功能和应用功能两个部分组成。基础功能包括:计算机、操作系统和EMS支撑系统。应用功能包括:数据采集与监视(SCADA)、自动发电控制(AGC)与计划、网络应用分析。1.4 OMS系统OMS系统中文全称是电网调度生产管理信息系统。是以一体化管理理念为指导,以现代化信息技术为手段,按照“统一工作要求、统一技术规范、统一业务流程、统一基础资料建设”的“四统一”要求,逐步实现电力调度生产的流程化、规范化管理,实现省、地调的信息共享,加强电网调度业务中各专业的协同工作能力,加强省调对地调的专业指导、行

14、政监督。2. 电力行业调度部门机房安全现状和未来发展电力行业调度机房信息化程度国内是处于领先地位,对核心的业务系统均作了至少双节点的负载均衡或者集群保护。重要业务系统出现问题的概率很小,但是我们和电力行业调度部门的资深工程师进行业务交流,电力行业调度机房还是有一些安全风险,一旦这些风险爆发,会让调度信息部门处于很被动的局面,严重的事故不但会让领导承担相关责任。也让调度信息部门造成严重的损失。这些问题主要分为两部分,一部分可以利用保障平台来解决的,一部分问题是其他方面造成的,需要我们销售去规避。具体问题分析如下:2.1 电力行业调度机房存在的风险(产品可以解决的)u 硬件设备老化:电力机房服务器

15、已经全部实现国产化,硬件设备的一般质保期在5-7年,一旦质保到期,服务器因为长期运行会出现一些问题,一旦设备出现问题,会导致正在运行的业务停顿、数据丢失。如果出现上述情况,造成的损失是巨大的,难以挽回;u 负载集群服务器正在运行期间,如果其中一台出现问题,也能做到业务不中断。但是在维修出问题的设备的时候,会造成单台运行的负载集群服务器压力过大,这段时间一旦出现单台服务器的软硬件故障,会导致负载集群环境彻底崩溃,恢复原生产环境费事费力,期间还要忍受业务中断的风险。u 硬件服务器出现故障,修复完成后,以前的工作模式是需要重新安装操作系统,请南瑞工程师远程或者上门安装操作系统、业务软件以及数据库,同

16、步备份数据(备份数据是定时的,会造成数据丢失),一般需要3天或者更长时间来恢复环境,如果设备硬件出问题,需要修复硬件或者重新采购设备,恢复时间会更长。u 业务系统出现崩溃,D5000的采集子平台的服务器出现过瞬间生产压力过大,导致服务器内存溢出,业务环境直接崩溃的事故。负责全省的采集系统3天内只有一台服务器在运行(正常情况下是两台高性能的服务器负责采集的)。生产压力很大。如果在此期间幸存的服务器也出现软件故障,整个甘肃电网的采集工作都必须停下来。u 业务软件的新版本升级和补丁修复。电力行业业务软件需要定期打补丁或者软件新功能升级。D5000平台现在还处于完善阶段,经常需要南瑞工程师现场或者远程

17、升级。南瑞的工程师在测试环境测试完成以后,直接在生产服务器上打补丁、升级,出现过业务系统因为升级失败导致业务单点运行2天以上的事故。u 电力行业业务软件众多,信息部门的工程师人数有限,基本上每个人的工作量很大,特别是核心业务只有2-3人来维护。新入职的工程师很难给出大量的时间去学习,要求快速上手,在测试环境中学习,没有真实的数据,很难达到好的培训效果。但是在真实的环境下去学习,会对业务环境造成不利影响。比如数据误删除,误操作导致业务崩溃等。新员工的业务能力培训是调度部门的一个头疼的问题。2.2 其他问题u 电力行业对网络要求很高,大区、省、市、县的电网网络是全国统一规划的,一旦出现网络、通讯中

18、断会造成很恶劣的影响,整个大区、省、市、县的网络通讯安全保障其实是电网最关心的问题。这需要加强电力网络通讯面对自然灾害、以外事故的防范能力。u 电力行业工作繁杂,大部分工作是一些重复性的工作,这种模式并不能因为数腾产品的介入而避免掉。这种重复性工作不是机房安全运维的工作,更多是业务之间交互。2.3 电力行业服务器及业务系统保护现状及未来趋势目前电力行业调度部门的服务器和数据保护方式主要是:均做双机集群(重要业务四节点以上),定时对重要数据进行备份。本地硬盘均作了RAID5,同时服务器设备均做了双网卡冗余。在这种情况下,出现硬件故障一般不会导致业务中断,只是数据保护还处于落后阶段,同时应用保护、

19、迁移、恢复还是采取传统方式。(定时备份、停机迁移,重装环境)现状下的保护方式会给电力行业调度部门带来很大的工作维护量,同时还不能保证系统安全。调度部门业务系统现在已具规模,硬件冗余保护已经完成。后期随着虚拟化的发展,和“绿色机房”的概念的传播。D5000进行大数据和云平台的整合可能是一个趋势,如果D5000在虚拟化云平台上运行的话,后期应用和数据安全的工作也需要进行专门的保障云进行保护。传统的保护技术(不针对虚拟化进行保护)和虚拟化自身的保护技术(硬件保护,但是对每台工作的虚拟服务器软件故障无法保护)还是有所欠缺的。一旦D5000云平台和对应的保障云的上线,可以大大减轻机房软硬件维护量。同时让

20、机房的服务器、应用环境、数据安全的保护力度再上一个台阶。3. 电力行业调度机房问题解决方案 在第二章我们整理了电力行业机房面临的一些问题和风险,对于这些问题我们已经做了分类,其中大部分问题利用数腾的电力行业的多业务应急平台可以去解决的。例如:硬件设备老化、集群负载设备单机运行期间业务系统安全问题、服务器宕机业务环境的重新部署、业务软件的版本和补丁升级以及业务软件操作人员的培训等。下面我们针对这些问题,把数腾的调度D5000保障平台特色相结合起来,系统的介绍保障平台怎么解决这些问题。3.1 “D5000保障平台”实现一对多应急保护可以随机接管机房任意需要保护的服务器,任意一台服务器发生数据丢失等

21、故障时,1-2分钟内就可以快速恢复数据并解除故障。任意一台服务器发生硬件损坏、业务系统崩溃等故障,通过短暂的判断时间可以通过自动应急接管方式实现业务接管,接管后的虚拟服务器不需要做任何设置,就可以实现业务的接管,整个过程中毋须人工干涉。一台应急保障设备保护多台服务器。传统的保护模式需要投入大量的硬件设备和软件做应急接管,投入成本是本方案的3-4倍,机房电力等资源消耗增加5倍以上。 采用一对多的应急保护能够很好的防护硬件老化和集群设备故障导致的业务中断,不但能起到快速应急的作用,同时对机房排错赢得了宝贵的时间。3.2 “D5000保障平台”能改善备份和恢复机制 保障平台提供操作系统、应用系统与数

22、据(数据库、文件等)的一体化整机实时备份功能,可实现对需要保护的整体数据的服务器(操作系统、业务系统、数据库、文件等)进行实时备份保护。采用磁盘块级复制比传统的文件级备份提高了5倍以上备份效率,实现备份数据的分钟级验证(1-2分钟内)以及分钟级恢复(1-2分钟内)功能。不仅几秒钟就能恢复单个数据,也可以几十分钟就可以完整恢复一个应用和数据(千兆网络每小时恢复300G的数据),立即启动就可以使用,可彻底改观传统恢复漫长局面。机房内一旦硬件服务器宕机的情况,传统的重建环境方式不但时间长,而且还需要业务厂家现场支持(电力行业核心业务不允许远程),利用整机恢复技术可以摆脱长时间停止业务的不利局面和对业

23、务厂商的依赖。3.3 “D5000保障平台”实现服务器的在线迁移平台提供了Windows、Linux等操作系统和电力行业目前所有的业务系统的快速迁移工具,可以帮助用户快速实现老旧服务器的更替,实现异构服务器(不同硬件品牌)的迁移工作,同时平台工具也支持物理服务器到虚拟机、虚拟机到物理服务以及各种虚拟化系统间的平滑迁移(P2P、P2V、V2P、V2V),以上迁移工作在千兆网络下每小时迁移300G的数据。目前主流的迁移工具在迁移过程中存在迁移成功率低(60%左右)、迁移时间长(每小时基本上在100G左右)、 迁移效率低下等。3.4 “D5000保障平台”业务升级和新员工培训利器电力行业的

24、业务系统版本和补丁升级在原机直接升级是被禁止的,所以一旦开展版本升级和业务打补丁的工作时,均需要搭建和原生产环境一模一样的业务测试环境,在测试环境进过测试成功后,在生产服务器再做升级的工作。这种方式存在两大弊端: A、测试环境需要去手工搭建,费时费力,同时还不能保证搭建的环境和生产环境一致。测试环境测试没有问题,生产环境升级失败的案例层出不穷。 B、生产环境运行稳定,如果直接在生产环境进行版本升级,有极大的可能性会破坏这种稳定性,会使生产环境处于一个危险的环境下运行,增加给生产造成损失的可能性。本平台能够在机房构建一个和机房一模一样的“影子机房”,里面业务环境和数据都是生产环境最真实的模拟,在

25、不影响生产环境和数据保障的情况下,在“影子机房”对生产环境进行业务升级,然后把升级后的业务环境平移到原生产环境。大大的提高了版本升级的成功率; 调度机房的D5000业务子系统众多,每个业务系统的维护量很大,但是机房运维人员有限,怎么让新入职的运维人员快速的熟悉业务环境,这是一个长期困扰调度部门相关领导的问题,搭建测试环境让新同事进行业务培训,但是测试环境没有办法完全模拟生产环境,培训效果不如人意;同样的,贸然的直接让新同事直接在生产环境操作,误操作的风险谁也承担不了。本平台的出现,解决了这个困扰,我们在平台的演练环境下,独立于生产环境,但是又拥有100%的模拟生产环境,一方面能够让新同事在真实

26、的环境下快速上手,同时也保障了生产环境的安全。3.5 “D5000保障平台”减轻机房工程师的工作压力本保障平台做为机房的业务和数据运维保障的工具,能够把电力行业的机房运维人员从大量的硬件、软件预警,维护的繁杂的工作中解放出来。经过我们的调研,电力行业人员有60%以上的时间花费在业务和硬件维护上面。对于新业务软件学习和机房日常工作的维护工作时间被压缩到很少的比例。本平台能够代替机房的工程师完成机房软硬件的故障维护以及业务和数据的保障工作。从而让机房的运维人员有更多的精力去管理好机房,增强机房运维效率。4. “D5000保障平台”应用部署和产品配置4.1 应用部署电力行业的调度部门根据业务的分类和

27、重要程度,把机房分为三块区域,每块区域之间通过专用的通道进行信息交互。具体拓扑如下:图10 调度部门的网络拓扑 和调度部门运维人员进行讨论,由于每个区域不允许建立新的通讯通道,同时为了保障原有网络通信安全。建议分区进行保护,对调度1区、2区、3区进行分区保护,在每个区域进行保障平台部署。同时经过对调度机房进行调研,调度部门已实现全国产化,服务器均采用曙光服务器,应用系统采用国产麒麟操作系统,数据库采用了人大金仓数据库。整体业务均放在南瑞的D5000的大平台上。整体环境存在以下特点:u 服务器配置好,所有服务器均采用曙光高性能服务器。一旦上线保障平台,就要考虑采用高性能设备进行保护;u 所有服务

28、器均作了网卡聚合技术,同时为了多区业务通讯通信,部分服务器至少存在三个网段以上的地址。网络环境复杂。要求保障平台提供多网卡的设备(应急设备至少满足四块网卡)。u 部分业务环境负责全省的业务调度,工作压力很大,对于此类服务器,保障平台上线要考虑到合理的资源分配。基于上述考虑,厂家建议的部署方案是,采用高配、多网卡的设备分区进行保护,部分高业务量的服务器进行应急设备的资源重点分配。只有这样才能够满足调度部门的业务需求。具体保障平台部署拓扑如下:图11 调度一区部署图图12 调度二区部署图图13 调度三区部署图通过对每个调度区域进行部署多保障平台集群,可以保障每个区域的服务器的业务和数据安全,做到R

29、TO和PRO趋近于0,能够做到业务不中断,数据不丢失。同时还能给客户带来运维上的便利,例如业务升级和新员工培训,每个调度区域配备至少两台设备(64G以上内存、4路8核CPU,4个千兆网卡)。本方案考虑到了机房业务增长,具有很好的扩展性,后期还可以做成保障云。4.2 方案配置清单最佳配置:产品名称配置型号产品参数数量D5000保障平台ET-8800-ST硬件模块:标配裸容量32TB SATA企业级硬盘;3U机箱16盘位;双冗余电源;2个千兆网口;标配32GB内存;2颗至强六核处理器。软件模块:标配16个授权点,单台最大支持24个授权点,支持集群管理,最多支持384个授权点;最小数据同步间隔10秒

30、;最大快照数256个,应急虚拟机最大支持16核,应急虚拟机内存支持32GB,单设备支持5台服务器同时接管应急。6台内存建议扩到64G内存CPU2颗16核或者4颗8核处理器网卡增加2颗千兆网卡软件模块对数据库,文件,邮件,操作系统,应用程序等进行一体化实时备份,支持业务快速接管应急。待定备注显卡工作站需要显卡支持,调度部门至少是双屏的,所以至少需要2块显卡。显卡参数待定。2个标准配置:产品名称配置型号产品参数数量D5000保障平台ET-6800-ST硬件模块:标配裸容量24TB SATA企业级硬盘;2U机箱12盘位;双冗余电源;2个千兆网口;标配32GB内存;2颗至强六核处理器。软件模块:标配1

31、2个授权点,单台最大支持18个授权点,支持集群管理,最多支持216个授权点;最小数据同步间隔10秒;最大快照数128个,应急虚拟机最大支持16核,应急虚拟机内存支持32GB,单设备支持5台服务器同时接管应急。6台内存建议扩到64G内存CPU2颗16核或者4颗8核处理器网卡增加2颗千兆网卡软件模块对数据库,文件,邮件,操作系统,应用程序等进行一体化实时备份,支持业务快速接管应急。待定备注显卡工作站需要显卡支持,调度部门至少是双屏的,所以至少需要2块显卡。显卡参数待定。2个5. 调度部门进行方案介绍需要注意的问题 由于电力行业调度部门是一个新的业务增长点,在技术人员和客户交流中发现,电力行业有自己

32、的一些特殊之处,可能和我们面对政府、公检法等行业有一些不同。如果在这些方面和客户交流不到位的话,可能会影响到后期的项目进展。现在把这些问题列举出来一起分享。5.1 “仿真平台”和DTS的区别调度员培训模拟系统(Dispatcher Training Simulator,简称 DTS)是一套数字仿真系统是电力调度系统为了让调度员快速熟悉流程的一个培训平台,它高度仿真调度业务系统。是一个电力行业专有的业务系统。保障平台的“仿真平台”也含有“仿真”两个字,但是“仿真平台”和DTS是有区别的,区别在于以下两点:u DTS是一个电力系统业务的流程的仿真,通过它可以熟悉电力业务系统的工作流程,但是数据均没

33、有在DTS里面,它就一套没有数据的业务系统;但是多业务平台的“仿真平台”可以做到从业务流程到数据和真实的业务环境完全一样。从仿真度而言,多业务平台的“仿真平台”更加有利于调度人员快速熟悉业务流程。这是对DTS的一个很好的补充。u DTS由于没有数据,它不能完成对业务的模块、补丁升级。它在设计之初并没有考虑做为一个电力行业的全模拟的测试平台。一旦业务系统有打补丁的需求,还是需要原始的技术手段实现业务升级。现在多业务平台就能完全补全这个空白。所以和电力客户介绍的时候,务必解释下我们和DTS的不同,不要混为一谈。5.2 恢复和迁移不是同一个的概念 和客户交流过程中,客户很容易把恢复和迁移这两个概念进

34、行混淆,其实这是两个完全不同的概念,现在我们做一下解释,避免销售在客户面前解释不清楚这两个概念。 恢复是指,原有的生产环境被破坏掉,我们利用已经一体化备份的数据,进行原目标机的数据回迁,这叫做恢复。就是从那台服务器备份的数据恢复到原目标机,这就叫恢复;迁移是指,原生产环境条件不能满足生产的需要,把原有环境转移到新的环境里面,新的环境可能和原环境一模一样,也可能物理架构发生了变化。也就是生产环境正常的情况下的数据转移叫做迁移,常见的迁移方式有P2P、P2V、V2V、V2P。最后我们总结一下,恢复就是生产环境除了问题,把生产环境修复到正常的过程;迁移是指在生产环境正常的情况下,把业务环境转移到新的

35、平台上去。5.3 备份、应急、恢复需要严格区分备份是指把数据进行有效的非本机的有效存放和管理,就是为了保障生产环境出了问题,可以进行恢复和应急之用,备份是恢复和应急的前提。应急是指通过备份,把生产环境转化为一个影子机房,一旦生产环境有任何故障,它均可以顶替业务系统工作,保障业务不中断,数据不丢失。恢复就是上一节解释的,是对生产环境的由损坏到正常的一个过程。5.4 自动接管和手动接管的区别电力行业客户要求所有的业务系统要进行自动接管处理,自动接管就是通过对网络环境的侦听,一旦发现原生产环境的地址侦听不到,就自动把应急平台相应的虚拟服务器启动起来进行业务接管,整个过程不需要人为干涉。但是对于一些带

36、有大量业务数据的服务器,我们不建议采用自动接管的方式,一旦数据出现问题,我们进行的是一比一的备份,可能我们的最新的备份数据也可能有问题,自动接管的服务器数据是不对的,建议一旦出现这种情况进行手动接管,判断出错时间,把历史时间中离错误时间最近的正确的时间点启动起来,保证数据完整性、正确性。5.5 工作效率取决于网络和服务器的性能在电网的测试过程中,客户经常关心两个问题,保障平台到底最多能承接几台服务器的保障,设备最多坏几台平台就不能保护了?平台的备份速度为什么不是一致的?我们需要怎样回答客户的问题呢。首先保障急平台最多能保护几台服务器,多少台服务器坏掉设备可以应急。这两点并不取决于我们的软件性能

37、,如果保障平台的硬件条件足够,这个数字理论上是没有上线的。但是由于硬件服务器的限制,我们的保障数量和应急数量都是有一定限制的。如果客户有对保障和应急的数量要求,我们可以提升硬件性能。其次,备份速度对于保障平台而言,是一个固定的范围,千兆网的情况下,一个小时能够备份300G的数据。备份速度主要取决于机房的网络带宽。数腾的D5000保障平台备份速率已经处于业界的最高水平。5.6 保障平台对D5000有没有影响调度部门的客户有时候会关心,现在D5000运行各方面都比较稳定,增加新设备会不会影响到生产环境的稳定性以及消耗生产环境的资源。对于客户的顾虑,我们不能回答没有或者影响很小可以忽略不计。这种说法客户不会接受。所以我们要用一组表格把这些信息传递给客户,消除客户疑虑。对生产机影响因素影响情况CPU占用率对生产服务器CPU占用率不超过3%(全磁盘同步时)内存占用率占用生产服务器内存不超过100M安装代理占用空间占用生产服务器磁盘空间100M以内是否需要重启服务器麒麟等L

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论