机房搬迁服务搬迁方案总体设计_第1页
机房搬迁服务搬迁方案总体设计_第2页
机房搬迁服务搬迁方案总体设计_第3页
机房搬迁服务搬迁方案总体设计_第4页
机房搬迁服务搬迁方案总体设计_第5页
已阅读5页,还剩63页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节搬迁方案设计的原则 2一、保证业务连续性,合理规划停机时间 2二、周密部署、科学论证、步骤可行 3三、分步实施、分工明确、协调运作 3四、确保应用和数据的可靠性、安全性和一致性 3第二节系统搬迁方法论 4一、风险分析 5二、业务影响分析 10三、制定搬迁整体规划 15四、系统梳理与健康检查 18第三节制定系统搬迁与应急方案 21一、制定系统搬迁方案 21二、搬迁过程中的工具(表格、文档等) 25三、分工界面定义 29四、搬迁与应急方案演练 29五、搬迁前准备 30六、拆卸、包装、运输与安装 30七、系统恢复与健康检查 32八、设备维护与保修服务 33第四节搬迁的工程设计与实施方法 33一、项目管理 33二、总体方案规划 34三、总体方案设计 35四、详细方案设计 36五、方案实施阶段 38六、项目维护阶段 39七、项目验收 39第五节整体搬迁方案设计 39一、搬迁次序设计 40二、搬迁环境的准备 41三、备份 42四、网络出口数据割接 63第一节搬迁方案设计的原则在数据中心搬迁项目中,我们将按照以下原则设计搬迁方案并完成搬迁工作。一、保证业务连续性,合理规划停机时间鉴于搬迁项目的关键性,为了在整个项目期间保证各种应用服务的连续可用性指标,我们在方案设计中最大限度地采用多种高可靠性与可用性保证措施。对于用户方,保证最少的停机时间从而减少业务停顿的影响具有深远的意义。为此,我们在方案设计中,为每项和业务停顿有关的任务制定时间指标,并采取优化措施来尽量缩短每个任务占用的时间。二、周密部署、科学论证、步骤可行在本项目的整个周期内中,我们采用机房搬迁可借鉴的国际最佳实践,即业务连续性计划(业务安全),从搬迁的规划、设计、实施到维护都在科学的指导下进行,而不是依赖少数专家的个人经验。这些业务安全方法论和具体的搬迁方法都经过了实践的考验,经历了从实践到理论,再由理论指导实践的过程,完全能够称得上周密部署、科学论证、步骤可行。三、分步实施、分工明确、协调运作按照业务安全最佳实践,我们将机房搬迁项目自上而下地划分为树状结构的任务,并明确定义了每个任务执行的优先级顺序和任务之间串行或并行执行的顺序,可谓在科学的指导下进行任务细化和分步实施。按照业务安全最佳实践,结合甲方在招标书中的分工界面要求,我们开发了机房搬迁项目的组织架构,并定义了角色职责。我们提供的组织架构定义方法是科学的、经过实践检验了的方法,而不是依赖项目经理的个人经验。按照业务安全最佳实践,对机房搬迁的任务,我们使用面向对象的技术从宏观到微观地定义每个任务。从项目各阶段的框架性任务,到每个搬迁团队成员执行的每个操作步骤,都是在可控的条件下进行的,能够做到有条不紊。四、确保应用和数据的可靠性、安全性和一致性我们在方案设计中最大限度地采用多种高可靠性与可用性保证措施,保证关键应用及其构成组件的可靠性、安全性。我们采用专门的数据备份策略保证数据的完整性和一致性。第二节系统搬迁方法论根据我公司实施多个系统搬迁项目的成功经验,结合BCM的方法论的指导,我们将系统搬迁工作分为四个阶段。如下图:系统分析阶段风险分析业务影响分析制定搬迁整体规划搬迁方案设计阶段系统梳理与健康检查制定系统搬迁与应急方案搬迁与应急方案演练搬迁实施阶段搬迁前准备拆卸、包装、运输、安装系统恢复与健康检查后续服务系统运行情况跟踪设备维护与保修服务系统分析阶段:系统分析阶段主要包括风险分析和业务影响分析,以及制定搬迁整体规划三个步骤,其主要目的是识别系统搬迁过程中的主要风险,提出规避与转移风险的方法。找出系统搬迁对主要业务的影响以及业务系统间的依赖关系,规划系统搬迁的优先顺序,确定达到系统持续目标所需要的资源。搬迁方案设计阶段:搬迁方案设计阶段主要包括系统梳理与健康检查、制定系统搬迁方案和应急方案,以及搬迁方案和应急方案的演练三的步骤。其主要目的是严格确定各系统的范围,明确系统当前的健康状态,明确系统搬迁的主要步骤,明确协作各方的工作与责任,制定各种意外情况下的应急预案,确保搬迁方案的可执行。搬迁实施阶段:搬迁实施阶段的主要目的是完成系统搬迁前的一切准备,完成从关闭应用到应用重新启动的完整搬迁过程。后续服务阶段:后续服务阶段的主要目的是尚未长时间稳定运行的系统提供细致的跟踪保障工作,确保系统顺利过渡到稳定运行状态。除以上内容外,在系统搬迁过程中还包括系统搬迁项目相关的组织机构的建设(如成立搬迁指导委员会做为最高领导机构)、搬迁过程中的沟通计划、项目管理与控制等重要内容。一、风险分析风险分析是系统搬迁工作的第一步。它标识存在的风险、标识与IT系统生命周期(SDLC)关联的风险,找出系统的薄弱环节。风险分析的输出作为风险转移阶段的输入。风险分析包括9个步骤,分别描述如下。第一步:获取系统相关信息1.任务确定评估范围,明确系统边界、资源及组成,明确风险的受体。2.方法(1)IT风险分析的信息采集方法(2)IT模型定义的方法第二步:识别威胁1.任务标识可能发生的威胁。2.方法威胁并不一定代表风险的发生。决定风险的可能性必须考虑3个因素:威胁源、系统的薄弱环节、已经存在的预防措施。第三步:标识系统薄弱环节1.任务标识系统薄弱环节。2.方法标识薄弱源、执行系统安全测试、生成系统安全检查项列表。第四步:分析预防措施1.任务分析组织已经采用的或者计划采用的预防措施,这些预防措施将用来减轻、消除威胁源利用系统薄弱环节的可能性。2.方法获得系统薄弱环节在威胁环境中被利用的几率,必须考虑当前的和计划的预防措施。第五步:决定风险发生的几率1.任务:标识风险发生的几率2.方法:获得在威胁环境中薄弱环节被利用从而发生风险的几率,必须考虑以下首要的因素:(1)威胁源的动机和能力;(2)薄弱环节的属性;(3)当前预防措施是否存在、是否有效。第六步:风险影响分析1.任务:标识风险的影响。2.方法:测量风险级别的重要步骤是决定风险发生后造成的负面影响。开始影响分析之前,获得以下信息是非常必要的:(1)系统执行的业务;(2)系统和数据的重要性(系统的价值和对组织的重要性);(3)系统和数据的敏感度。风险对业务的影响(这些影响的分析就是BIA)重要于风险对IT系统资源的影响。如果还没有对IT系统资源进行评估,系统和数据的敏感度取决于系统和数据的可用性、完整性和机密性的保护程度。系统和信息负责人应该决定不同风险对他们负责的系统和数据的影响级别。和系统和信息负责人会面是分析系统和数据影响的好办法。因此,一个安全事件的负面影响可以描述为以下三个安全目标的任意组合:完整性、可用性、机密性。完整性丢失,导致数据被篡改或破坏,如果不被及时修复,后续任务会出现不准确、虚假、错误的决定。会影响IT系统的可信度。可用性丢失,会导致任务不能执行,减少生产时间,阻碍用户的活动。机密性丢失,会导致国家安全的危险,公众信心的丧失,触发法律问题。有些影响可以根据损失、恢复代价、修正代价来定量分析;有些影响只能定性分析,分为高、中、低三个级别。通常,我们采用定性分析,一般将风险对业务的影响定义为高、中、低三个级别,如下表所示:低中高可用性服务受到周期性的损害服务受到严重损害服务根本不可用持续时间服务停顿时间少于半天服务停顿时间长于半天,少于3天服务停顿时间大于3天范围影响数个单独的个体一个业务功能受到影响多个业务功能受到影响定性和定量分析各有其优缺点。在决定影响幅度的时候,应该不限于考虑以下因素:①评估危险源在某个指定时间段利用薄弱环节的频度;②评估每个危险源利用薄弱环节后的大致花费;③每个危险源利用薄弱环节的相对权重定义。第七步:决定风险级别1.任务标识风险的级别。2.方法评估风险的级别必须考虑以下因素:(1)危险源利用系统薄弱环节的几率;(2)危险源利用系统薄弱环节的影响大小;(3)防止或减弱危险源利用系统薄弱环节的已有的或者计划的预防措施。风险级别是风险发生的几率乘于风险的影响。我们假定风险发生的几率从1到0,1是高,0.5是中,0.1是低;我们假定风险的影响从100到0,100是高,50是中,10是低;划分风险发生的几率和风险的影响的粒度可以在风险分析的执行过程中进一步调整。第八步:预防措施建议1.任务:提供最适合用户组织的预防措施,用于转移或消减风险级别矩阵中已经标识出的风险,从而降低风险级别,降低后的风险级别是系统和数据可以接受的风险级别。2.方法:在建议预防措施和可选方案用于转移或消减已经标识的风险时,考虑以下因素:(1)建议的预防措施的有效性;(2)法律和法规的要求;(3)用户组织的政策要求;(4)对操作的影响(系统性能影响、用户可接受程度);(5)安全性和可靠性要求。预防措施建议是风险分析过程的结果,预防措施建议作为风险转移过程的输入,在风险转移过程中建议的预防措施得到再次评估、优化、执行。并非全部的建议的预防措施得到执行,还需要进行成本效益的分析。二、业务影响分析业务影响分析的主要目的是找出系统搬迁对主要业务的影响以及业务系统间的依赖关系,确定达到系统持续目标所需要的资源。业务影响分析模块的规格指标:第一步:数据采集办法:1.通过问卷采集数据;2.通过访谈进行数据收集;3.通过会议进行数据收集;4.通过已有文档进行数据收集。第二步:业务分析1.任务(1)明确关键业务功能及支持关键业务功能的资源、明确业务流程;(20分析和关键业务功能有关的各业务流程之间的相互依赖关系;(3)分析与和关键业务功能的业务流程有密切联系的其他业务子系统及相关部门、机构之间的相互依赖关系;分析在风险发生时,为保证核心业务的连续,对于这些子系统及其相关部门资源的依赖和需求;(4)定义恢复时间指标RTO和恢复时间点目标RPO。2.方法业务系统的各子系统之间一般以功能边界划分,业务核心子系统是业务系统中的一个或若干子系统。每个业务子系统通过一个或者若干业务功能实现。业务过程是一套能够给顾客带来某种价值的连续的活动(一段信息流或/和一段物流活动),一个业务过程可能贯穿多个业务子系统,并通常包括多个功能;业务过程并不总是可见的;直接分析业务核心功能是非常有效的分析方式;每个子系统可能执行一个或者多个核心功能;在分析某个功能中断后造成的影响时,理解这些核心功能和最终顾客的关系是非常关键的;下面的方法用于理解核心功能和业务流程:(1)检查、回顾相关文档,理解用户组织的结构和意图;(2)和用户的业务部门、技术部门、信息中心等核心人员进行面谈,获取业务情况的一手信息。详细进行会谈准备,通过一次交流获得业务分析、运营影响、财务及非财务影响的所有信息;(3)根据上面获得的信息进一步完善业务流程图。这些流程图将描述每一个核心业务功能,并描述作为过程输入输出的信息及服务的流程,顾客也作为流程中的一个环节。(4)描述基本支持功能。有些子系统为许多其他子系统提供基本支持功能,例如LDAP功能。当生成和执行恢复计划时,这些信息是非常重要的;(5)生成一个核心功能矩阵,描述业务子系统核心功能之间的关系;(6)确认理解了各业务子系统及其核心功能、业务流程、相关的管理。3.提交物(1)与核心功能有关的文档;(2)非核心功能的流程描述;(3)业务功能分类及描述。第三步:运营影响分析1.任务(1)标识和书面化化每个风险对每个业务功能的关联影响;(2)书面化核心功能之间的关系,资源和组织机构之间的依赖关系;(3)书面化每个风险事件造成的公共影响。2.方法运营分析包括以下步骤:(1)采集信息,获取与所有核心功能相关的每个风险事件对组织机构及公共的关联影响;(2)分析和每个核心功能相关的信息。决定每个业务功能的MAO(可接受的最大损耗)、标识每个业务功能的组织依赖关系、标识每个业务功能的资源依赖关系;(3)为所有核心功能相关的信息生成提交件。包括:与所有核心功能相关的每个风险事件对组织机构及公共的关联影响,组织依赖关系列表,资源依赖关系列表;(4)可以通过和每个业务子系统关键负责人员访谈来采集信息。三个基本的风险事件是应用失效、存取失效、设施失效。(5)应该为参与访谈者提供测量业务功能关键程度的例子。如果某个业务功能出现风险将对人员和公共安全造成影响、对法律造成破坏,那么这个业务功能的关键性就特别高了。关键性越高的业务功能,它的MAO就越小。(6)需要将访谈内容整理成文档。(7)分析每个核心功能相关的运营信息,决定核心功能的MAO的时间基准。这个时间基准是开发恢复策略时参考的基准。3.提交物核心功能一览表,包括以下内容:(1)每个风险事件导致的每个核心功能的关联影响;(2)每个核心功能的资源依赖关系列表;(3)每个核心功能的组织依赖关系列表;(4)每个业务功能的风险导致的不同顾客类的影响;(5)按照MAO时间基准大小生成的核心功能列表。第四步:财务影响分析1.任务标识并量化每个风险造成的潜在财务影响,为选择可选的恢复办法提供成本判断依据。2.方法(1)首先决定是否有必要进行财务影响分析;(2)采集信息;定制访谈时设定的问题、获取作用于业务功能的每个风险造成的财务影响、量化财务影响;(3)分析获取的信息;(4)整理获取的信息;定义财务影响的类型、图表化财务影响信息;(5)通过和每个业务子系统的相关人员访谈获得每个风险作用在核心功能时造成的财务影响,尽量量化财务影响,不能量化的话给出原因。访谈后整理访谈内容。(6)分析访谈获取的信息,判断和一个风险有关的哪个核心进程会造成财务影响。计算在MAO时间基准及超出时间基准时造成的财务影响,尽量量化财务影响,不能量化的话给出原因。(7)财务影响的分析数据计算出来后,作为选择可选恢复方法的依据。以MAO的时间基准和财务影响生成直观化的图表是非常有利于分析的。3.提交物风险造成的量化的财务影响。第五步:非财务影响分析对风险造成的人员健康和生命、名誉、法律条款、竞争力等的影响进行分析。三、制定搬迁整体规划制定搬迁整体规划的主要目的是规划系统搬迁的优先顺序,找出合理的系统搬迁计划,合理分配资源,降低系统搬迁对业务持续的影响。其主要的工作内容包括:(一)制定搬迁过程中的存储、服务器整合方案(二)制定使用临时设备方案(三)制定搬迁整体方案(关注系统搬迁的顺序)(四)制定搬迁控制流程(五)寻找系统搬迁承运商搬迁规划制定的规格指标:第一步:标识可选用的规划1.任务标识可选用的搬迁规划,对规划分类。2.方法对于每个可用的搬迁整体规划:(1)标识要搬迁的任务、时间需求;(2)按照关键度、上下层依赖关系来划分时间紧迫性的级别;(3)标识每个领域的专家;(4)按照区域选择团队负责人;(5)检查搬迁中涉及的对象可能发生的问题。第二步:规划整合1.任务纵向使低层次计划顺应高层次计划,横向协调优化(在技术、商务方面)。例如:(1)WAN规划、服务器规划、数据异地同步策略等技术恢复规划,WAN带宽和需要同步的数据量要协调。(2)商务方面的整合要考虑供货的优化、支持服务的优化等。2.办法(1)关注关键业务功能;(2)强调协调性;(3)优化与供应商的合同;(4)每个业务功能需要一个套恢复资源。第三步:规划的评估1.任务评估规划的目标、是否满足业务准则、成本、风险。2.办法(1)制定用于评估的一致的方法:①评估规划的可靠性的方法;②评估规划的成本效益的方法;③比对内部和外部的解决方案的方法;④评估每个规划的风险的方法。(2)进行成本效益分析①跟踪已知的风险问题②围绕业务单元取得大家一致同意③搬迁指导委员会检查搬迁规划可选项(3)是否满足业务需求的准则:①实现关键业务功能的持续性②实现外部因素驱动的业务功能持续性③被确定的其他问题(4)是否满足搬迁目标:①关键业务功能、优先级和内在依赖关系②搬迁关键业务功能需要的时间③恢复信息和通信系统需要的时间④业务接续需要的时间第四步:成本效益分析1.任务在花费和中断时间之间做出平衡。2.办法四、系统梳理与健康检查系统梳理与健康检查的主要目的是严格区分各系统的范围,明确标记各系统的组成,明确各系统的运行状态,为搬迁方案的制定提供直接的参考依据。系统梳理与健康检查主要通过对系统进行现场调研,并填写各种表格完成。(一)系统的标记通过对系统的标记,可以明确系统的组成,区分系统的范围,确定系统间的连接关系。系统的标记规则通常采用用户已有的系统标签标记规则,否则可以根据用户的实际要求在项目过程中确定。(二)系统健康检查通过系统的健康检查可以了解系统的详细情况和系统的运行状态,避免意外的发生。(三)系统备份时间检查由于在系统搬迁过程中,系统数据的备份是必须的步骤,因此,提前确定系统备份所花费的时间对统筹安排系统的搬迁过程具有重要的指导意义。通过检查系统的备份情况还可以确定在搬迁过程中采用何种合理的系统备份方法和恢复方法,验证系统数据恢复的能力。(四)新机房环境检查在系统搬迁之前,新机房的各种物理环境必须满足各种设备的运行要求。安装环境检查表,提出有关安装环境准备的建议事项。在服务器搬迁开始前新机房达到装机要求。新机房环境检查包括:机房环境是否符合标准,新机柜是否能够保证各类服务器的正常上架。工作项目内容是否达到要求备注机房装修是否符合防静电、防火、及其他安全要求?机房综合布线强弱电布线系统是否符合相关设备的要求?地面承重地面承重能力是否符合安装设备的要求?设备安装位置设计是否考虑了足够物理空间用于设备安装?是否为维护操作留出了必须的空间?搬运路线的设计各通道包括电梯是否能保证设备的进入?机房辅助设施工作台、电源插座、电话机、远程维护用的电话线是否齐全?机房环境的温度与湿度OperatingNon-Operating温度:16to32°C10to43°C湿度:8to80%8to80%最佳操作环境(Operating):空间温度:24℃,湿度:50%。空调是否具备调节温度与湿度到指定要求的能力?电源电压范围交流200-240V,50~60Hz,或参阅附录A,部分设备支持直流-48V接地要求电源保护地线的专用接地线电阻应小于1欧姆。测量零-地电压值应小于1V。电压稳定如在电压不稳地区,需装设稳压装置以确保电压在规格内第三节制定系统搬迁与应急方案一、制定系统搬迁方案在完成系统的设备梳理和健康检查后,在系统整体搬迁规划的指导下,需要对每次搬迁的系统制定特定的系统搬迁方案。以下搬迁方案需要根据用户的实际情况和具体要求适当调整。(一)准备工作1.新机房环境检测由用户和XXX公司根据设备安装对新环境的需求,重点对机房空调、粉尘情况、电力(交流电源、直流电源)、电源接地等进行检测;2.确定配套设施是否就位(1)确定新机房所需要的网络综合布线已经完成,并提供相应的竣工文档;(2)确定新机房机架和电源安装完毕;(3)将来放置设备的位置的地板承重要达到要求,对超重的设备要为其做底座;(4)确定新机房微机桌、椅子等办公用品已经就位等。3.由用户提供相关单位/部门负责人联系电话;4.新机房的传输资源安装调试完毕,接口模块就位;城域网落地;5.为了确保割接前新通信线路的载波畅通,要求用户做好环路测试;6.以搬家公司为主、我公司协助准备泡用于搬迁时的设备包装体,对设备进行保护,尽可能避免搬迁过程对设备的损坏。对有特殊搬迁要求的设备,提供专用检测标志;7.检查搬迁设备及设备连线是否做好相应的标记;8.设备备件及备件库位置、备件到位时间确认;9.配置好新购的交换机和路由器,并测试可用。(二)搬迁步骤1.系统准备(1)系统检查、操作系统、应用软件、数据库检查。(2)做全部主机的系统全备份,主备机都要做备份,备份是否成功,需要经过两个工程师进行确认,确保备份数据正确无误。(2)做所有数据库的全备份,备份到第三方存储设备。重要数据(如生产数据库)要做两套备份。(3)每做一个备份,要记录备份时间,操作人,备份方式和备份介质等信息。(4)检查搬迁设备及设备连线是否做好相应的标记。2.设备安装位置确认(1)设备互连线缆预布置;(2)在新机房安装搬迁设备的机柜、配线架、传输设备等等之间,提前放置好涉及到这些设备之间互连的网线和网络设备,以及需要的转换器等;(3)相关设备各技术支持人员现场就位;(4)通知各部门停机时间。3.系统设备搬迁按照业务需要的顺序停机:对于单机系统:先停业务应用程序,再停止中间件和数据库,后停止存储,最后停主机;对于双机系统:先停止双机软件,再停止存储,最后停止主机。4.设备进行拆卸(1)搬运队负责将设备运抵新机房;(2)设备搬迁到新机房后,由搬迁工人负责按照事先指定的位置,将设备放置到位;(3)由各厂商按照已经做好的标签将设备重新组装并连接线缆;(4)工程师再次对电源进行检查;(5)在确认电源正常后,工程师为设备上电;(6)启动数据库和应用程序,并对系统做测试,检查数据是否正常;如有异常,各负责人及时解决。5.系统正常运行,搬迁完毕(三)应急措施在严格按照搬迁步骤进行搬迁的同时,必须严格控制以上步骤中的关键步骤,针对它们我们制订如下应急措施。在必要时候,都可以启动故障升级流程,以保障问题的快速和有效解决:1.数据库数据备份关键过程控制:备份是否成功,需要经过两个工程师进行确认,确保备份数据正确无误。在备份数据前,要确认环境变量中的字符集正确无误。应急措施:如果数据备份不成功,应马上检查原因并排除故障。如果超过1个小时无法排除故障,则取消搬迁工作,寻求数据库厂商技术支持。2.倒入数据关键过程控制:导入数据是否成功,需要经过两个工程师进行确认,确保数据导入正确无误。在导入数据前,要确认环境变量中的字符集正确无误。应急措施:如果数据导入不成功,应马上检查原因并排除故障。如果超过1个小时无法排除故障,则取消工作,并寻求数据库厂商技术支持。3.设备拆卸及运输关键过程控制:在搬迁各设备过程中一定要小心谨慎,谨防碰撞刮伤以免毁坏设备。要搬迁前要进行设备标示,避免搬迁后设备或接口混乱。二、搬迁过程中的工具(表格、文档等)系统搬迁方案主要通过搬迁流程步骤控制表的方式明确搬迁参与各方的责任与任务,完成对搬迁工作的计划和准备。主要表格如下。表格的部分内容应根据用户的具体情况做适当修改。新机房环境检查公共部分序号执行任务描述负责方参与方工程师前置任务完成产生文件系统搬迁前的检查阶段用户方需要确认内部协调部门的负责人、落实人。在搬迁过程中负责协调需要用户方负责的部分。1新机房运行环境检查设计院关于新机房的设计文件《机房测试验收报告》、《机房环境确认报告》、《电源环境确认报告》机房电源环境\接地电源布线检查温度\湿度环境机架位置设计院设计2新机房通讯环境检查设计院关于新机房通讯环境设计文件《通讯环境确认报告》传输环境网络传输要求《网络环境测试要求》传输、时钟、时间服务以《网络环境测试要求》为准《网络环境测试要求确认》网络布线检查设计院设计临时链路检查对链路物理连接可使用情况已经确认;备用链路通过可用性测试《临时链路具备可用条件报告》网络连通性检查网络物理连接建设完毕过渡网络环境检查参照过渡网络环境要求和新环境网络调试完成情况《临时网络具备可用条件报告》系统搬迁流程步骤控制序号执行任务描述责任方参与方工程师前置任务完成产生文件1新机房的环境检查***机房电源环境\接地参照设计《系统具备搬迁环境报告》温度\湿度环境机架位置系统间联线布线系统内线缆标识2设备准备和备份及确认***系统健康检查负责方操作,配合方监督《设备健康检查报告》业务功能测试负责方操作,配合方监督《业务功能性测试报告》系统软件备份由负责方确认备份可用业务软件和数据备份由负责方确认备份可用3系统搬迁过程***系统搬迁通告主要针对内部相关部门《系统搬迁通知》再次确认各种搬迁资源《系统搬迁流程确认报告》停止业务系统应用系统备份完成,具备搬迁环境系统停机系统下架设备包装机柜拆卸运前包装检查运输公司负责的范围界定在“运前”到“拆包”之间的过程,其它过程设备问题,由设备供应商按照正常保修提供设备的保修服务。设备物理搬迁**运输后、拆包前包装检查机柜安装设备上架线缆连接设备加电4设备测试《设备健康检查报告》启动应用5功能测试《业务功能性测试报告》6观察期搬迁方案中所涉及的,在搬迁过程中使用的其他主要文档还包括:《机房测试验收报告》《通讯环境确认报告》《网络环境测试要求》《业务功能性测试报告》《系统及数据备份完成确认报告》《系统具备搬迁环境报告》《系统搬迁参与方列表》《系统搬迁流程确认报告》《包装箱运输单》《设备健康检查报告》《业务功能性测试报告》《系统应急设备确认报告》《子系统初验报告》《平台终验报告》三、分工界面定义在设计搬迁方案的过程中还需要进一步明确和确定工程分工界面定义。四、搬迁与应急方案演练在系统搬迁计划制定完成后,还需要参照改计划进行演练。演练的目的之一是使参与搬迁的各单位熟悉搬迁过程,了解自己的工作和责任;另一个目的使通过演练发现系统搬迁计划的漏洞和不足,在实际搬迁之前,把搬迁的风险降到最低。搬迁过程的演练以桌面演练为主,辅助以不影响系统正常运行的操作。五、搬迁前准备正式搬迁前的主要准备工作包括以下内容:1.递交搬迁申请;2.发送搬迁通知;3.原厂商与集成商通知;4.用户通知;5.数据备份;6.系统搬迁通知。六、拆卸、包装、运输与安装设备的拆卸、包装、运输与安装流程主要通过《系统搬迁流程报告进行》控制。一份可用的系统搬迁流程报告如下,其具体内容需要根据用户实际情况进行修改。系统搬迁流程报告序号搬迁确认点确认单位确认人确认时间备注前期检查——再次确认各种搬迁资源1《系统具备搬迁环境报告》已经签署2《系统替代或应急设备确认报告》已经签署3业务软件及数据备份完成,备份数据准确可用4系统软件备份完成,备份数据准确可用过程确认——前期检查必须完全确认,才能进行下面的搬迁工作1业务已正常停止,可以关闭系统和进行设备下电2系统已正常停止,设备已正常下电,可以进行设备下架3设备已经按照设备提供商的要求完成包装,可以进行物理运输4设备已经运输到指定地点,外观无破损,可以进行设备拆包和上架5运输中有问题,详细信息见《系统运输中问题报告》,此报告作为本报告的附件,报告内容需包含详细描述问题发生原因、现状和处理过程,并拍照记录6电源检测符合设备要求,可以进行设备加电(仅针对使用利旧机柜而需要现场连接电源的设备)加电测试——进入设备加电、测试和业务启动、测试阶段注设备加电及测试过程和结果见《系统设备健康检查报告》,作为本报告的附件业务启动及测试过程和结果见《系统业务功能性测试报告》,作为本报告的附件七、系统恢复与健康检查在系统在新机房重新构建后,在正式开展业务之前,系统还需要进行一次健康检查,以确保业务可以正确的展开。最后一次系统健康检查通过后,业务可以上线运行。当业务在新机房上线运行后,虽然可以支持用户的业务正常开展,但由于系统的搬迁,IT系统处于一个不稳定的时期,在搬迁后的3个月内,系统发生故障的概率往往高于原有环境中的系统。为了使用户可以快速而顺利的度过这一不稳定期,用户还可以选择我公司提供的搬迁后系统运行情况跟踪服务。我公司将根据用户的实际情况制定完善的系统运行跟踪计划,提供现场工程师协助用户维护新环境中的系统。搬迁过后的系统运行情况跟踪服务一般不超过3个月。八、设备维护与保修服务设备维护与保修服务做为用户可以选择的另外一个系统搬迁附加服务,可以为用户提供系统维护与保障服务。包括系统备件的准备与更换服务,定期的系统询检服务,定期的系统评估服务等。尤其是可以考虑针对本次搬迁中的非在保设备。第四节搬迁的工程设计与实施方法机房搬迁项目的整体需求按照阶段划分为规划、设计、实施和维护四个阶段,同时,每个阶段都贯穿着相应的需求。在项目的实施阶段,我们将与用户进行更细致的沟通,整理和分析XXX的具体要求,并在详细设计方案中对用户的需求给予体现。我们将按照系统搬迁的方法论,结合用户的实际情况,采用以下方法分析用户具体的需求,并进行工程设计实施。一、项目管理项目管理需求如下:1.创建组织架构及定义角色职责2.定义搬迁工程界面3.制定并审批计划4.管理进度5.风险管理6.质量管理7.变更管理8.问题管理二、总体方案规划在机房搬迁项目的每个阶段,都涉及众多的实体和活动,例如涉及资源、技术、方法、工具、流程等实体和开发、设计、实施、维护、控制、沟通、会议等活动,这就要求我们采用清晰的思路来组织所有实体和活动,使所有实体和活动和谐一致地实现共同的项目目标。根据搬迁项目的性质,即搬迁项目属于IT领域的业务连续性管理的范畴,按照国际权威组织DRII、BCI的最佳实践,在项目规划阶段,业务连续性项目的规划需求如下:1.项目规划成员需要业务连续性管理方法论做指导;2.项目规划成员需要执行IT领域的业务连续性管理的具体任务,包括搬迁风险分析、搬迁影响分析、搬迁策略分析;具体地讲,在总体方案规划阶段,“搬迁规划团队”将完成以下任务:1.确定风险防范措施以减小或规避搬迁中意外事件造成的影响;2.确定各种资源的依赖关系,从而确定搬迁的内容、批次及需要的资源;3.确定关键的资源和流程,以便在搬迁之前采取高可用性措施;4.确定每次搬迁的内容的恢复优先级顺序;5.确定每次搬迁的内容所需的最小恢复资源;6.确定每批次搬迁对业务的影响,从而制定最佳搬迁时机;7.确定自上而下分解的恢复时间指标(RTO),量化搬迁指标;8.确定需要优化哪些资源,以满足恢复时间指标;9.确定需要新增哪些新的资源;10.确定采用什么样的高可用性措施;11.确定应急回退策略;12.确定危机沟通策略;13.确定对集成商或厂商的产品及服务的要求。三、总体方案设计总体方案设计描述各阶段的总体性任务,描述这些任务之间的流程,描述完成这些任务需要的资源,描述全局性的任务。具体地讲,在总体方案设计阶段,“搬迁设计团队”将完成以下任务:1.搬迁总体性任务框架及流程设计2.搬迁总体资源配置需求(指挥场地、支持与服务、设备、工具、文档)3.各设备在新机房内的位置分布图4.新机房系统及网络架构图5.设备清单设计6.指挥和命令任务的设计7.新机房环境评估任务的设计8.系统标签标识设计9.危机沟通计划的设计10.系统梳理与健康检查设计11.搬迁与应急方案的测试和演练的设计12.培训计划13.项目实施计划14.搬迁维护计划15.搬迁验收方法和标准的设计四、详细方案设计详细方案设计描述各系统和设备在各搬迁阶段的具体任务,描述各阶段任务之间的流程,描述局部性的任务。具体地讲,在详细方案设计阶段,“搬迁设计团队”将完成以下任务:(一)搬迁外围任务的设计需求搬迁外围任务,即在逻辑上和搬迁项目相互独立的任务,需要在搬迁项目的前期完成。通过把与搬迁项目没有直接关系的外围任务标识出来,清晰地界定搬迁项目的工作范围。外围任务设计如下:1.新增设备与原有系统整合的任务设计;2.新机房的网络环境与原有系统整合的任务设计;3.处理存在故障设备的任务设计。(二)搬迁准备阶段的任务设计需求搬迁准备任务,包括在系统和各相关设备下电前需要完成的所有任务。相关设计包括:1.搬迁准备任务之间的流程设计;2.系统梳理与健康检查任务设计;3.每个迁移步骤的回退应急方案设计;4.搬迁准备情况检查列表的设计;5.设备清点任务设计。(三)搬迁实施任务的设计需求搬迁实施任务,是指在搬迁命令下达后,系统和各相关设备下电、拆除、包装、运输、安装,上架,上电、连接和调试的任务。相关设计包括:1.搬迁实施任务之间的流程设计;2.下达搬迁命令的任务设计;3.各系统和各相关设备的下电、标签标识、拆除、包装、运输、安装,上架,上电、连接和调试等的详细操作步骤设计;4.数据备份策略以及备份数据检测任务的设计;5.各搬迁团队指南的设计。(四)搬迁维护任务的设计需求搬迁维护任务,是指在系统恢复成功后,由我方提供的系统运营监护期(48小时)的维护及技术支持服务。相关设计包括:1.系统运行情况跟踪设计;2.设备保修设计;3.现场技术支持设计。五、方案实施阶段方案设计阶段之后,进入方案实施阶段(搬迁实施阶段只是方案实施阶段的一部分)。具体地讲,在方案实施阶段,“搬迁项目团队”将根据相关设计方案顺序执行以下任务:1.培训,保证执行任务的人员熟悉和掌握相应的方案和计划,并具备相应的能力。2.进行搬迁与应急方案的测试和演练;3.根据测试演练结果对方案进行优化;4.执行外围搬迁任务;5.执行全局性任务;6.执行各系统搬迁准备任务;7.执行危机沟通;8.下达搬迁命令;9.执行各系统搬迁实施任务;10.执行各系统搬迁维护任务;11.执行搬迁验收任务。六、项目维护阶段方案实施阶段之后,进入项目维护阶段。具体地讲,在项目维护阶段,“搬迁维护团队”将根据相关设计方案执行以下任务:1.跟踪系统运行情况;2.提供设备保修;3.提供现场技术支持。七、项目验收项目维护阶段之后,进入项目验收阶段。第五节整体搬迁方案设计按照搬迁系统的需求,整体搬迁设计有两个我们必须要考虑的设计要点,也是我们搬迁过程中的最大风险点所在,即数据保护和业务持续:数据保护:包含搬迁过程和集中过程中的数据安全、数据完整性;业务持续:包含怎样在最短的时间内完成业务系统的搬迁,如果搬迁不成功的业务回退以及最坏情况下的业务中断情况等;在我们下面的具体方案设计和搬迁实施中均会对上面的两个方面进行细致的考虑,并在风险分析和应急措施方面进行着重考虑和准备。一、搬迁次序设计(一)搬迁次序的设计原则1.循序渐进,根据业务系统现状,由易到难的磨合团队;2.由简到繁,及时总结和发现问题,修订后继搬迁方案。(二)搬迁次序的设计方法根据设计原则,基于XXX搬迁工作的特点,可按照如下类别考虑各子系统的搬迁次序:类别一:仅需物理搬运系统或现网抽离的设备搬运;建议:做为搬迁的第一批次(可多组)业务系统,进行搬迁;目的:锻炼和磨合团队,梳理搬迁流程和各方配合,发现搬运过程问题。类别二:需提供基础设施的系统或独立且业务次要的系统;建议:做为搬迁的第二批次业务系统,进行搬迁;目的:为后继系统提供必备的条件,对比第一批设备搬迁过程,检查问题纠正情况,增强各方对搬迁工作的信心。类别三:对外接口较多的次要级系统;建议:做为搬迁的第三批次业务系统,进行搬迁;目的:验证多部门合作的工作方式,发现问题,并体现在后继搬迁工作中。类别四:重要/复杂的系统;建议:作为搬迁的第四批次业务系统,进行搬迁;目的:经过上述三个批次的业务系统搬迁,使搬迁参与的各方均对整个搬迁过程有了深刻理解和明确分工,整个搬迁团队配合默契,最为成熟,所以可以保证以最充分的准备,完成最重要的系统搬迁任务。(三)搬迁次序建议根据以上搬迁设计原则和设计方法,通过对XX项目各业务系统进行分析,结合机房现有系统多而复杂等因素,建议通过分步骤分阶段的进行各业务系统的搬迁,使整个搬迁工程得到分解,降低搬迁的复杂性,从而降低搬迁总体风险。二、搬迁环境的准备(一)新机房的环境建设和检查搬迁前,新机房必须按照设计文档,具备相对应的各种搬迁环境,如:1.设备位置环境:如设备进出通道、设备机房位置、设备线缆进出位置、地板承重、电梯承重等;2.设备运行环境:如机房温度、湿度、供电容量、供电方式、端子数量等。以上环境的检查均应以机房设计文档为主,结合设备需求,进行多项检查。(二)系统的各种搬迁文档准备(三)系统的各种资源准备就位(四)搬迁前,需要准备各种资源就位以上资源的需求和准备情况,均会体现在《搬迁前资源CheckList》中,便于随时跟踪和解决相关问题。直接断电搬迁数据备份技术简介三、备份断电系统搬迁选择主要考虑到系统实时性和影响范围而选择的断电搬迁,但是并不说明系统数据,业务的次要性。因此,断电搬迁的压力要比不断电搬迁设计的更周密。系统断电搬迁数据备份设计原则:三类数据备份:业务数据、数据库数据和OS系统的备份数据备份的数据要满足数据一致性、数据完整性、数据安全性原则。OS数据恢复、数据库数据恢复、业务数据恢复组成了系统恢复的RTO/RPO的考核要求,即业务恢复窗口设计原则。要满足备份数据的可验证性,业务冷备环境的可验证性要求,这点也是演练中的重要部分,提供冷备系统的可验证性原则。数据允许丢失水平的设计,即在极端情况下哪些数据是要丢失的,丢失多少,对业务影响情况。这部分将体现在子系统搬迁技术设计中进行详细设计和阐明,数据丢失容忍度原则。(一)数据备份技术手段根据一套业务环境分割,在一套系统颗粒度允许情况下,当系统构成比较大时,也可将业务系统分批次搬迁进行。这就需要前面对业务系统调研分析后制定详细的搬迁方案。业务系统构成分成:OS层、业务软件层、数据层三层OS系统的备份:通过我们实施经验,对运行环境系统影响最小的是系统镜像备份OS,这种备份方式,在不中断业务系统的情况就可以进行OS系统备份。业务软件层数据备份:业务软件的数据备份通常采用两种方式,一准备业务软件介质,二对相应的配置目录进行备份。数据层:通常数据都部署在相应的阵列上的数据库文件、消息队列文件中。通常在断电搬迁过程中,我们要忽略消息队列中的数据,而关心数据库中的数据。在下面技术选择比较中,我们着重对数据库的备份方案进行比较。而针对业务系统的特点的技术方案可以参考附件中的LSTP的搬迁等系统的举例进行详细说明。(二)数据库备份数据库备份和处理的原则:数据库的完整性:物理结构和逻辑结构数据库一致性:备份数据与原数据的一致性原则在此次搬迁业务系统中使用的数据库主要有Oracle数据库、Sybase数据库。1.Oracle数据库备份方案介绍根据我多年数据备份的经验,在搬迁过程中,为了能够满足恢复窗口的要求、数据完整性和一致性的要求,我们通常采用OracleDataGuard方案。DataGuard介绍:备用数据库(standbydatabase)是ORACLE推出的一种高可用性(HIGHAVAILABLE)数据库方案,在主节点与备用节点间通过日志同步来保证数据的同步,备用节点作为主节点的备份,可以实现快速切换与灾难性恢复。Oracle9i的DataGuard是对Oracle8i中StandbyDatabase功能的加强,而StandbyDatabase技术出现的主要初衷就是为了容灾(DisasterRecovery),所以具有更强大功能的DataGuard毫无疑问成了Oracle数据库高可用性解决方案中首选使用的产品。DataGuard类型比较:Oracle9i在DataGuard的配置方面提供了几种不同的类型,根据客户对于高可用性的不同要求,可以选择不同的DataGuard类型。下面对于DataGuard的几种类型作一个列举和比较。DataGuard环境中包含一个产品数据库,这是正常运行用以支撑日常业务的主数据库,称为PrimaryDatabase。另外包含一个或者多个灾备数据库,称为StandbyDatabase。按照备用库(StandbyDatabase)应用归档日志的不同方式,StandbyDatabase可以分为物理备用库(PhysicalStandby)和逻辑备用库(LogicalStandby)。按照主数据库(PrimaryDatabase)的保护模式,整个DataGuard环境分为最大数据保护模式(MAXIMIZEPROTECTION),最大可用性模式(MAXIMIZEAVAILABILITY),最大性能模式(MAXIMIZEPERFORMANCE)。按照主库向备用库传递重作信息的方式,可以分为ARCH方式和LGWR方式。物理备用库可以运行在数据库三种保护模式中的任何一种模式下,逻辑备用库只可以运行在最大可用性模式或者最大性能模式下。无论物理备用库还是逻辑备用库都可以在传输日志上采用ARCH方式或者LGWR方式。物理备用库(PhysicalStandby):提供了一份跟主数据库在物理级别上完全相同的copy,指在数据库的block级别都是完全相同的,比如数据库表中记录的rowid。物理备用库是通过不断地恢复PrimaryDatabase传入的重作日志数据信息来达到跟主数据库保持同步。物理备用库在处于自动恢复重作日志信息的状态下,无法提供查询服务。因为此时的备用数据库并不是处于正常打开的状态,数据库的非sysdba用户无法登录备用库,自然也就无法进行普通的查询业务。逻辑备用库(LogicalStandby):指在逻辑上跟主数据库保持一致,但是在物理层面上跟主数据库并不相同。逻辑备用库是通过将PrimaryDatabase传入的重作日志数据信息转化为SQL语句,然后在备用库上重新执行来达到跟主数据库保持同步。逻辑备用库在应用重作信息的同时也可以提供查询功能。但是由于逻辑备用库应用重作日志的方式限制,所以逻辑备用库在功能和性能上面都有所限制。以下是逻辑备用库的一些限制条件。以下数据类型不被支持:NCLOB,LONG,LONGRAW,BFILE,ROWID,UROWID….以下操作不被支持:ALTERDATABASEALTERSESSIONALTERSNAPSHOTALTERSNAPSHOTLOGALTERSYSTEMSWITCHLOGCREATECONTROLFILECREATEDATABASECREATEDATABASELINKCREATEPFILEFROMSPFILECREATESCHEMAAUTHORIZATIONCREATESNAPSHOTCREATESNAPSHOTLOGCREATESPFILEFROMPFILECREATETABLEASSELECTFROMACLUSTERTABLEDROPDATABASELINKDROPSNAPSHOTDROPSNAPSHOTLOGEXPLAINLOCKTABLERENAMESETCONSTRAINTSSETROLESETTRANSACTION高级队列的管理和物化视图的刷新不被支持:要求每张表应该有主键或者唯一性索引,如果必须没有唯一性标识的表,那么可以激活Primary库的supplementallogging属性,但是这样将会在重作日志中记录该表中每一条记录的所有字段信息,会大大增加重作日志的记录量。以下是DataGuard环境中物理备用库和逻辑备用库的配置图。最大数据保护模式(MAXIMIZEPROTECTION)提供最高等级的数据保护,重作信息从主库同步送到备用库。直到备用库成功接收重作信息,主库上的事务才会提交。如果由于网络等问题,导致备用库不可用,那么主库也同时会被关闭。这种模式保证了完全没有数据丢失。最大可用性模式(MAXIMIZEAVAILABILITY)在备用库正常的情况下,该模式提供了跟“最大数据保护模式”一样的机制,保证没有任何数据丢失。如果备用库不可用,那么将转换到“最大性能模式”,操作可以在主库上继续执行。当备用库重新可用之后,将会继续同步。但是如果在同步完成之前,主库由于故障损坏,将会丢失数据(当然,可以通过RAID,RMAN等方式尽量保护主库即使出现故障也不丢失数据)。最大性能模式(MAXIMIZEPERFORMANCE)这种模式下,主库上的重作信息是异步传递到备用库上,不论备用库上是否已经成功接收了重作信息,主库上的操作都会成功执行。所以这种模式提供了最好的性能,但是最低的数据保护。这是Oracle9i配置DataGuard的默认模式。ARCH方式当主库归档联机重作日志文件时,ARCH归档进程在归档到本机的同时,将重作数据传递到备用库,由备用库端的RFS进程(RemoteFileServer)接收,生成备用库端的归档日志文件,然后由备用库端的MRP进程(物理备用库类型)或者LSP进程(逻辑备用库类型)将归档日志文件恢复到备用库中。传递方式如图:LGWR方式物理备用库类型下,主库的LGWR进程在将重作数据写到本地联机重作日志文件中的同时,将重作数据传递到备用库,备用库的RFS进程将收到的数据写入本地的备用重作日志文件(StandbyRedoLog)中。当主库日志切换时也触发备用库的日志切换,切换发生时,备用库的归档进程将重作日志文件归档,然后由备用库端的MRP进程将归档日志文件恢复到备用库中。传递方式如图:逻辑备用库类型下,不可以创建备用重作日志文件(StandbyRedoLog),所以处理流程跟物理备用库稍有不同。主库的LGWR进程在将重作数据写到本地联机重作日志文件中的同时,将重作数据传递到备用库,备用库的RFS进程将收到的数据写入本地的归档日志文件中。当主库日志切换时也触发备用库的日志切换,切换发生时,备用库的归档进程完成归档日志文件的最后生成,然后由备用库端的LSP进程提取归档日志文件中的SQL语句,重新在备用库上运行一遍。传递方式如图:最后上述所有类型或者方式互相搭配进行一个比较:MaximumProtectionMaximumAvailabilityMaximumPerformance重作传递方式LGWRLGWRLGWR或者ARCH网络传递模式同步同步当使用LGWR传递方式时为异步方式,如果使用ARCH传递方式,那么不牵涉联机重作数据的网络传输磁盘写入选项AFFIRMAFFIRMNOAFFIRM是否需要备用重作日志文件需要只在物理备用库类型中需要如果物理备用库使用LGWR传递方式,那么需要备份库类型物理物理或逻辑物理或逻辑2.Sybase数据库备份方案介绍但考虑到Sybase的版本问题,我们在实际工作中通常采用如下方式对Sybase数据库进行备份。使用Sybase的BackupServer(备份服务器),做Dump备份转储数据库(Dumpdatabase),就是为整个数据库(包括数据、表结构、触发器、游标、存储过程、事务日志等)做一次物理备份。转储数据库时,系统自动执行一次checkpoint,即将日志和数据从缓冲区拷贝到硬盘(只拷贝脏页),把已被分配的页(日志和数据)转储到设备。命令格式为:dumpdatabase数据库名to设备文件名with参数如果备份到硬盘的文件上,可以不预先估算备份文件的大小,只要硬盘有足够的存储空间就可以。如果是备份到dds磁带上,那么就要估算一下备份后的大小,90米的dds磁带压缩存储空间为4G,120米的磁带压缩存储空间为8G,如果数据库的备份文件超过了这个尺寸,就要考虑多文件转储,使用stripe参数。命令格式为:dumpdatabase数据库名to设备文件名1stripeon设备文件名2……stripeon设备文件名3……with参数这种数据备份方式是将整个数据库的运行环境完整的复制一份,包括数据库的脏页和碎片,在使用load命令恢复时,只能恢复到同样大小的数据库中(数据和日志的大小都只能和原来完全一致),适用于在每天的日终营业网点下班后的日常备份。优点是数据库完整无误,缺点是不能直接查看备份内容。分数据结构和数据记录做两次备份在一般情况下,生产机的数据库都比较庞大,而实验机则相对较小,难以在实验环境中以load命令恢复工作机的内容。所以,在工作实践中,我们摸索出了第二种全量备份方案。(1)数据记录备份将数据库各表以Sybase自代的bcp(bulkcopy)工具的方式导成一定格式的文本文件,命令格式:bcp表名out路径名文件名-c-t分隔符-u(用户名)-p(密码)-S(服务器名)如果将一个数据库中的所有表都做一个bcp备份,就需要针对每一个表都做一次bcp,在一般情况下,一个数据库有100多个表,工作量比较大。可以利用数据库中的系统表信息做一个bcp备份脚本。原理是每一个用户表在系统表中都有信息记载,可以通过isql语句查询得到。现举一例说明:1)先编辑一个名为mkbcpout.sql的文件,内容如下:select"echobcp"+name+"out……"+"bcp"+name+"out./+"name+".table-c-t|-Uuser-Ppassword-SSERVER"fromsysobjectswheretype=Ugo2)执行isql命令,以此文件作为输入,执行结果输出到另外一个文件里:isql-Uuser-Ppassword-Sserver-Imkbcpout.sql-Obcpout3)对bcppout文件稍微修改,增加可执行权限chmod+xbcpout4)执行bcpout,导出数据文本:./bcpout(2)数据库恢复业务生产机可能为小型机,而实验开发环境的硬件环境为PCserver,安装好winnt或Solarisunix下的Sybase服务器后,根据需要创建空间足够大的数据库和tempdb(系统临时数据库),创建数据库用户,并将其更改为此数据库的所有者,要注意两点:1)此数据库允许bcp拷贝,2)此数据库自动清除log。命令格式为:sp_dboptiondatabasedbname,"selectinto/bulkcopy",true2>gosp_dboptiondatabasename,"trunclogonchkpt",truego上述两个配置可能与生产机的配置不同。然后以新创建的数据库用户登录,导入数据结构,注意要首先导入表结构,然后才是存储过程、触发器等等。命令格式:(1)isql-Uusername-Ppassword-Itable.ddl-oerror.log.table(2)isql-Uusername-Ppassword-Ic为了提高bcp导入数据的速度,需要将比较大的表的索引和主键删除,否则的话,每bcp进一条数据,数据库都自动写一条log日志,记载此数据的上一条和下一条记录,确定本记录在此表中的准确位置,一是影响bcp速度,二是数据库的log飞速膨胀。数据库的自动清除log功能只有在一个事务结束后才起作用。准备工作做完后,开始倒入数据记录。使用类似做bcpout的方法做一个bcpin的脚本,然后执行:./bcpin|teeerror.bcpin使用tee管道输出的目的是让计算机完整记录下倒入过程,自动存入error.bcpin文件中,待倒入结束后,我们只需要检查日志文件,不需要一直紧盯着计算机屏幕。所有工作做完之后,不要忘记重新将删除的主键和索引建上。如果有现成的数据库,只需要单纯地导入数据记录,则首先将数据库中所有用户表(也就是所有type="U"的表)清空,命令格式:truncatetabletablename2>go当然最好也是利用做bcpout脚本的做一个truncate脚本,通过执行此脚本将所有用户表清空。然后的数据导入、处理索引和主键的过程与上面类似。利用做bcp备份脚本的方法做数据库碎片整理Sybase数据库作为联机事务处理应用服务器,每天应用程序都对数据库做大量的插入、修改和删除等操作,不可避免的在数据库的物理存储介质上留下页碎片和扩展单元碎片,从而影响数据库的存储效率和运行速度。具体表现为:业务繁忙时出现死锁(deadlock),数据库的输入/输出资源被大量占用,业务处理速度慢。其解决办法是:(1)清空数据库中的所有表,命令格式:isql-Uusername-Ppassword-Itruncate.sql-oerror.truncate(2)删除所有表的索引和主键:isql-Uusername-Ppassword-Idropindex.sql-oerror.dropindex(3)导入数据:./bcpin(4)添加索引和主键:isql-Uusername-Ppassword-Iaddindex.sql-oerror.addindex更新数据库状态updatestatisticstablenamego上述操作都是针对数据库中的所有用户表进行的,利用做bcp备份脚本的方法做出相应的脚本,使繁琐的数据库维护变得简便易行,还克服了直接使用isql语句操作风险大、没有操作日志的毛病。在实际工作中,使用第一种方法对生产机做日常全量备份,日终通过unix的crontab定时批量作业bcp出全部数据。使用高档PCserver搭建模拟运行环境,在需要的情况下导入生产机数据,处理运行中后台server的各种问题,待研究出解决办法后再在生产机上做相应调整,这样做风险小,效果更好。因此,从现有收集的信息看,我们建议采用第一种方式进行Sybase的数据库备份,这样在搬迁前还可以评估整个备份效果,同时测试最坏情况下系统恢复的时间。3.OracleDataGuard与第三方备份方案比较OracleDataGuard与卷管理和(或)SRDF的比较由于OracleDataGuard并没有借助于任何硬件同步技术,而是采用纯软件方式实现的完全同步,事物必须提交到备份点数据库才算提交成功,这样会极大的影响生产系统的性能,同时当网络或备点出现问题时,主点业务系统也会停止。但在系统搬迁环境中,考虑到直接断电搬迁,因此,从用户投资和对数据容忍程度角度,DataGuard方式是一个非常实用的工具和方案,特别是现有环境中的操作系统环境的复杂(Solaris、Linux、AIX、HP-UX)、存储环境的复杂(异构存储),在断电搬迁中为建立可靠的数据备份,我们推荐使用Oracle数据的DataGuard方式。4.SybaseRS模式与第三方备份方案比较SybaseRS是基于事物的准实时备份服务器,其安装在主点的复制代理可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论