版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
业务永续-数据中心的业务连续性规划与设计客户需求这个世界比过去有着更多的风险FinancialTimesDisasterrecovery:Thecrucialthingistobeprepared1USATODAYTheftofpersonaldatamorethantriplesthisyear2TheEconomicTimesDatabackup,recoverybecomingcriticaltoall3环境在不断变化风险接触范围在不断扩大全球及区域间的依存关系在不断增大供应链每时每刻都存在中断的风险业务中断将导致更大的影响宕机可能导致更大的财务影响宕机可能对品牌造成伤害宕机可能导致数据失去完整性更繁杂的规范产业和监管标准在不断变化产业分工在地理分布上更趋分散每个国家都可能有自己相应的规范更多的灾害经济危机、恐怖主义、飓风、地震、停电、火灾和疾病的大规模威胁业务连续性问题和挑战差距不断加大更多的业务在线更多的应用和数据增长的需要通过传统的备份与恢复满足业务需求的能力更多复杂的系统更少的恢复时间窗口更小的对停机时间的容忍度日益增加的信息不可用所造成的影响备份与恢复vs.HA高可用重新运行批处理日终作业手动的应用与数据的恢复丢失数据最好的意图vs.RTO,RPO,SLA规范的设计……收入和利润受损失负面的社会影响罚款和罚金涉及法律依从及会计的问题员工的劳动强度和费用对日常的业务规划和运作产生影响……
60%的客户正在关注如何提高可用性
接近50%的客户希望有显著的安全提升
超过25%的客户希望实施高可用集群业务延续运性之考虑
ConsiderationforBusinessContinuityFault-toleranthardware,redundancy,automaticdetectionandisolation,predictiveanalysis,call-homeReal-timereplicationofdataovermetropolitanand/orcontinentaldistancesAutomatedprotectionagainstunplannedoutageswithmeetingrecoverypointandrecoverytimeobjectives高可靠性HighAvailability数据复制DataReplication灾备技术DisasterRecovery业务延续运性BusinessContinuityIBMPowerSystems高可用性解决方案基本可用性无数据丢失恢复点目标DataCurrencyLatest持续可用性数据传输(每个交易的价值)可用水平恢复时间目标和缩短的计划内停机时间AvailabilityLevelSAN磁盘备份服务多服务器解决方案iSeriessingle-server单服务器solutions解决方案备份周-日场外存储RAID-5日志组合磁盘镜像SANAIX,Linux,Intel群集连续数据复制群集可切换集群在线维护CUoD高速磁带LPARTSMBCRSSWA网络分配器冗余网络(LAN/SAN)支持业务连续性与灾备的系统组件面向开放平台的高可用(HighAvailability)解决方案的架构Availabilityby应用按照高可用的要求来设计应用架构Availabilityby中间件DB2HADR、WAS集群,CICS集群OracleRACAvailabilityby操作系统AIXLVM镜像、HACMPforAIXAvailabilityby硬件冗余服务器冗余的处理器/I/O适配器卡/电源/内置磁盘RAID技术保护外置磁盘,I/O总线、SAN交换机、LAN、LAN交换机冗余的部件磁盘RAID多路径(Multi-Path)软件(SDD、RDAC)通过磁盘复制的可用性FlashCopy,Metro/Globalmirror网络HardwarePowerSystems(RAS)LivePartitionMobilityPowerSystemsSoftwarePowerHAPowerHA/XDApplicationOperatingSystemAIX,ILiveApplicationMobilityIBMPowerSystemsHighAvailabilitySolutionHighAvailabilityHardware
-Reliability,AvailabilityandServiceabilityIBMPowerSystemsRAS架构ProcessorInstructionRetryAlternateProcessorRecoveryFirstFailureDataCaptureDDRChipkillmemoryBit-steering/redundantmemoryServiceProcessorFailover*DynamicFirmwareMaintenance*HotI/ODrawerAdd*I/OerrorhandlingextendedbeyondbasePCIadapterECCextendedtointer-chipconnectionsforthefabric/processorbusesMemoryandL3CachesoftscrubbingHardwareAssistedL2&L3CacheLineDeleteHardwareAssistedMemoryScrubbingLivePartitionMigration570ConcurrentAdd&ColdRepairPrimaryPOWERRASFeaturesHMCrequiredtoenablethesefunctions..CoreSystemDesignHighqualitypartsFewerparts=FewerfailuresDesignedforlowpowerconsumption(lessheat=fewerfailures)Manufacturingmethods,packaging,coolingContinuousSystemandCommodityQualityActionsIntegratedRASfeaturesFailureAvoidanceMethodologyDesignedforEaseofServiceFaultResilienceN+1PowerSupplies,regulators,powercordsDualredundantfansDynamicProcessorDeallocationandsparing"Chipkill"TechnologyPredictiveFailureAnalysisAutoPathReassignment-datapaths,powerProcessorInstructionRetryFaultIsolation&Diagnosis
FirstFailureDataCaptureRunTimeSelfDiagnosticsServiceProcessorRifle-shotrepairs(no"plugandpray"partsreplacementapproach)SystemRestoreDeferredRepairConcurrentRepairLEDServiceIdentificationServiceConsolesMigrationtoGuidedMaintenanceSummaryofkeyPowerSystemsRASfeaturesWorld-classHardwareRASHighAvailabilityHardware
-LivePartitionMobilityLivePartitionMobilitywithPOWER6*AllowsmigrationofarunningLPARtoanotherphysicalserverReduceimpactofplannedoutagesRelocateworkloadstoenablegrowthProvisionnewtechnologywithnodisruptiontoserviceSaveenergybymovingworkloadsoffunderutilizedserversMovementtoadifferentserverwithnolossofserviceVirtualizedSANandNetworkInfrastructure*AllstatementsregardingIBMfuturedirectionsandintentaresubjecttochangeorwithdrawalwithoutnoticeandrepresentgoalsandobjectivesonly.AnyrelianceontheseStatementsofGeneralDirectionisattherelyingparty'ssoleriskandwillnotcreateliabilityorobligationforIBM.WorkloadBalancingwithLivePartitionMobility*Ascomputingneedsspike,redistributeworkloadsontomultiplephysicalserverswithoutserviceinterruptionAsoneservergetsovertaxedfromaspikeindemand,relocatepartitionstootherservers*AllstatementsregardingIBMfuturedirectionsandintentaresubjecttochangeorwithdrawalwithoutnoticeandrepresentgoalsandobjectivesonly.AnyrelianceontheseStatementsofGeneralDirectionisattherelyingparty'ssoleriskandwillnotcreateliabilityorobligationforIBM.HighAvailabilityOperatingSystem
-AIXUNIXReliability,AvailabilityandServiceabilityThe“NumberOne”CustomerRequirementCompetitionAIX-2007AIX-2006AIX–2005EnterpriseContinuousAvailabilityCapabilityTime
AIXFunctionalityKernelStorageKeysConcurrentAIXupdatesCrossSystemWorkloadMobilityDynamicTracingwithprobevueFunctionalRecoveryRoutinesComponentTraceMemoryOverlayProtectionParallelDumpLightweightMallocdebugLightweightMemoryTraceConsistencyCheckersComponentRASinfrastructureAIXerrorlogSubsystemResourceControllerAIX6ConcurrentMaintenance KernelSpaceUserSpaceInterimFixConcurrentupdatevmmove()patchemgrvmmove()getgidx()sleepx()Non-disruptivefixestoexecutablecodeinarunningAIXkernelBaseAIXKernel(/unix),kernelextension,ordevicedriverNodowntime(reboot)requiredtoapplyfixandmakeitactiveConcurrentupdateswillbepackagedasInterimFixesFixselectedAIXkernelproblemswithoutaserviceoutagevmmove()AIX6dynamictracingwithprobevue
TraceexistingprogramswithoutrecompilingDynamicplacementoftraceprobesFordebuggingandperformanceanalysisTracableCalls:AIXsystemcalls,applicationfunctions,andapplicationcallstolibraryfunctionsDynamictracinglanguagecalledVueInitialsupportonlyfor“C”programs#!/usr/bin/probevue
/*countreads.v*/
@@syscall.$1.read.entry
{
count++;
}
@@interval.*.clock.100
{
printf(“Numberofreads=%d\n”,count);
count=0;
}#countreads.v404
Numberofreads=22
Numberofreads=0
Numberofreads=1
Numberofreads=17
…..FormattedI/OUserKernelProbeLocationUserProcessCodeSomethreadhitsprobepoint(1)Branchestoprobecode(2)Probecode(3)Returnstoprobepoint(4)Threadcontinuesexecution(5)TraceConsumerTraceFileorTraceOutputTraceBuffersE-code“Vue”probecodeexampleTheAIXanswertoSolarisdtrace操作系统停机时间调查:AIX是业界最稳定的操作系统
(27个国家400个用户)TheYankeeGroup“2007-2008GlobalServerOperatingSystemsReliabilitySurvey”asquotedin“WindowsServer:TheNewKingofDowntime”byMarkJosephEdwardsat,March5,2008andinWin2000Win2003RHELSolarisHP-UXSUSEAIXWearehere!ThisinformationisintendedonlyforIBMsellersandBusinessPartnersAccordingtoarecentYankeeGroupstudy*of400Windows,LinuxandUNIXusers,AIXwasthemostreliableserveroperatingsystem:“IBM’sAIXachievedthehighestlevelofreliability,withcorporateenterprisesreportinganaverageofonly36minutesofdowntimeperserverina12-monthperiod”*Source:“Unix,LinuxUptimeandReliabilityIncrease;PatchManagementWoesPlagueWindows”
©2008YankeeGroupResearch,Inc.AllrightsreservedAIXis“MostReliable”HighAvailabilitySystemSoftware
-PowerHA
-PowerHA/XDIBMPowerHAPowerHAforAIXPowerHAClusterManagementMonitors,detectsandreactstoeventsEstablishesaheartbeatbetweenthesystemsEnablesautomaticswitch-overIBMsharedstorageclusteringCanenablenear-continuousapplicationserviceHelpseliminateimpactofplanned&unplannedoutagesEaseofuseforHAoperationsPowerHAmanagingintegratedIBMdataresiliencyLogicalVolumeManager(LVM) SharedswitchabledisktopologyXD(optionalfeatureofPowerHA) GLVM(GlobalLVM)–AIXbasedreplicationoverIP MetroMirror–IBMstoragebasedsynchronousmirroringSVCIBMDS8000™SmartAssistsApplicationdeploymentandconfiguration34PowerHAforAIXV5.5PowerHAV5.5FeaturesSimplifiedManagementManagemultipleclustersfromasinglegraphicaluserinterfaceCanrunonaserveroutsideoftheclusterSupportforTCP/V6connectionstoclientsNewfocusonIPV6fromUSgovernmentPowerHA/XDV5.5DisasterRecoveryGlobalLogicalVolumeManager*GlobalLogicalVolumeManager(GLVM)asynchronousmodemirroringAsynchronousmodeenablesgeographicdispersionSanVolumeControllerGlobalMirrorAsynchronousreplicationforgeographicdispersion*GLVMAsynchronousmodegenerallyavailableMarch2009SharedstorageclusteringTopologyNetworkClientsSerialHeartbeatPowerClusterNodePowerClusterNodeIPNetworkService&StandbyNetworkAdaptersSharedDiskIPHeartbeats主机主机磁盘1磁盘2SwitchedDiskCluster(Localonly) 本地存储双机-LVM基于AIX功能(软件免费)完全冗余,无切换中断时间特别适合24X7环境存储可靠性几何级提高双存储可轮流定期修整维护PowerHA/XD(HACMP/XD)延伸PowerHA的概念到更远的距离利用SVCorDS8000/DS6000/ESS镜像技术RouterRouterDS8/6/ESSMirroringPrimaryESS/DSSecondaryESS/DS生产站点恢复站点SVCSVCSVCMirroringor…GLVMMirroring利用GlobalLogicalVolumeManager(GLVM)技术IBMAIXMultiSystemDataResiliencyPowerHAforAIXStrategicbuildingblockforIBMAIXHighAvailabilityandDisasterRecoverysolutionsIntegratedandoptimizedwithIBMAIXClusterResourcesSwitchedDiskStorageagnosticLVMmirroredcopyofdataHA(Localonly)SwitchedDiskClusterGeographicLogicalVolumeManagerIPdeployedmirrorStorageagnosticHAandDRPowerHAXDMetroMirrorMetroMirrorDS8000&SVCIBMFlashCopy®HAandDRFlashCopyGeographicMirroringGLVMClusterMetroMirror/GlobalMirrorClusterBasicSanCopyServicesMetrolMirrorBootFromSANDR/TapeBackupDRonlyFlashCopyGlobalMirror高可用性整体解决方案数据库服务器应用服务器RAID5或RAID10双数据拷贝冗余SAN网络服务器集群并行数据库冗余网络应用伸缩性边缘设备高可用性的实现层次高性能高可靠性的
并行文件系统-GPFS
什么是GPFS集群:可以扩展至4096节点,高速、稳定地通讯,单点管理与控制;共享磁盘:可以从集群中的任一节点直接访问磁盘上的数据;并行访问:所有节点访问所有磁盘的数据流并行实现;IBM为AIX和Linux集群系统设计的共享磁盘的并行文件系统为什么要用GPFS并行文件系统应用需求:多个节点访问同一个数据文件或数据库高性能文件访问故障恢复文件系统需求:可访问:从任一节点访问所有文件;动态扩展:能动态地增加或减少节点与存储;文件唯一存在:使得在集群环境中的应用开发更加容易;高容量:TB级文件,PB级的文件系统,测试过2PB;高吞吐率:单文件的访问可达GB/s,现最高记录为102GB/s;数据并行访问:并行访问单个文件或多个文件;可靠和容错:当某个节点、磁盘或连接出现问题时,仍然可以提供服务;GPFS的主要优势高性能条带化文件读写提高并发访问性能,实测带宽可达数百GB智能预取机制和客户端数据缓存机制降低读写延迟分布式的元数据服务器和字节锁管理可自定义数据块大小可,从16K到4MNSD支持InfiniBandRDMA高可用性仲裁管理和自动故障切换支持多路径磁盘访问,每块逻辑盘可支持8个NSDServer支持元数据和用户数据的复制功能在不停止服务的情况下可以动态加入和移除节点或磁盘,支持在线升级支持日志功能,实现系统快速恢复高可扩展性支持最大299字节的文件系统和20亿个文件支持数千个节点的集群系统支持不同存储、网络、处理器和操作系统易管理自动在各个节点间同步配置文件和系统信息可在集群内任何一个节点上完成对GPFS的管理任务,命令将在所有节点上生效管理网络和数据网络可以分开其他支持信息生命周期管理支持CNFS支持快照功能和数据备份提供DMAPIGPFS和其它网络文件系统的本质区别客户机/服务器方式SAN文件系统方式XXSAN环境存储节点对称集群GPFS架构GPFS的两种基本配置SAN组织方式NSD组织方式SANI/OServersLANNSDClientsSANGPFSNodesDatabaseApplicationsDB2OracleRACSAPGridApplicationsScientificComputingLifeSciencesAnalyticsWebApplicationsEmailservicesWebServerFarmOnlineDataStorageDigitalMediaAnimationBroadcastingVideoSurveillanceHighlyAvailableScalableUserMulti-SiteinstallationsDisasterRecoveryGPFS适用于多种应用OracleRAC10g/11g的典型架构VirtualIP2VirtualIPN
PublicInterconnectVirtualIP3VirtualIP1StaticIP1LoadBalanceServer1Server2ServerNClusterWareClusterWareClusterWareServer3ClusterWareAIXAIXAIXAIXRaw/GPFS/ASM
OracleRACListenerOracleRACListenerOracleRACListenerOracleRACListener
PrivateInterconnect•••Clients不同级别的IT业务延续性方案及技术
TiersofITBusinessContinuityandTechnologyRecoveryTimeObjective15Min.1-4Hr..4-8Hr..8-12Hr..12-16Hr..24Hr..DaysCost
Tier4-PointinTimediskcopyTier3-ElectronicVaultingTier2-HotSite,RestorefromTapeTier5–SoftwarereplicationTier1–RestorefromTapeRecoveryfromadiskimageRecoveryfromtapecopyTier7–SiteMirroringwithautomatedrecoveryTier6-Diskmirroring(with/withoutautomation)TAPEDISKMANAGEMENTSWNETWORKD/RAUTOMATIONREPLICATIONSWSERVICESBestbusinesscontinuitypracticeistoblendsolutionsino
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年建筑工程合同风险防控策略
- 护理创新思维与实际应用
- 2026公共场所自查报告(2篇)
- 2026年个人自查自纠思想报告(2篇)
- (三模)随州市高三2026年4月模拟考试地理试卷(含答案)
- 家政护理员沟通技巧与案例
- 动静脉导管护理要点
- 孕期旅行安全建议
- 家政护理员家庭环境布置
- 导尿术的危重患者护理
- 2025年高考数学必刷题分类:第80讲、阿基米德三角形(学生版)
- 2023剩余电流动作保护电器应用技术规程
- 0151超声科质量与安全管理规章制度
- 班学会生活学会自理主题班会
- DBJ51-T 198-2022 四川省既有民用建筑结构安全隐患排查技术标准
- Java Web 程序设计(山东联盟)知到智慧树章节测试课后答案2024年秋潍坊学院
- 《铰链四杆机构》(课件)
- 2024-2025学年中职历史世界历史高教版(2023)教学设计合集
- 23《马说》公开课一等奖创新教学设计
- DBJ50-T-372-2020 大型公共建筑自然通风技术标准
- 污染源源强核算技术指南 炼焦化学工业(HJ 981-2018)
评论
0/150
提交评论