第七章 云数据中心运维及故障处理_第1页
第七章 云数据中心运维及故障处理_第2页
第七章 云数据中心运维及故障处理_第3页
第七章 云数据中心运维及故障处理_第4页
第七章 云数据中心运维及故障处理_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

云数据中心运维及故障处理,本节介绍云数据中心运维及故障处理流程和相应配套工具。学员需充分把握特性内涵以助于后续实际环境中进行功能的合理引用与优化,学完本课程后,您将能够:了解FusionSphere的运维管理系统功能了解运维工具使用了解故障处理流程和方法学习故障处理案例,运维管理1.1系统监控1.2告警管理1.3备份与恢复1.4日志管理1.5权限管理运维工具故障处理,运维管理(1),运维管理(2),系统监控(1),系统监控(2),告警管理,备份与恢复(1),备份对象FM对各部件的管理节点数据进行备份:FM、FC和VSAM,需要配置FTP服务器,若无FTP,则仅做本地备份自动备份备份时间:每天凌晨02:00默认保留7个备份(包括自动和手工备份)手工备份场景:对系统进行重大操作前,例如升级、重大数据调整等,通过FusionManager备份管理节点数据目的:保证系统在出现异常或未达到预期结果时可以及时进行数据恢复,将对业务的影响降到最低备份时间:建议在业务量小的时间段执行备份数据操作备份数据保存到:本地和FTP操作入口:FusionManager:系统-备份设定,备份与恢复(2),手工恢复在对FM、FC重大操作(如升级或打补丁、重大数据调整、扩容等)后,系统有可能出现异常或未达到预期结果。此时需要对其进行回退,含数据恢复操作数据恢复后,会丢失从备份时刻到恢复时刻之间的数据FM手工恢复在FM上执行命令:restoreGalaxManager-f备份文件路径+备份文件名影响:恢复过程中会停止FM进程,则无法登录操作FM。客户虚拟机正常运行FC手工恢复在FC上执行命令:restoreGeData-tDATA-f/home/GalaX8800/YYYY-MM-DD_sn/DATA/备份文件名高斯DB:restoreGeData-tDB-f/home/GalaX8800/YYYY-MM-DD_sn/DB/备份文件名影响:恢复过程中会停止VRM进程,将无法登录操作FC。但客户虚拟机正常运行,日志管理,权限管理,运维管理运维工具2.1FusionSphereSOI(仅配套FusionCompute)2.2FusionCare2.3UpdateTool故障处理,FusionSphereSOI(1),FusionSphereSOI(SystemOperationInsight系统运行洞察)对FusionSphere资源情况进行全面可视化和动态分析,是FM/FC的增强SOI支持部署在虚拟机上,FusionSphereSOI(2),FusionCare(1),FusionCare(2),UpdateTool(1),对系统要求:操作系统要求:WindowsXP、Windows7、Windows2003、Windows2008和Windows2012的32位或者64位操作系统软件要求:winrar解压软件;IE8+、Chrome18.0及以上、火狐8.0及以上版本浏览器端口限制:工具安装的客户机端口7173、7184、7195、7236未被占用权限要求:安装升级工具的用户需要在Windows系统下具有安装服务、启动服务、停止服务的权限,UpdateTool(2),UpdateTool(3),运维管理运维工具故障处理3.1故障处理流程3.2应急预案3.3故障处理案例,故障处理流程,运维管理运维工具故障处理3.1故障处理流程3.2应急预案3.3故障处理案例,重大事故界定,重大事故指发生突然、影响面广、涉及范围大、并可对网络的安全运行与服务质量造成严重后果的设备或网络事故包括双节点故障、机柜异常掉电等应急预案在系统或设备发生紧急事故的情况下,为迅速排除故障、恢复系统或设备的正常运行,从而尽量挽回或减少事故损失而对设备进行的一种故障处理行为,应急处理原则,快速恢复原则:应综合考虑相应操作恢复业务成功的可能性和时间代价。参考的操作排序如下:耗时短,成功性大-耗时短,成功性小-耗时长,成功性大重大事故处理原则以快速恢复设备的正常运行与业务的提供为核心以客户业务尽快恢复,对客户影响最低为原则维护人员在上岗前必须接受必要的应急处理培训在重大事故的处理过程中,维护人员应及时联系华为公司客户服务中心或华为公司驻当地办事处当维护人员完成重大事故的处理以后,应及时采集与本次事故有关的设备故障告警信息,并将相关的事故处理报告、设备告警文件、日志文件等发送给华为公司进行分析与定位,三条军规:第一时间恢复业务问题未定位清楚前,不改动现网配置避免处理不当导致问题扩大(对于关键操作要谨慎,知会客户),运维管理运维工具故障处理3.1故障处理流程3.2应急预案3.3故障处理案例,大面积用户虚拟机无法访问(1),大面积用户虚拟机无法访问(2),故障处理思路,大面积用户虚拟机无法访问(4),大面积用户虚拟机无法访问(4),大面积用户虚拟机无法访问(5),FC运维系统无法访问(1),FC运维系统无法访问(2),故障处理思路,FC运维系统无法访问(3),FC运维系统无法访问(4),FC运维系统无法访问(5),FC运维系统无法访问(6),FC运维系统无法访问(7),主备FM虚拟机同时故障(1),判断题故障处理的流

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论