




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,DELL存储,常见存储管理、故障处理和注意事项,.,常见故障原因,经验表明,造成客户存储故障的外部原因主要有以下几种:存储内部错误的开关机顺序。机头或扩展柜的速率开关处于错误的位置。不规范的软硬件升级。对存储子系统进行破坏性操作。不规范的故障修复操作。维护过程中触发了相关的隐患。存储系统没有冗余的配置方案。,.,开关机步骤,开机:SAN交换机EXP磁盘扩展柜主控柜主机关机:主机主控柜EXP磁盘扩展柜SAN交换机不正确的开关机顺序可能会导致部分硬盘离线以及数据无法访问。注意:在DS5000按下电源按钮关机后,在控制器代码和所有电源灯熄灭前绝对不能进行任何操作!,.,管理软件,StorageManager客户端管理软件连接方式如下:将装有StorageManagerClient客户端软件的工作站,通过以太网Hub或Switch,同时连接到DS4000/DS5000的两个控制器。打开StorageManagerClient客户端软件控制器有一个出厂默认的IP地址:控制器A/B:192.168.128.101/102(控制器A/B:192.168.129.101/102),.,存储子系统状态标识,.,管理界面-企业主管理界面,.,管理界面子系统管理界面,.,子系统部件标识,.,故障检测按钮,使用“RecoveryGuru”故障检测按钮检查DS4000/DS5000子系统的整体状态“听诊器”,.,故障检测按钮,正常故障,.,控制器和扩展柜的硬件状态,点击物理硬盘右侧的状态检查按钮,可以打开查看具体部件的硬件工作状态,.,查看控制器信息,选择“StorageSubsystemMenu”“View”“Profile”,.,故障数据收集,收集AllSupportData菜单:Advanced-Troubleshooting-CollectAllSupportData.,.,故障数据收集,查看MajorEventLog菜单:Advanced-Troubleshooting-ViewEventLog,.,故障数据收集,查看链路信号噪音检测报告菜单:Advanced-Troubleshooting-RunDiagnostics-ReadLinkStatus,.,电池和缓存,电池和缓存的设计原理为了保证写缓存数据的安全性,DS4000/DS5000系统中,只要电池发生故障(处于Failed状态)或者超过微码所规定的设计寿命,那么写缓存就会被自动禁用为了保证写缓存数据的安全性,默认两个控制器的CacheMirroring写缓存镜像功能是打开的。因此当一个控制器的写缓存被禁用之后,另外一个控制器的写缓存也不能使用了。,.,电池和缓存,写缓存禁用之后的故障现象主机端应用程序响应变慢,从topas检查主机性能指标,I/Owaiting显著增加,每个逻辑盘的busy接近100%,但是IO吞吐量很小,每秒只有几十K到1M不等:,.,电池和缓存,电池的更换策略如果电池当前是处于“Failed”或“Removed”状态如果电池当前状态正常,只是接近或已超过告警寿命,.,在AIX上使用MPIO的一些注意事项,AIX版本5.2以上,除了原有的集成的RDAC功能以外,操作系统还新增了MPIO的功能来实现外部磁盘的多通路访问。AIX5.2/5.3默认是使用RDAC,而AIX6.1默认是使用MPIO。RDAC和MPIO的兼容性DS3000:只支持MPIODS4000:支持方式:RDAC,MPIODS5000:支持方式:MPIO(DS5000在AIX上不再支持RDAC),.,在AIX上使用MPIO的一些注意事项,如何在AIX上确认当前正在使用MPIO还是RDAC在AIX中执行“manage_disk_drivers”以下是一个当前使用MPIO的例子:#manage_disk_drivers1:DS4300:currentlyMPIO;supported:RDAC/fcparray,MPIO2:DS4500:currentlyMPIO;supported:RDAC/fcparray,MPIO3:DS4700/DS4200:currentlyMPIO;supported:RDAC/fcparray,MPIO4:DS4800:currentlyMPIO;supported:RDAC/fcparray,MPIO以下是一个当前使用RDAC的例子:1:DS4300:currentlyRDAC/fcparray;supported:RDAC/fcparray,MPIO2:DS4500:currentlyRDAC/fcparray;supported:RDAC/fcparray,MPIO3:DS4700/DS4200:currentlyRDAC/fcparray;supported:RDAC/fcparray,MPIO4:DS4800:currentlyRDAC/fcparray;supported:RDAC/fcparray,MPIO,.,在AIX上使用MPIO的一些注意事项,如何检查当前磁盘的工作路径RDAC:fget_config-AvMPIO:mpio_get_config-Av,.,常见故障处理和注意事项,控制器微码是不是有重大隐患的版本?06.23.05.00:隐患一:当某个控制器内存校验出错时,故障控制器无法正确的被隔离offline,从而导致逻辑盘LUN不能切换到好的控制器上,主机访问中断。隐患二:DS4800写缓存被禁用,主机写性能大幅度下降,从而影响业务。07.10.23.00:隐患一:更换故障硬盘后,之前已经接管的热备盘无法CopyBack隐患二:MediaScan被自动禁用,.,常见故障处理和注意事项,EXP扩展柜的ESM微码版本有没有重大隐患?EXP710的ESM的微码隐患(9681以下版本)当一块硬盘故障时,MEL里面显示FiberChannelLinkup和Linkdown的Event,发生大面积的多块硬盘的同时故障,客户数据访问中断。EXP810和EXP420的ESM的微码隐患(98D0以下版本)当一块硬盘故障时,MEL里面显示FiberChannelLinkup和Linkdown的Event,发生大面积的多块硬盘的同时故障,客户数据访问中断。,.,常见故障处理和注意事项,要特别注意前面板右下方的(2GB/4GB)速率开关,是否处于正确的位置。速率开关处于4GB位置时,2Gbps的硬盘将不能被识别;相反速率开关处于2GB位置时,4Gbps的硬盘是可以使用的,但是性能将会下降。这种情况比较容易被忽视。速率开关的更改需要关机下电。注意:所有3Gbps的SATA硬盘,都推荐运行在4Gbps。,.,常见故障处理和注意事项,磁盘扩展柜的光纤连线符合IBM的规范。在控制器有冗余的光模块条件下,建议将多个扩展柜连接在多个冗余环路上,尽量不要将所有的扩展柜串联在一个环路里。,.,常见故障处理和注意事项,只要使用了光纤交换机,做Zone是强制要求。每一个Zone必须只包含两个成员,一个对应主机的一张光纤卡的一个端口,另一个对应DS4000/DS5000的一个控制器的一个端口。,.,常见故障处理和注意事项,逻辑盘不在最优路径“LogicalDriveNotOnPreferredPath”。这个问题指的是DS4000/DS5000的逻辑盘(LUN)没有挂在原本所属的控制器下。,.,常见故障处理和注意事项,原因分析:(主要有6点)从主机的光纤卡到LogicalDrive的光纤物理链路有问题。P-Series主机的dar0的虚拟设备配置有问题光纤交换机fabric1的Zone设置有问题。主机光纤卡HBA和DS4000/DS5000控制器的主机端口HostPort之间的光纤连线方式不正确,没有符合IBM的规范。控制器发生过重启,或者控制器已经Offline(离线),.,常见故障处理和注意事项,检查的确认方法:(主要有8点)确认从主机的光纤卡到逻辑盘LogicalDrive的物理链路是完全正常的。查看光纤交换机相应的主机光纤卡端口和DS4000/DS5000控制器端口的状态灯登陆主机,运行“fget_config-Av”确认dar的虚拟设备配置正常确认光纤交换机的Zone设置没有问题。确认主机光纤卡HBA和DS4000/DS5000控制器的主机端口HostPort之间的光纤连线方式是正确。在SM客户端管理软件里面确认DS4000/DS5000的控制器状态正常检查DS4000/DS5000内部的Mapping是否正确确认Linux主机的hosttype是否正确。,.,常见故障处理和注意事项,恢复方法在StorageManager客户端管理软件里面运行:AdvancedRecoveryRedistributeLogicalDrives在StorageManager客户端管理软件里面,更改每一个逻辑盘LogicalDrive的所属控制器菜单:LogicalDriveChangeOwnership/PreferredPath注意:在恢复之前,一定要确认从主机的光纤卡到LogicalDrive的通道是完全正常的,只有在完全确认上述几种故障都已经解决之后,才能实施恢复。否则后果一定是灾难性的!,.,常见故障处理和注意事项,StorageManager客户端软件不能连接和访问DS4000/DS5000的控制器首先排除网络方面的问题看看控制器的两位数字LED的显示是否正常如果控制器的两位数字LED的显示在循环变化,或者Ping的时通时断,这时候可以通过串口连上控制器,观察并捕获屏幕的输出。控制器能Ping通但是StorageManager连不上如果能安排停机时间,重启机头是最有效的解决方法。,.,常见故障处理和注意事项,拔除DS4000/DS5000系统中所有未使用(没有光纤连接)的光电转换模块SFP会导致光纤链路的不稳定在MELEventLog中,会发现有大量的“FibreChannelLinkDown”和“FibreChannelLinkUp”的提示信息。,.,常见故障处理和注意事项,特别注意:不规范的实施DS4000/DS5000系统EXP扩展柜和物理硬盘的升级和迁移,可能会造成客户数据丢失!DS4000/DS5000系统增加新的EXP扩展柜(升级)DS4000/DS5000系统增加新的物理硬盘(升级)将一个或多个EXP扩展柜,从一个现有的DS4000/DS5000系统迁移到另一个DS4000/DS5000系统(迁移)将一块或多块硬盘,从一个现有的DS4000/DS5000系统迁移到另一个DS4000/DS5000系统(迁移)以上工作必须严格按照最新版的IBM官方文档里面所规定的步骤进行。,.,常见故障处理和注意事项,注意定期保存DS4000/DS5000系统的AllSupportData(ASD)DS4000/DS5000的AllSupportData里面记录了所有Array的配置信息和主机Mapping的信息,在关键时刻对于客户的数据恢复有着非常重要的作用。,.,常见故障处理和注意事项,寻找DS4000/DS5000的RecoveryProfileSM客户端软件的一个功能记录了DS4000的Array和LUN的基本信息,.,常见故障处理和注意事项,不能对处于“Degraded”状态的Array的故障硬盘使用Revive操作!当Array变成Degraded状态时,主机的访问将会恢复。故障硬盘仍然处于被隔离的静止状态造成数据丢失!,.,常见故障处理和注意事项,故障误报微码和旧版的不兼容通过升级微码解决通过重启机头解决,.,常见故障处理和注意事项,绝对不能在生产系统使用SM客户端管理软件的“ResetConfiguration”功能删除DS4000/DS5000系统里面所有的Array/Lun信息将所有配置恢复成出厂设置值,.,常见故障处理和注意事项,DS5000维护注意事项
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智能家居系统物业接入战略合作框架协议
- 离婚协议范本:财产分割、子女抚养及赡养协议书
- 离婚协议范本:债权债务分担及子女抚养安排
- 离婚抚养合同:子女轮流抚养权及监护责任分担协议
- 个人外汇政策培训大纲
- 辽宁省培训安全平台课件
- 技术设计面试题及答案
- 中国银行2025济宁市秋招群面模拟题及高分话术
- 工商银行2025秋招群面模拟题及高分话术江苏地区
- 邮储银行2025白城市秋招结构化面试经典题及参考答案
- 新苏教版小学科学六年级上册《制作汽水》课件
- 眼科操作并发症及处理
- 大学介绍清华大学宣传
- 药理学教案资料
- 江苏省建筑与装饰工程计价定额(2014)电子表格版
- 零基础预算培训课件
- 可摘义齿修复工艺技术
- DB15-T 2241-2021 数据中心绿色分级评估规范
- 吐鲁番地区鄯善县区域环境概况自然及社会环境概况
- 国家中长期科技发展规划纲要2021-2035
- 提升员工质量意识员工培训
评论
0/150
提交评论