ETERNUS DX500S2_DX600S2硬件更换及GUI维护手册_第1页
ETERNUS DX500S2_DX600S2硬件更换及GUI维护手册_第2页
ETERNUS DX500S2_DX600S2硬件更换及GUI维护手册_第3页
ETERNUS DX500S2_DX600S2硬件更换及GUI维护手册_第4页
ETERNUS DX500S2_DX600S2硬件更换及GUI维护手册_第5页
已阅读5页,还剩126页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

富士通DX400S2系列硬件更换及GUI维护手册富士通DX500/600S3系列手册 硬件更换及GUI维护手册2014/1/20 FUJITSU (CHINA) HOLDINGS CO., LTD.目 录 一 使用本手册的基本前提和注意事项5二 DX500S3设备的外观图、状态灯的含义和部件清单及硬件规格5DX500S3的外观图及指示灯6 部件清单及具体更换条件19更换硬件所需要的用户权限级别21 硬件规格及参数22三. DX500S3故障的判断和寻求帮助24日常使用的注意事项24外观指示灯的察看确认25通过WEB进行系统状态检查271 DEVICE STATUS272 RAID Group List的状态察看373 Volume List的状态察看39events事件察看40存储日志的获取及寻求技术支持41Panic dump的收集 (针对CM方面的故障)44disk error(针对磁盘等方面的故障-辅助判断)47四. DX500S3硬件更换的必备工具和实施准备481.硬件更换的必备工具482.对于硬盘的专门要求503.维护模式(说明、进入和退出)514.基本原理说明545.操作前对设备位置的确认556.维护的结束567.维护完成后的一些基本操作578.更换部件后异常情况的处理(慎用)609.预维护模式(Hot preventive maintenance)的使用(慎用,确定需要才使用)6310.重新启动或者关闭DX500S3存储66五. DX500S3各个部件的更换步骤67重要说明:67更换各个部件的物理动作和所必须的系统操作:681.更换HDD UNIT 硬盘68 旧硬盘的移除69 新硬盘的安装702.更换AC Cord 电源线73 电源线的移除73 电源线的安装743.更换 PSU 电源74 PSU 电源的移除75 PSU 电源的安装764.更换 SFP 模块76 链路状态的确认及操作78 SFP模块的移除79 SFP模块的安装79 更换完成后链路状态的恢复及确认805.更换 CM UNIT 控制器80 链路状态的确认及操作81 CM的移除82 Memory的位置所在83 BUD的所在位置84 CM的安装85 更换完成后链路状态的恢复及确认856.更换SAS Cable85 SAS Cable的连接图解86 SAS Cable的移除91 SAS Cable的安装917.更换IOM6 UNIT(Expander)92 IOM6 UNIT(Expander)的移除94 IOM6 UNIT(Expander)的安装948.更换PANEL 面板95 PANEL 面板的移除95 PANEL 面板的安装989.更换MP Unit98 MP(MasterBack Plane) Unit的移除99 MP Unit的安装10110.更换BCU或者BTU102BTU的移除103BCU的移除104BCU的安装106BTU的安装106六. 故障分析及故障排除的几个案例讲解106 PSU故障的分析与解决107 磁盘故障的分析与解决115一 使用本手册的基本前提和注意事项1. 你已经仔细读过DX500S3的安装手册,并对DX500S3有相关使用经验,对如何使用DX500S3已经有较为深入的认识。2. 后面的硬件更换步骤完全基于生产环境的真实硬件故障-非人为制造故障,不是进行简单的模拟测试。 3. 对于完全依靠本手册而不借助于外部协助去解决问题的现场工程师,英语水平的最起码要求是能看懂英文提示和报错信息。4. 本手册的撰写基于V10L31的硬件微码版本。由于产品更新换代和硬件微码的不同,菜单及个别说明可能会与本手册稍有差别。5. 为了表述清楚问题,某些内容可能与DX500S3的安装手册重复。但对于如何进行连接和登录等基本问题此维护手册不再赘述。对于实物图,可以用鼠标拖动将图放大或者放大比例进行察看,以便看清楚局部信息。图中的红框和红色的字均为方便察看所加的标注。6. 因为牵涉到高级别权限用户的硬件更换操作,相关账户请勿随意泄露和胡乱使用。本手册也是基于这个基本前提而写。7. 实际按照本手册进行更换操作时,请确认你已经从头到尾完整阅读过本手册两遍以上。8. 出于对设备本身和自身人身的安全考虑,进行实际的硬件更换操作时,请确保事先准备好各项防静电措施等。9. 通过WEB界面进行操作时,不要点击浏览器上自带的标准按钮如前进、后退、刷新。建议把浏览器的标准按钮隐藏。 二 DX500S3设备的外观图、状态灯的含义和部件清单及硬件规格重要说明:对于实物图,可以用鼠标拖动将图放大或者放大比例进行察看,以便看清楚局部信息。图中的红框和红色的字均是为方便察看所加的标注。1 DX500S3的外观图及指示灯DX500S3系列外观图如下: DX500S3系列存储最大配置表:DX500 S3DX600 S3Remarks Maximum drive number 5281056When 2.5” drives are installed Maximum storage capacity(Physical)SAS 288 TB576 TBWhen 3.5” SAS 600GB drives are installed Nearline SAS480 TB960 TBWhen 3.5” Nearline SAS 2TB drives are installed Maximum cache capacity 64 GB128 GBHost interfaces(Port number per device)FC 4/8/16G FCoE 10GiSCSI 1/10G(16port)(8port)(8port)FC 4/8/16G FCoE 10GiSCSI 1/10G(32port)(16port)(16port)Maximum configuration size (CE size) 5U (3U)5U (3U)CE: Controller Enclosure DX500S3的控制柜CE (controller enclosure)结构示意图如下:DX500S3的扩展的磁盘柜DE (disk enclosure)结构示意图如下:从上面的结构示意图可以清楚的看到DX500S3的结构非常简单,所有组件基本如上图,除了MP Unit没有反映在图中(BP位于控制柜CE或者磁盘柜DE的中间部位,向后连接着CM控制器(含SFP模块和Memory)或者EXP(Expander)和PSU电源,向前连接着HDD并通过PANEL面板侧面的白色数据线与PANEL面板保持着通讯)。具体样子控制柜CE (controller enclosure)具体请参考下面的前后视图。关于各个缩写的含义请参考“组件”。控制柜CE (controller enclosure)的前视示意图:控制柜CE (controller enclosure)的后视视示意图:如上图所示,控制柜CE (controller enclosure)左边是用来操作和设置的PNL(Panel),含7个指示灯、电源设置开关。打开面板能看到给Cache供电的3块电池。下图是磁盘柜DE(drive enclosure)前视图以及相关槽位示意图:PNL(Panel)以及电源开关位置图和局部放大图,指示灯及开关的具体含义:指示灯及开关功能说明和颜色的含义电源(POWER)指示灯存储开机后显示绿色运行(READY)指示灯存储正常运行显示绿色,表明设备可以开始正常使用。故障(FAULT)指示灯存储硬件出现故障显示橙色,如果是橙色并闪烁指示有硬件需要进行预维护识别(IDENTIFY)指示灯通过WEB界面发出指示会显示闪烁蓝色,确认当前操作哪个设备。默认情况下是熄灭的。缓存(CACHE)指示灯1.缓存中有数据显示绿色 2.电源失效存储正在保存缓存中数据显示绿色闪烁。维护(MAINTENANCE)指示灯但进入维护模式的时候显示绿色远程(REMOTE)指示灯当存储处于Remote管理模式时显示绿色维护模式(MAINTE)开关持续按住3秒钟,可以将存储模式进行维护模式/普通模式切换管理IP地址(IP RST)重置开关在3秒钟之内连续按3次,CE柜后端的MNT 接口的管理IP将被重置为,RMT以及USER 接口的管理IP将被清空。电源(PWR)开关存储的开机/关机按钮控制器切换(MASTER)开关在3秒钟之内连续按2次,CE的主备控制器将进行切换 含外壳面板的控制柜CE (controller enclosure)前视图:面板的左上角是5个指示灯和电源按钮,左下角是具体的型号。从控制柜CE (controller enclosure)后面看到的后视图和局部俯视图: DX500S3的CM和CPSU都是冗余的。图中的把手是分别用来固定CM(控制器)和CPSU(电源)的。为了方便拍摄,将CM和PSU都挪到了后部的边缘位置。PSU旁边的黑色扎带是用来固定电源线防止意外脱落的。DE 接口的连接:控制柜 CE(controller enclosure)与扩展的磁盘柜DE(Disk enclosure)之间、两个DE之间的连接要使用专用的miniSAS数据线连接 (多个柜子之间的级联线). MiniSAS两头分为IN和OUT,请根据插头上的符号确认,与DE 接口进行连接。关于如何进行连接的详细信息请仔细参考“SAS Cable的连接图解”。HOST所标示的端口里面插的就是用来连接主机HBA卡的SFP模块,在进行光纤线的连接前,应该移除SFP模块的防尘盖(dust cover)和光纤线的防尘盖(dust cover),并保管好取下的防尘盖。具体可以参考“更换 SFP 模块”。机器尾部的白色标签纸上面有机器的MODEL(型号)和SERIAL(序列号)和CHECK CODE号码。放大图请参考“更换硬件所需要的用户权限级别”。扩展的磁盘柜DE (disk enclosure)的后视图如下:扩展的磁盘柜DE (disk enclosure)背部EXP(Expander) 的指示灯如下:扩展的磁盘柜DE背部的EXP(Expander)上面的接口和指示灯都很少。EXP(Expander)上面的DE 接口有2个,方形标记的是OUT接口、圆形形标记的是IN接口。控制柜CE (controller enclosure)背部的CM(controller Module)上面只有OUT接口。控制柜 CE(controller enclosure)与扩展的磁盘柜DE(Disk enclosure)之间、两个DE之间的连接要使用专用的miniSAS数据线连接(多个柜子之间的级联线),如果没有多于4个扩展的磁盘柜DE,则不需要级联线。MiniSAS两头分为IN和OUT,请根据插头上的符号确认,与DE 接口进行连接。注:此MiniSAS连接线为防止接错,IN和OUT的接头标准并不一致,在连接时切勿使用蛮力。连接线上的IN或OUT标志与存储后端的IN或OUT标志保持一致即可确保连接无误。关于如何进行连接的详细信息请仔细参考“SAS Cable的连接图解”。控制柜CE和磁盘柜DE后部这些指示灯及接口的具体含义如下:指示灯及接口功能说明和颜色的含义SCU 指示灯是用来表明SCU后备电池装置的工作状态,常亮绿色代表SCU在正常工作。ID 指示灯与前面板的识别(IDENTIFY)指示灯作用完全一样。通过命令行发出命令/ WEB界面发出指示会显示闪烁蓝色,确认当前操作哪个设备。一般情况下是熄灭的。DE (OUT或者IN) 指示灯显示连接扩展的磁盘柜DE (disk enclosure)的状态,未连接DE时是不亮的。DE 接口用来连接扩展的磁盘柜DE (disk enclosure)。有IN接口和OUT接口的区别。RMT 接口 (管理使用)可以自行设置IP地址,默认是没有设置IP地址。建立了连接时,右边的Link灯会变成绿色。有访问时,左边的Act灯会闪烁绿色。MNT接口 (管理使用)可以自行设置IP地址,默认是没有设置IP地址。建立了连接时,右边的Link灯会变成绿色。有访问时,左边的Act灯会闪烁绿色。FST 接口 (管理使用)出厂默认的管理 IP 为。建立了连接时,右边的Link灯会变成绿色。有访问时,左边的Act灯会闪烁绿色。HOST 0 接口和指示灯(Port0 含SFP模块)用来连接到主机的HBA卡。未接光纤线时是熄灭的。如果连接有光纤线,并且相应的整个光纤传输链路没有问题时,会显示绿色代表建立了连接。HOST 1 接口和指示灯(Port1 含SFP模块)用来连接到主机的HBA卡。未接光纤线时是熄灭的。如果连接有光纤线,并且相应的整个光纤传输链路没有问题时,会显示绿色代表建立了连接。STS 状态指示灯(STATUS LED)CM 的Unit Ready/Fault LED。绿色代表没有问题。稳定的或者闪烁的橙色代表当前状态有问题或者存在故障,比如部件需要更换。MST 指示灯在DX500S3完全启动完成后,2个CM中只会有1个CM的MST 指示灯会常亮绿色,表明自身是Master CM,MST指示灯熄灭的表明是Slave CM。通过Master CM相应的RMT 接口IP地址或者MNT 接口IP地址可以登陆上来进行日常管理。PSU 的状态指示灯(STATUS LED)常绿色是在正常工作,绿色闪烁代表关闭状态,橙色表示有故障。 部件清单及具体更换条件DX500S3是高度集成和模块化的产品。下文中硬件更换步骤完全基于生产环境中已经出现问题的真实硬件故障-非人为制造故障,部件清单和具体的更换条件如下:enclosure组件支持Hot maintenance(保持主机对存储的不间断访问)支持Hot preventive maintenance(保持主机对存储的不间断访问)支持Non hotBTUCE控制柜(controller enclosure)CE控制柜(controller enclosure)本身NoNoYesCM控制器(controller Module)YesYesYesCA控制器YesYesYesBTU/BCU电源YesYesYesSFP模块(安装在CM的Port上面)YesYesYesBUD模块(安装CM中)YesYesNOCPSU电源(Power Supply Unit)YesYesYesPNL面板 (Panel)NoNoYesMP UnitNoNoYesAC CordYesNoYes磁盘柜DE(disk enclosure)扩展的磁盘柜DE(disk enclosure)本身NoNoYesIOM6(Expander)YesYesYesPSU电源(Power Supply Unit)YesYesYesHDD (Hard Disk Driver)YesYesNoPNL面板 (Panel)NoNoYesMP UnitNoNoYesSAS CableYesYesYesAC CordYesNoYes本手册讨论的基本都是在DX500S3确认硬件出现故障后执行的硬件更换操作。现场实际更换操作都是主要针对Hot maintenance方式,在无法使用Hot maintenance方式下,才使用其他更换操作方式,比如关机进行更换操作。以上可Hot maintenance维护都是基于现场是2CM和2PSU的冗余配置。DX500S3的预维护模式(Hot preventive maintenance),这是在硬件还没有完全出故障的情况下执行的硬件更换操作,这种操作应该在足够和充分的判断后方可执行,尤其对于有配置和数据的RAID里面的磁盘进行预维护操作更要小心。Hot preventive maintenance有专门的操作命令和维护菜单。Hot Preventive maintenance 操作会将相关部件从DX500S3系统里面断开(相当于这个部件确实发生故障了)。注: MP Unit位于控制柜CE或者磁盘柜DE的中间部位,向后连接着CM控制器(含SFP模块和Memory)或者EXP(Expander)和PSU电源,向前连接着HDD并通过PANEL面板侧面的白色数据线与PANEL面板保持着通讯。所以更换BP Unit必须是关机进行操作。由于HDD磁盘上面有RAID等配置信息,为防止误操作和确保安全等,请勿对磁盘执行cold maintenance(关机更换操作)。所有更换都是基于新的备件是好的未使用过的备件(至少外包装无破损,外观无损坏和变形)。2 更换硬件所需要的用户权限级别针对硬件的更换操作需要使用到Advanced Privilege的用户f.ce,对应密码是印在机器后面标签上面的“CHECK CODE号码+SER. NO.(序列号) ”。有些菜单和功能root用户是无法看到并执行的。因为牵涉到高级别权限用户的硬件更换操作,相关账户请勿随意泄露和胡乱使用。或者在通过,前面板的Maintence开关开启,Maintence模式。注意f.ce用户请勿修改。3 硬件规格及参数DX500S3DX600 S3补充说明最大磁盘数 5281056使用2.5寸盘柜最大存储空间(物理空间,非raid)SAS 288 TB576 TB使用3.5” SAS 600GB Nearline SAS480 TB960 TB使用3.5” Nearline SAS 2TB最大cache 空间 64 GB128 GB存储外接接口(每个设备支持最大数)FC 4/8/16G FCoE 10GiSCSI 1/10G(16port)(8port)(8port)FC 4/8/16G FCoE 10GiSCSI 1/10G(32port)(16port)(16port)CE设备大小 (CE size) 3U3UDE设备大小(DE size)2U2U存储支持Raid级别RAID0, RAID1, RAID1+0,RAID5, RAID5+0, RAID6RAID0, RAID1, RAID1+0,RAID5, RAID5+0, RAID6最大连接的主机数10241024单个Host group支持最大数88单个Port group支持最大数88三. DX500S3故障的判断和寻求帮助日常使用的注意事项 开机: 按下控制柜CE(controller enclosure)上面的power switch按钮即可将控制柜CE和扩展的磁盘柜DE(disk enclosure)全部带动开机。开机启动时间一般在3分钟以上,检查所有enclosure的POWER LED 和 READY LED是否都亮起来了确认启动是否正常完成。在CE的READY灯亮起来后就可以正常访问使用了。 关机: 按住控制柜CE上的power switch按钮 4秒以上(按一次即可,不要按多次),此时CE的READY灯会熄灭,存储会自动将所有enclosure进行正常关机,最终所有enclosure的POWER LED 都会熄灭。 不可以在业务运行时关闭存储,不可以通过直接拔电源或拉闸的方式关闭存储。应该是在存储启动完成之后再启动主机,在主机关闭之后再关闭存储。 无论任何情况,在没有富士通专业人员在场时都不可以随意插拔和移动存储中的硬盘,特别是前2块系统盘。 日常应注意存储前面板上的状态灯的情况,如果FAULT灯亮需要及时联系FUJITSU 技术支持维修中心 电话 :8008208851 (4032 ) help_ 。请一起提供相关状态截图和存储日志。具体请参考“存储日志的获取及寻求技术支持”和“Panic dump的收集 (针对CM方面的故障)”。在问题比较复杂的情况下,请额外提供现场的详细配置信息(含网络拓扑)和操作记录。外观指示灯的察看确认在存储正常运行时,DX500S3前面板的POWER(电源)指示灯和READY(运行)指示灯显示为绿色,其余指示灯都是熄灭的。根据前面板的FAULT (故障)指示灯可以初步知道机器的当前状态有没有报错。如果 FAULT (故障)指示灯显示为橙色,一般表明存储硬件方面出现故障或者正在进行硬件更换。如果是磁盘出现故障,一般情况下,相应的磁盘状态指示灯(导光管)会表现为稳定的橙色。指示灯的颜色察看和故障初步判断请仔细参考“指示灯及开关”和“指示灯及接口”及“DX500S3的外观图及指示灯”。通过WEB进行系统状态检查在overview中能够显示DX500S3存储所有组成部件的状态。1 DEVICE STATUS上图红色圆框圈住的图标标示出系统总体状态,它的表示有如下几种:状态显示颜色说明绿色存储的所有硬件状态正常黄色存储需要维护橙色存储正在被维护红色存储硬件有故障红色存储没有正常启动或者硬件故障灰色存储里面有未使用的部件图九在完成部件更换后,状态变化的含义如下:Normal安装新部件成功Maintenance正在安装新部件(新部件在更换中、识别中、校验同步中)如果是更换了新磁盘,如果有Rebuild/Copyback正在进行中,这表明是一次成功的新部件安装Warning,Error安装新部件失败或者还没有开始更换新部件在Component下面的每个图标都可以单独用鼠标点开进行各个组件(部件)的信息和状态察看。图标所代表的组件(部件)的状态含义如下表:组件状态显示颜色说明绿色组件处于正常状态红色组件有故障发生黄色对某些组件需要进行预维护操作橙色组件正处于维护过程中 蓝色组件已经安装好,但是其中某些组件还没有开始使用。注:如果没有使用的组件是硬盘,存储的整体状态是Normal(Green)。灰色组件存在某些上面没有提到的错误下图的是Component下面磁盘整体的信息,其中磁盘状态是Present意味着该磁盘没有被使用;磁盘状态是Available意味着该磁盘是被某一个Raid使用的。单个磁盘的详细信息类似如下:在整体的DEVICE STATUS出现报错后,应该找到相应的报错部件, 进行进一步的信息和状态察看。以下是一个范例:在故障磁盘进行更换后,RAID Group在进行RAID重建或者数据拷回的后台操作(自动进行):磁盘存在故障需要进行更换:上面是一个磁盘方面的故障例子,下面是一个PSU方面的故障例子。 从图中可以看到有PSU显示出故障状态。具体请参考“events事件察看”。2 RAID Group List的状态察看察看RAID Group的配置情况和状态信息,如图点击相应RAID组,即可查看RAID方面的详细信息。下图是选择RAID Group List后出面的界面。Rebuild/Copyback 有进度输出代表相应的RAID Group在进行RAID重建(热备盘在起作用或者已经进行了更换)或者数据拷回的操作,由于此时RAID状态正在变化过程中,此时不应该对此RAID里面的故障磁盘马上进行更换的操作,应该等相关变化结束并且RAID状态稳定下来后再进行磁盘更换。如果有故障磁盘存在,并且没有Rebuild/Copyback正在进行中,此处的输出为空,此时可以考虑进行故障磁盘的更换。注意:上面图中Status常见的可能值如下:Available 此RAID Group的状态良好Rebuild 此RAID Group出现了硬盘故障,热备盘正在起作用替代故障硬盘。 Spare in Use 此RAID Group出现过硬盘故障,热备盘Rebuild完成已经完全替代故障硬盘。Copyback 此RAID Group出现过硬盘故障,热备盘已经完全替代故障硬盘。进行故障硬盘更换后,热备盘的数据正在往新硬盘拷贝。Exposed 此RAID Group出现了硬盘故障,现在热备盘已经用完或者根本无热备盘可用。正处于边界状态,需要赶快采取措施。Broken 此RAID Group出现的硬盘故障数量已经超过了此RAID 级别允许的范围,此RAID Group现在已经完全坏掉。RAID Group里面的volumes一般会反映出与RAID Group一样的状态。在RAID Rebuild/Copyback过程中,此RAID里面的各个volume都会受到影响,同样会反映出Rebuild/Copyback的状态的。点击上图中Raid组FCH-T-1的查看这个RAID组的卷配置,一排中Basic表示组成RAID的基本信息(其他信息在之后的VolumeLayout和Disk中显示)。如下图:3 Volume List的状态察看在RAID 进行Rebuild/Copyback的过程中,此RAID里面的各个volume都会受到影响,同样会反映出Rebuild/Copyback的状态的。events事件察看共有3个级别 的事件信息:information、warning、error。存储日志的获取及寻求技术支持在出现故障或者相关问题之后,应该下载相关存储日志寻求技术支持。在菜单System-Event/Dump中下载日志,点击右边Export/Delete log如下图:点击Export/Delete Log按钮进行下载,在弹出的菜单中选择 确定 ,出现下面的菜单:选择Download 开始下载,在弹出的菜单中选择 保存,并指定 保存的具体目录及文件名称下载 日志 完成后,点击Finish 退出此界面。Panic dump的收集 (针对CM方面的故障)在确实存在panic的情况下,应该将Panic dump信息进行收集进行勾选后,再点击Export后出现下图:点击Download后出现下图:在弹出的窗口中选择 保存,并指定 保存的具体目录及文件名称。下载 Panic dump文件 完成后,点击Finish 退出此界面。disk error(针对磁盘等方面的故障-辅助判断) 可以察看DX500S3磁盘方面的错误统计信息。四. DX500S3硬件更换的必备工具和实施准备1.硬件更换的必备工具LAN Cable网线 (日常维护时用来连接DX500S3与主机)Antistatic Mat 用来临时放置部件和螺丝, 防止在维护过程中由于静电的原因而损害部件。不要将相关部件直接放在金属桌面上。同时在运输及搬运过程中, 应该使用防静电袋保护好部件, 即使是坏部件也应该如此。Wrist Strap防静电手腕及防静电手套防止在维护过程中损害部件,同时在对DX500S3进行带电操作的情况下更是对自身人身安全的一个根本保障。下图分别是防静电手腕及防静电手套和防静电袋。十字螺丝刀2.对于硬盘的专门要求要带防静电手腕进行操作。不要将HDD直接放在金属桌子上,如果硬盘拆掉包装后放置时应该放在anti-static mat with cushion的上面。硬盘不使用时或者使用完成后应该使用防静电袋或者自带的防静电袋进行包装和放置。硬盘之间要保持足够的距离,防止彼此接触到和相互撞击。同时不要象下图那样放置硬盘:3.维护模式(说明、进入和退出)维护模式是将设备置于准备维护操作的状态下,会将相关敏感信息进行抑制同时对LED指示灯的状态进行控制。在维护模式下,sense report:SCSI sense、SNMP report和E-Mail report及REMCS report等会受到抑制。在进行相关部件更换操作前应该进入维护模式,在确认问题得到解决后应该要退出维护模式,返回正常工作模式。进入维护模式(必须使用带有维护权限的用户登录)点击Start ,弹出确认菜单,点击 确定 即可进入维护模式。通过以下界面可以进一步确认DX500S3切换到了维护模式,请参考比对“Component”和边框维护模式 。 执行相关Hot maintenance更换操作,具体见相关部件的物理更换操作,请参考“DX500S3各个部件的更换步骤”。在确认问题得到解决后应该要退出维护模式,返回正常工作模式。 点击End ,弹出确认菜单,点击 确定 即可退出维护模式。本手册讨论的基本都是在DX500S3系列确认硬件出现故障后执行的硬件更换操作。 4.基本原理说明 DX500S3的各个部件是否支持热更换,具体请参考“部件清单及具体更换条件” 。支持热更换的部件,也就是支持热插拔操作的部件。对于出现问题的部件或者已经消失了的部件,DX500S3的系统会认为这个部件是有问题的,所以当重新插回出现问题的部件或者已经消失了的部件,DX500S3的系统里面一般情况下并不会将此部件重新置于Normal的状态。如前所述,后面的硬件更换步骤完全基于生产环境的真实硬件故障-非人为制造故障,不是进行简单的模拟测试。5.操作前对设备位置的确认为防止误操作等,进行新部件更换操作前,应该进行控制柜CE或者磁盘柜DE的位置确认。执行此操作后,相应控制柜CE或者磁盘柜DE前面板的识别(IDENTIFY)指示灯和后面的ID指示灯都会闪烁蓝光。位置得到确认后,应该关闭前后的指示灯。执行此操作后,相应CE或者DE前面板的识别(IDENTIFY)指示灯和后面的ID指示灯都会熄灭。6.维护的结束在结束维护前,应该确认DX500S3所有组件和设备都处于Normal状态。确认RAID、Volume状态处于正常状态(含硬盘更换后的Rebuild/Copyback)。具体请参考“通过WEB进行系统状态检查” 。确保系统和各个部件的LED指示灯都是绿色,当然硬盘的指示灯在同步和重建过程中不是绿色。具体请参考“外观指示灯的察看确认”和“DX500S3的外观图及指示灯” 。如果以上都没有问题,代表本次维护基本可以放心结束。7.维护完成后的一些基本操作在每次维护工作完成后,确认全部问题都得到了有效解决后,应该执行下面的操作删除敏感信息,防止以前的硬件报错会错误的再次反映到日志中来,干扰对系统运行状态的准确判断。点击Delete,弹出确认菜单,点击 确定 即可完成删除。同样在确认CM的panic问题得到有效解决后, 在导出panic-dump文件备份完成后,可以考虑将panic-dump文件进行删除。在上面的菜单中进行勾选后,点击Delete,弹出确认菜单,点击 确定 即可完成删除。部件更换完成后,应该保存一次存储日志请参考 “存储日志的获取及寻求技术支持” 。 在长时间运行DX500S3存储后,在系统运行正常的情况下,可以考虑在导出最新日志后,对日志进行删除操作。这么做的原因主要是为了防止日志文件过大,在真正出现问题需要寻求帮助时,不利于缩小考虑问题的范围。非必须操作。点击Delete,弹出确认菜单,点击 确定 即可完成删除。在状态检查或者维护结束后,应该退出登陆状态。在状态栏中选择右上角的Logoff后,弹出确认菜单,点击 确定 即可退出DX500S3的管理界面。如果不是通过点击Logoff正常退出,下次通过WEB进行正常登陆时就会出现下面的提示。8.更换部件后异常情况的处理(慎用)所有更换都是基于新的备件是好的未使用过的备件(至少外包装无破损,外观无损坏和变形)。在所有部件更换过程中,应该避免对着新部件或旧部件讲话或者喷口水。在移除故障部件并更换新的部件后,一般情况下,DX500S3在检测无问题后会执行必要同步然后让相关部件上线变成Normal的状态。在某些特殊情况下,可能新部件插入后,并没有变成Normal状态。在部件无问题的情况下,可以考虑使用Force Enable功能让部件强制上线。支持Force Enable功能的部件,具体请仔细参考下面的表格: Hot maintenance、preventive maintenance等这些操作都是保持主机对存储的不间断访问enclosure组件支持Hot maintenance(保持主机对存储的不间断访问)支持Hot preventive maintenance(保持主机对存储的不间断访问)支持Force Disable支持Force EnableCE控制柜(controller enclosure)CE控制柜(controller enclosure)本身NoNoNoNoCM控制器(controller Module)YesYesYesYesSFP模块YesYesYesYesPSU电源(Power Supply Unit)YesYesYesNoPNL面板 (Panel)NoNoNoNoMP UnitNoNoNoNoBCU(包括BTU)YesYesYesNoAC CordYesNoNoNo扩展的磁盘柜DE(disk enclosure)本身NoNoNoNo磁盘柜DE(disk enclosure)EXP(Expander)YesYesYesYesPSU电源(Power Supply Unit)YesYesYesNoHDD(Hard Disk Driver)YesYesYesYesPNL面板 (Panel)NoNoNoNoMP UnitNoNoNoNoSAS CableYesYesYesNoAC CordYesNoNoNo如前所述,结合实物图也可以清楚的看到:控制柜CE (controller enclosure)和扩展磁盘柜DE (disk enclosure)唯一的不同就是CE的背部是CM(controller Module)而DE的背部是EXP(Expander)。实物图等信息请仔细参考“DX500S3的外观图及指示灯”。以下是让硬盘强制上线的例子: 9.预维护模式(Hot preventive maintenance)的使用(慎用,确定需要才使用)DX500S3的预维护模式(Hot preventive maintenance),这是在硬件还没有完全出故障的情况下执行的硬件更换操作,这种操作应该在足够和充分的判断后方可执行,尤其对于有配置和数据的RAID里面的磁盘进行预维护操作更要小心。Hot preventive maintenance有专门的操作命令和维护菜单。Hot Preventive maintenance 操作会将相关部件从DX500S3系统里面断开(相当于这个部件确实发生故障了)。支持预维护模式(Hot preventive maintenance)的部件,具体请仔细参考前面的表格“支持Hot preventive maintenance”。首先进入维护模式,具体操作请仔细参考“维护模式(说明、进入和退出)”如上图对CM(controller Module)执行预维护操作。如上图对PSU电源执行预维护操作。执行此操作后,后续操作与Hot maintenance方式完全相同。注意:Preventive maintenance of HDD-UNIT may cause redundant copying to HS. In this case, until the redundant copy completes, the DISK cannot be replaced。如前所述:Rebuild/Copyback 代表相应的RAID Group在进行RAID重建(热备盘在起作用或者已经进行了更换)或者数据拷回的操作,由于此时RAID状态正在变化过程中,此时不应该对此RAID里面的故障磁盘马上进行更换的操作,应该等相关变化结束并且RAID状态稳定下来后再进行磁盘更换。请仔细参考“ 磁盘故障的分析与解决”和“通过WEB进行系统状态检查”。外观指示灯等请仔细参考“外观指示灯的察看确认”、“指示灯及开关”和“指示灯及接口”。10.重新启动或者关闭DX500S3存储在确实必要的情况下,可以通过菜单重新启动或者关闭DX500S3存储。点击“Restart”或者“Shutdown”,弹出确认菜单,点击 确定 即可完成操作。请参考“日常使用的注意事项”。五. DX500S3各个部件的更换步骤重要说明:对于实物图,可以用鼠标拖动将图放大或者放大比例进行察看,以便看清楚局部信息。图中的红框和红色的字均是为方便察看所加的标注。所有硬件更换操作的必要前提是已经仔细阅读过前面的章节。请确保事先准备好各项防水、防静电措施等,不要将相关部件直接放在金属桌面上,在更换过程中必须确保不使用蛮力去进行操作防止对设备的物理损害。所有更换都是基于新的备件是好的未使用过的备件(至少外包装无破损,外观无损坏和变形)。在所有部件更换过程中,应该避免对着新部件或旧部件讲话或者喷口水。更换各个部件的物理动作和所必须的系统操作:下面各个部件的更换步骤主要基于物理动作的讲解,在DX500S3上面所需进行的相关操作,请仔细参考 “故障分析及故障排除的几个案例讲解”,“维护模式(说明、进入和退出)”, “操作前对设备位置的确认”,“维护的结束”,“维护完成后的一些基本操作”, “更换部件后异常情况的处理(慎用)”。1.更换HDD UNIT 硬盘更换前提:用来更换的新硬盘与故障硬盘必须是同样的磁盘类型(SAS/NL-SAS/SSD),相同的容量和相同的转速。每块硬盘的把手右边有具体的硬盘型号和规格说明等。应该保持硬盘型号的一致或者是经过厂家确认的替代型号。具体请参考“DX500S3的外观图及指示灯” 和“外观指示灯的察看确认”。如果相应RAID的状态里面有Rebuild/Copyback在进行中,此时不应该对此RAID里面的故障磁盘马上进行更换的操作,应该等相关变化结束并且RAID状态稳定下来后再进行磁盘更换。具体请参考“通过WEB进行系统状态检查” 和“对于硬盘的专门要求”。具体现场的操作范例请仔细参考“ 磁盘故障的分析与解决”Hot Maintenance work should be finished within 5 minutes. (For preventing temperature rise.)在更换HDD时,不要让HDD的移除状态保持5分钟或者更长时间以上,这样做主要是为了防止设备的温度升高。由于HDD磁盘上面有RAID等配置信息,为防止误操作和确保安全等,请勿对磁盘执行cold maintenance(关机更换)。 旧硬盘的移除通过硬盘的LED (amber)指示灯已经亮橙色确认故障硬盘的所在槽位。同时请参考“通过WEB进行系统状态检查”、“外观指示灯的察看确认”和“DX500S3的外观图及指示灯”。抵住上图中故障硬盘(亮橙色灯)的Latch然后打开Lock Lever(硬盘锁定杆),抓住Lock Lever向外稍微抽动一下硬盘确保硬盘与备板脱离接触后,应该至少等待30秒让硬盘的马达完全停止转动后再如右上图Figure (2)操作(一只手抓住Lock Lever,一只手托住硬盘底部边缘) 将硬盘完全抽出硬盘槽位并放置在防

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论