HDS存储VSP用户维护手册_v1_第1页
HDS存储VSP用户维护手册_v1_第2页
HDS存储VSP用户维护手册_v1_第3页
HDS存储VSP用户维护手册_v1_第4页
HDS存储VSP用户维护手册_v1_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

HDSHDS 存储存储 VSPVSP 用户维护手册用户维护手册 (2013(2013 年年 5 5 月月) ) 目录目录 一、设备维护一、设备维护 .3 3 1.1 VSP 配置信息.3 1.2 VSP 系统架构.3 1.3 维护常用命令.6 1.4 VSP 应急方案-上下电操作.29 1.5 设备巡检 .31 二、微码升级二、微码升级 .3535 2.1 微码升级的意义 .35 2.2 微码升级的策略 .36 2.3 微码升级的步骤 .36 三、故障处理三、故障处理 .4040 3.1 故障处理预案 .41 四、案例四、案例 .4242 4.1 硬盘更换步骤.42 4.2 CHA 更换步骤.45 4.3 DKA 更换步骤.50 4.4 CM 更换步骤.53 一、设备维护一、设备维护 1.11.1 VSPVSP 配置信息配置信息 用户用户 SiteSite IDID 序列序列 号号 存储配置信息存储配置信息IPIP 地址地址 HDSHDS 服务服务 热线热线 设备安装设备安装 地址地址 磁盘:块 GB,10krpm SAS 磁盘(包含块热 备份磁盘); CacheMemory:384GB; 前端板:3 对 8 口 8Gbps 主机接口板; 后端板:2 对 DKA 后端 板 公共 私网 400-400- 678-678- 67836783 1.21.2 VSPVSP 系统架构系统架构 1.2.11.2.1 VSPVSP 系统架构图系统架构图 其系统架构采用了交换式架构,如下所示。 图图 2-12-1:VSPVSP 硬件技术架构硬件技术架构 1.2.21.2.2 VSPVSP 主要部件主要部件 图图 2-22-2 VSPVSP 硬件主要部件图硬件主要部件图 VSP 的主要部件包括: 前端卡(CHA):负责连接外部主机或存储交换设备, 如小型机; 后端卡(DKA):负责连接内部磁盘存储设备,如硬盘; 数据缓存卡(CPC):CHA 访问后端磁盘时的数据缓存 区域; 内存条(CM):CM 的内存条; PCI-Express 交换卡(ESW): DKC 数据交换控制卡; 处理器板卡(MPB):负责前端及后端数据的处理; 磁盘(HDD):存储设备的磁盘; 备份盘(Spare Disk):用作备份盘的磁盘; 电池(Battery):系统掉电时保存数据的电池; 电源(PS):系统供电及交换用的电源; 风扇(FAN):系统冷却用的风扇; 控制台(SVP):系统配置和管理监控的控制台(一台 笔记本电脑) ; 线缆(Cable):连接存储内部和外部各部件间的电 缆; 光纤接头(SFP):光纤转换接头; 1.2.31.2.3 VSPVSP 存储的磁盘分布图存储的磁盘分布图 VSP 的磁盘分布按照如下进行标识: HDDxyz_dd 其中:xy=Cabinet(盘柜) ; z=HDU number(磁盘笼编号) dd=HDD number(磁盘编号) 图图 2-32-3:VSPVSP 磁盘位置图磁盘位置图 1.31.3 维护常用命令维护常用命令 当盘机出现故障,如磁盘、控制卡、电源、内存、电 池到出现异常时,会产生 SIM 信息,同时盘机会根据故障 的严重程度,将 Message 或 Alarm 灯亮起。Message 灯亮时 不影响系统使用,但应及时处理;Alarm 灯亮时将影响系统 使用,应尽快处理。 1.3.11.3.1 SVPSVP 登录登录 现场维护人员可以通过远程桌面登录 VSP 的存储控制台 SVP 进行日常维护工作: VSPVSP: 依次点击“History”和“Register”按钮,进入 SVP。 1.3.21.3.2 SVPSVP 登陆后界面登陆后界面 以下为维护工程师登录 SVP 后看到的界面; 1.3.31.3.3 SIMSIM 信息检查信息检查 如果存储设备有故障,会在控制台上显示 SIM Message:Pending SIM exists。同时在存储设备的前面板 左上角的 SIM 黄色报警灯会点亮。 点击 Information 按钮可以查看 SIM 日志: 点击 Log List SIM: Status 列为“Initial”:有新的 SIM 信息,需要关 注。 Stauts 列为“Completed”:已经手动(或自动)被 结束的 SIM 信息,一般是工程师对存储维护结束,确 认系统恢复正常后进行的 Complete 操作。 选择某一行 SIM,点击“Content”可以查看详细信息: 如可能最好通过屏幕拷贝的方式,保存显示的内容,将该 内容 email 给 HDS 工程师 1.3.41.3.4 存储部件状态检查存储部件状态检查 SVP 界面上除了查看 SIM,还可以进入 Maintenance 菜单 查看当前存储运行状态: 如果有硬件或其它故障,相对应的部件位置会闪烁报警。 1.3.51.3.5 清除清除 SIMSIM 中的信息中的信息 先从 View Mode 进入 Modify mode,点击“View Mode”: SVP 变为“Modify Mode”: 依次进入:Information - Log - List SIM,选定需 要 Complete 的 SIM 信息,点击 Complete: 确认即可。 退出 SVP 前,应将 Modify Mode 改为 View Mode! 1.3.61.3.6 收集收集 DUMPDUMP 信息信息 选择 Auto Dump 按钮: 在如下界面选择 dump 类型以及传输方式,大多数时候 Type 选择 Normal 即可,当需要进行有关性能方面的分析的话则 选 Detail. Media 一般选择 HDD(SVP 本地磁盘)。其他选项 不需要更改。 选择 OK 后会显示 dump 收集进度: Dump 数据收集完成后会开始压缩: 压缩完成后会提示收集完成: 收集完成后将 c:dkc200tmphdcp.tgz 文件拷出并上传到 TUF 即可。 1.3.71.3.7 使用使用 SVPSVP 划分划分 LUNLUN modify 模式,进入 lun configuration 界面 1、 根据需要设置CHIP类型 2、 设置端口参数、设置主机模式 打开端口安全模式: 选择打开 点击OK后,出现两个系统安全提示,选择“Yes” 选择正确的连接方式: 出现系统安全提示,选择“Yes” 后完成。 主机组的创建、绑定主机WWN、Mapping Ldev: 点击右键选择“New” 。 填写主机组名称,并选择 WWN List. 选择对应端口上正确的HBA卡片WWN号点OK。 完成后点Next. 选择主机组要在哪个端口上创建后 点击“Next” 。 选择操作系统平台类型及附属选项,如果是AIX主机有HA环 境请选择HACMP。 出现提示说这个主机端口会有I/O中断,是否需要继续这个 操作,这时点击“Yes”继续下一步(因为I/O为瞬间中断, 不会对主机生产造成影响,如果业务非常繁忙时做这个操 作才可能对主机生产造成影响) 。 下图为主机组中绑定主机HBA卡WWN完成示意图。 在Display选项中选择LUN,开始映射主机磁盘。 选择Add后出现磁盘选择窗口,选择对应数量的LUN数量, 对应数量的LDEV数量后点击“Set”后点击OK,完成添加磁 盘: 出现提示说这个主机端口会有I/O中断,是否需要继续这个 操作,这时点击“Yes”继续下一步(因为I/O为瞬间中断, 不会对主机生产造成影响,如果业务非常繁忙时做这个操 作才可能对主机生产造成影响) 。 下图为主机组中磁盘添加完成后示意图: 注意下图与上图的差别,在Ldev后多了一个“+”号,当出 现“+”时意思是指这块磁盘已经被Mapping过两次。 添加新主机并创建新的主机组,做WWN绑定,做磁盘映 射结束后主机将可以认盘,操作方式完全一样;需要注意 的是在磁盘选择窗口中新映射或添加磁盘时,一定要选择 没有“+”号的磁盘,没有“+”号的磁盘为未用的磁盘。 完成操作后退出并保存新配置文件。 全部结束后请退到“View Mode” ,以免有误操作发生。 关闭远程桌面连接,选择“确定” 。 1.41.4 VSPVSP 应急方案应急方案- -上下电操作上下电操作 注意:开关机对主机 I/O 会有影响请注意! 开机步骤开机步骤 a.开启位于控制柜和磁盘柜后方两侧的四个PDU电源模块 上的主电路开关,确认机柜前面主面板(DKCPANEL) 上的BASE ON黄色指示灯亮起,同时位于控制柜前下部 的系统控制电脑(SVP)开始启动。 b.将 “PS ON/PS OFF” 开关推至 “ON”的位置,同时 将“PS SW ENABLE ” 开关推至 ENABLE的位置。 c.确认控制器面板上的绿色 PS-ON 指示灯亮起,同时可 听到机器内部风扇转动时的声音。 d.系统启动完成可能需要 1525 分钟,根据配置不同, 开机时间会有变化。在启动完成后,控制器面板上的 绿色 READY 指示灯将会亮起。如 READY 指示灯在很长 时间后仍未亮起,即刻联系 HDS 技术支持人员。 关机步骤关机步骤 a.确认与存储连接的主机没有访问 I/O。 b.将 “PS ON/PS OFF” 开关推至 “OFF”的位置,同 时将“PS SW ENABLE ” 开关推至 ENABLE的位置。 c.系统正常关机可能需要 1520 分钟,根据配置不同, 关机时间会有变化。 d.确认在系统关机完成后,控制器面板上除黄色 BASE ON 指示灯仍然点亮外,其余指示灯都会熄灭,同时机器 内部风扇停止转动。如有任何不正常状态,即刻联系 HDS 技术支持人员。 e.关闭位于控制柜和磁盘柜后方两侧的四个PDU电源模块 上的主电路开关,确认机柜前面 主面板上的BASE ON 黄色指示灯熄灭。 f.如果需要长时间关机,超过24小时时,请将 “Battery 电缆” 拔出,如果需要请联系HDS工程师。 1.51.5 设备巡检设备巡检 1.5.11.5.1 健康巡检内容健康巡检内容 HDS 存储系统的健康检查主要包括如下五方面: 设备场地及环境检查 定义定义:检查设备运行的外部环境状态及数值情况是 否正常?是否有异常或故障发现? 范围:范围:包括:防静电地板及承装情况、温度计/湿 度计的数值、设备通风情况、电源供电情况等具体信息 或数值; 设备硬件检查 定义定义:检查设备硬件状态及信息是否正常?是否有 异常或故障发现 范围:范围:电源、电池、连接的光纤、主要板卡 DKA/CHA/Cache/Memory/FSW 状态、以及 HDU 中的硬盘状 态等,以及通过 SVP 控制台收集并监控到的系统各部分 状态信息 设备软件检查 定义定义:检查设备中运行的主要软件状态及信息,检 查系统日志和宕机文件是否正常?是否有异常或故障发 现? 范围范围:包括:HDLM 多路径软件、ShadowImage 镜 像软件、TC/UR 同步/异步数据复制软件等配置信息及状 态; 系统性能检查 定义:检查系统性能参数是否正常?是否需要采取 某些措施? 范围范围:包括:Cache 写等待、通道板利用率、通 道效率等; 设备安全性检查 定义定义:检查系统信息或日志等是否有报警或错误信 息?是否需要采取其他措施? 范围范围:包括:SIM 信息、SSB 日志、DUMP 信息、 Microcode 版本、备份盘、冗余链路灯检查; 光纤交换机检查 定义定义:检查存储系统的硬件指示灯状态是否正常? 是否有异常或故障发现? 范围范围:FC 交换机电源、风扇、状态灯和 Zone 配置 等信息; 1.5.21.5.2 VSPVSP 系统健康检查报告系统健康检查报告 VSP 系列设备健康检查列表 此表针对未安装 Hi-Track 用户进行巡检检查使用,如有任 何问题请联络 HDS 中国代表处:北京(10-85182238) 、上 海 、广州 、成都(028- 86788686) 。 客户名称:国税客户名称:国税SiteSite IDID:R348240R348240 机房环境及设备外观检查检测结果检测结果 1 机房温度、湿度是否符合标准 温度: 湿度: 是 否 2 用手触摸系统机柜外表是否过 热 是 否 (1) 磁盘阵列外表是否清洁是 否 3 (2) 观察设备风扇及空气过滤 网是否积尘 是 否 4 检查电源连线、电源接头、光 纤连线等线缆是否有高温老化 现象 是 否 硬件设备运行状态检查 5 检查各部件 LED 工作状态指示 灯是否正常 是 否 6 检查电源连接是否稳固是 否 7 设备电源模块输出电压检测 (此内容仅当 HDS 认为必要时 检测) 8 检查内部接口及接线情况,检 查 FC 光缆,是否有过度折弯 或破损 是 否 9 检查电池使用时间,确认电池 使用寿命是否到期 电池到期日: 年 月 日 10 CHA 工作状态检查 对 NSC55,检查 MIX 板。同时, 跳过第 11 项。 正常 11 DKA 工作状态检查正常 12 Cache 工作状态检查正常 13 如有必要,检查其它部件工作 状态 正常 14 LDEV 工作状态检查正常 15 通过 Storage Navigator 检查 系统整体运行状态,确认系统 工作正常 正常 16 检查系统运行微码版本微码版本: 17 确认用户自上次巡检或安装后 是否更改过 RAID,LUN 等相关 配置,如果有更改,保存新的 配置文件。 已保存 软件运行状态检查 18 HDLM 工作状态(通过 HDLM GUI 屏幕拷贝或命令行执行) # /usr/DynamicLinkManager/bi n/dlnkmgr view sys sfunc OS 类型: OS Level: HDLM 版本: HACMP 中 HDLM disk method 或 event 脚本配置是否正确 (仅对 AIX 操作系统): 是 否 19 Shadow Image 工作状态(通过 storage navigator 屏幕拷贝 或命令行执行) #pairdisplay g - fcx N/A 20 True Copy 工作状态(通过 storage navigator 屏幕拷贝 或命令行执行) #pairdisplay g - fcx N/A 21 HI-Track 工作状态(仅对安装 Hi-Track 用户) 正常 22 UVM 工作状态(通过 storage navigator 屏幕拷贝或命令行 执行) N/A 23 UR 工作状态(通过 storage navigator 屏幕拷贝或命令行 执行) N/A 24 其它软件工作状态其它软件工作状态正常 存储设备性能检查(此内容仅当 HDS 认为必要时检测,输出 Graph Track 或 Performance Monitor 检测结果) 25 CHACHA 26 CacheCache UtilityUtility 27 CacheCache WriteWrite PendingPending 28 DKADKA FC 交换机运行状态检查 29 检查检查 FCFC 交换机电源、风扇、交换机电源、风扇、 SFPSFP 等部件运行状态等部件运行状态 是 否 30 核对核对 ZONEZONE 等配置自上次巡检等配置自上次巡检 或安装后是有更改,如有更改或安装后是有更改,如有更改 需此检查列表后附带更改后配需此检查列表后附带更改后配 置说明置说明 设备风险性检查 31 存储存储 SIMSIM 中是否存在临时性错中是否存在临时性错 误以及前期处理结果误以及前期处理结果 (如前期对部件临时错误仅执 行了 Completed 操作,建议更 换报错部件) 是 否 前期处理结果: 处理建议: 32 当前存储系统运行微码版本是当前存储系统运行微码版本是 否需要升级否需要升级 是 否 建议升级的微码版本: 33 当前存储配置中热备份盘一种当前存储配置中热备份盘一种 类型是否仅配置一个类型是否仅配置一个 (如一种硬盘仅配置一块热备 份盘,建议增加热备份盘配置 数量) 是 否 处理建议: 34 主机主机 IOIO 路径是否冗余配置路径是否冗余配置 #usr/DynamicLinkManager/bi n/dlnkmgr view path c -srt lu (如存在非冗余配置情况,建 议调整连接配置) 是 否 处理建议: 35 交换机当前微码是否存在到期 自动 Reboot 的 Bug(针对 Brocade 产品且微码版本为 0422b 的 FC 交换机) 是 否 建议升级的微码版本: 36 AIXAIX 操作系统版本与补丁的检操作系统版本与补丁的检 查查 #oslevel r #oslevel l #ioslevel OS level: Technology level (TL): SP: Fix Pack(FP): 设备配置信息收集 37 HDSHDS 存储设备配置信息存储设备配置信息文件名: 检测结论:检测结论: 工程师客户签名客户签名 姓名: 日期:此文件仅作为客户服务代表 工作记录 二、微码升级二、微码升级 2.12.1 微码升级的意义微码升级的意义 HDS 存储设备微码每隔一段时间,就会发布新的版本, 目的是修正系统 bug,提高在设备可用性,减小非正常故障 发生;HDS 存储设备经过较长时间运行后,有可能需要进行 相关备件的版本更新,对于磁盘设备,备件库对部分老版 本磁盘将不再提供,取而代之的是较新版本的磁盘。 HDS建议存储设备运行的设备微码不要低于MGA(即:最 低支持版本) ,微码升级一般考虑使用RGA(即:推荐版本) , 新安装的设备至少达到PBL。 (即:工厂安装版本) 。 HDSHDS 对于微码版本定义如下:对于微码版本定义如下: 微码版微码版 本定义本定义 缩写含义缩写含义说说 明明 GAGenerallyGenerally AvailableAvailable & & higherhigher thanthan RGARGA 已经正式使用的版本,相对 RGA 推出时间 较短,客户使用相对 RGA 较少。如果到该 GA 版本 RGARecommendedRecommended GAGA 推荐版本, 微码升级一般考虑使用 RGA。 MGAMGA MandatoryMandatory GAGA 最低支持版本。 PBLProductionProduction BuildBuild LevelLevel 工厂安装版本, 新安装的设备至少达到 PBL。 2.22.2 微码升级的策略微码升级的策略 我们建议每年升级两次微码版本,当遇到与国税环境相 关且问题发生频率很高的重大Bug时,HDS会及时提出升级 意见并建议国税提前升级相关设备的微码版本。 2.32.3 微码升级的步骤微码升级的步骤 2.3.12.3.1 微码升级审批流程微码升级审批流程 为确保安全、可靠的微码升级服务,HDS 工程师将提前 收集 VSP 日志信息,提交 CHIP 至技术中心,深度检查设备 运行状态 2.3.22.3.2 微码升级操作步骤微码升级操作步骤 HDS工程师进行HDS存储健康检查,确认设备硬件状态 正常; 一、一、 VSPVSP微码升级步骤微码升级步骤 1、HDS工程师开始进行微码升级,升级过程自动将新微 码拷贝到HDS存储设备SVP; 2、微码升级过程将按照部件自动进行逐一升级,如下 表: 首先,升级SVP,重启后,升级除DKU以外的设备,最后 升级DKU。在升级过程中会对前端端口及后端端口的每一个 CPU写微码,我们在升级过程中选择Non-stop,即不停机的 方式。 3、升级结束后,确认完成微码升级结束,备份配置 文件、重新启动SVP、检查新的微码版本和硬件状态; 4、 HDS工程师与系统配合人员检查升级设备涉及的链 路状态,确定系统状态正常。 执行过程 (1) (2)Change the mode to Modify Mode (CL).Select (CL) Install. (3)In the Install window, select (CL) Micro Program Install. (4)Select (CL) Micro Program. Select (CL) OK. Selecting (CL) Cancel returns you to step(3). (5)In the Microprogram Exchange dialog box, How : select (CL) Online. From: select (CL) CD-ROM. (6)The Microprogram Exchange dialog box appears. Select (CL) one or more items from the list of the type of micro-programs, and select (CL) OK. (7) Select (CL) one of the exchange modes of DKCMAIN micro- program as follows, and select (CL) OK. (7-1) Select OK (CL) after checking the right preconditions. Go to step (8). (8)When DKCMAIN, or RAMBOOT were selected, you can select the reboot pattern from the list. (9)On the Software Maintenance dialog box, the micro-program types, current versions, new versions, and message are displayed. (10)In response to the message “An exchange of a microprogram finished. Please check subsystem status and microprogram version with MAINTENANCE.”, select (CL) OK. 三、故障处理三、故障处理 在存储系统的日常维护工作中,厂家工程师和客户管 理员面对最多就是故障问题的处理和排查,不同的问题现 象或故障类型需要不同的处理方案或实施策略,以确保问 题能够得到快速解决同时对客户生产运营系统的影响降到 最低。 3.13.1 故障处理预案故障处理预案 对于 VSP 设备在现场可能发生的故障类型和情况,下 表给出了一些建议的处理措施和方案,以便现场工程师可 以根据故障现象或问题进行相应处理和维护工作,具体细 节和操作指南可以参考相关文档。 作为国税现场人员,发现下述故障时,需要在第一时 间通知 HDS 服务团队相关人员或通过 HDS 400 服务号码 (400-6786783)进行服务报修,以便问题得到快速处理和 解决。 表表 5-15-1:现场故障维修方案:现场故障维修方案 序序 号号 故障故障 描述描述 紧紧 急急 性性 影影 响响 度度 维修维修 方式方式 应急方案应急方案说明说明 1 CHA 故 障 高高在线 更换 参考维护手 册或附件中 的 CHA 更换 方法 替换前必须确认 CHA 物理状态及 SIM 中状 态,以及相连主机冗 余链路 FC card/ Path 状态 2 DKA 故 障 高高在线 替换 参考维护手 册或附件中 的 CHA 更换 替换前必须确认 DKA 物理状态及 SIM 中状 态 方法 3 FSW 故 障 高高在线 替换 参考维护手 册或附件中 的 CHA 更换 方法 替换前必须确认 FSW 故障状态及 SIM 中状 态以及相关 Path 状态、 HDD 状态 4 CSW 故 障 高高在线 替换 参考维护手 册或附件中 的 CHA 更换 方法 替换前必须确认 CSM 故障状态及 SIM 中状 态 5DKU PS 故 障 高高在线 替换 参考维护手 册或附件中 的 CHA 更换 方法 替换前必须确认 PS 故 障状态及冗余 PS 的状 态 6CM/SM 故障 高高在线 替换 参考维护手 册或附件中 的 CHA 更换 方法 替换前必须确认 CM 故 障状态及 SIM 中状态 7CM/SM 临时 报错 低低在线 替换 参考维护手 册或附件中 的 CHA 更换 方法 1)确认是否是可修正 错误,如果出现出数 超过 3 次,建议更换 掉 Cache 条即可; 8 硬盘中低在线参考维护手 现场确认 RAID 情况和 故障更换册或附件中 的 HDD 更换 步骤 Sparedisk 状况 9 替换 备份 盘 低低在线 更换 参考维护手 册或附件中 的 HDD 更换 步骤 确认 spare disk 的状 态后进行替换 10 上下 电操 作 高高在线 操作 参考维护手 册或附件中 的 HDD 更换 步骤 确认非上下电情形和 具体要求 四、案例四、案例 4.14.1 硬盘更换硬盘更换步骤步骤 实施磁盘更换时,需要严格实施防静电措施,消除备件实施磁盘更换时,需要严格实施防静电措施,消除备件 的静电,否则可能导致其它部件异常。的静电,否则可能导致其它部件异常。 使用合格的防静电腕套,将防静电腕套连接到设备 的金属接地部件; 接触部件之前,双手接触设备的接地金属部分 5 秒 以上,消除人体的静电; 任何部件不能虚插在设备上; 安装磁盘之前,将磁盘金属外壳接触设备的金属接 地部件,充分消除磁盘金属外壳的静电; 安装过程,保持戴了防静电腕套的手掌接触磁盘金 属外壳; 具体措施咨询 HDS 支持工程师。 实施磁盘更换时,需要确认被更换磁盘的状态,包括 Maintenance 画面显示状态、SIM 日志等。 如果需要更换的磁盘是数据磁盘,并且数据已经拷 贝到热备磁盘 Hot Spare,实施正常磁盘更换步骤。如 图所示,DeviceDevice Status=Failed,Status=Failed, Group=SpareGroup=Spare。 如果需要更换的磁盘是数据磁盘,并且磁盘阵列正 在往 Hot Spare 拷贝数据,暂停更换操作,等到数据拷 贝完成后再实施正常磁盘更换步骤。图示是数据磁盘正 在进行 Sparing 的状态,DeviceDevice StatusStatus 显示显示 CopyCopy 的进的进 度,度,GroupGroup 状态显示原来的状态显示原来的 RGRG。 如果需要更换的磁盘是数据磁盘,但此磁盘为 正常状态,需要实施预防性维护步骤,将数据磁盘的数 据拷贝到 Hot Spare,然后实施更换。此时 DeviceDevice Status=NormalStatus=Normal,GroupGroup 状态显示原来的状态显示原来的 RGRG。 如果故障磁盘本身是 Hot Spare,可以按照正 常磁盘更换步骤实施。 如果故障磁盘只是定义了 RG,没有定义 LDEV, 即使 DeviceDevice Status=FailedStatus=Failed,磁盘阵列也不会启动往 Hot Spare 的数据拷贝,可以按照正常磁盘更换步骤实 施。 正常磁盘更换步骤正常磁盘更换步骤 更改 SVP 为 Modify 模式; 进入 Maintenance 画面,选择需要更换的磁盘,确 认磁盘状态满足正常更换条件(见本章节前面的说明) 。 选择Replace-Replace,并根据 SVP 的提示实 施更换。 当 SVP 出现如下提示时,回答Yes。 数据 Copy Back 开始后,SVP 提示磁盘更换完成。此时 可以通过 Maintenance 画面的 Copy Status 查看 Copy 进 度。此画面不会自动更新,可以通过Renew刷新进度状 态。 磁盘预防性维护磁盘预防性维护 如果数据磁盘的状态为正常状态(Device Status=Normal), 因为一些特殊原因需要更换磁盘,如磁盘一个端口错误等, 使用预防性维护步骤。实施之前需要与 HDS 支持工程师确 认维护的必要性。 为了保障数据安全,需要将数据磁盘的数据拷贝到 Hot Spare,然后实施更换。 实施预防性维护之前,需要确认磁盘阵列有合适的未使实施预防性维护之前,需要确认磁盘阵列有合适的未使 用的用的 HotHot SpareSpare。 更改 SVP 为 Modify 模式; 进入 Maintenance 画面,选择需要更换的磁盘,确认磁 盘状态是 Normal 状态。 选择Other-Spare Disk,当 SVP 出现如下提示时, 回答Yes。 数据拷贝完成后,数据磁盘状态变成 Failed/Failed/ SpareSpare。 按照正常磁盘更换步骤实施磁盘更换。 4.24.2 CHACHA 更换步骤更换步骤 注 以下步骤按实验室环境模拟实施,包括更换前(PRE)、 更换、更换后(POST) ; 1、存储两 CHA(1EU、2QU)端口号分别为 1EU-1A 3A 5A 7A 1B 3B 5B 7B、2QU-2A 4A 6A 8A 2B 4B 6B 8B 2、多台主机(OSaix)两块 HBA 卡、每块两个光纤端口。 3、2 台 switch。 San 架构图: 1 H0H1 USPV 0 1EU2QU SW1(left) H2H3 2 H0H1H2H3 X H0H1H2H3 4 2630 0 SW2(right) 4 2630 1A7A5A3A 1B7B5B3B 2A8A6A4A 2B8B6B4B 。 4、8B 端口发生故障。需要更换 CHA2QU。 步骤: PREPRE PROCEDUREPROCEDURE 1、使用 rdpexe 程序搜索阵列,并连接,同时安装 USB 设 备。 2、更改操作模式为“修改” ,进入维护窗口。 3、设置路径为 offline 或切换通道。 A、查看所有主机的 ChaID 与存储前端端口的对应关系。 #/usr/DynamiclinkManager/bin/dlnkmgr view cha B、set path offline(所有主机断掉与 2A、4A、6A、8A、2B、4B、6B、8B 相关的路径) #/usr/DynamicLinkManager/bin/dlnkmgr offline - chaid 00003 #/usr/DynamicLinkManager/bin/dlnkmgr offline - chaid 00002 4、在“维护”窗口内,选择【DKCBOX】 。 5、选择【logic box front 或者 back】 。 6、选择 CHAXX。 7、制定相应的 CHA 板卡,进行 Replace。 8、出现以下窗口,选择“yes” 。 9、收集错误信息 10、输入信息,选择“OK” 。 确认信息存储。 11、确认通道 offline 针对串口或大机的光纤前端板进行上述确认。 针对光纤或 iSCSI 的前端板进行上述确认。 对于大机的光纤前端板当设置了 CUIR 功能,不会显示确认 通道 offline 的信息,会显示以下信息。 12、确认以下信息 13、封闭 CHA 信息。 14、检查 shut down LED 是否闪烁。 连续两次选择“No” ,进行强制“亮起 shut down LED” 。 15、开始更换,完成后进行确认。 HardwareHardware PROCEDUREPROCEDURE 1、移去 CHA 板卡。 检查 shut down LED 亮起,不亮将维护跳线插入 shutdown 连接器(只在线更换) 。 从板卡上移去光纤线。 松下螺丝,移去板卡。 移去维护跳线。 2、安装备件板 安装到原来位置,紧好螺丝。 3、清理光纤线连接器。 4、连接光纤线。 POSTPOST PROCEDUREPROCEDURE 1、等待 Power Event 2、更换大机的光纤板卡时进行 CUIR 恢复 3、检查 CHA 恢复 4、主机端将路径 online。 #/usr/DynamicLinkManager/bin/dlnkmgr online -chaid 00002 #/usr/DynamicLinkManager/bin/dlnkmgr online -chaid 00003 5、SIM 日志进行 complete。 6、在“维

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论