已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Inspur 浪潮(北京)客户服务部北京分成都acle 中心LCHA配置维护经验谈根据自己实施过程中遇到的问题整理,可能存在遗漏和错误,请大家指正、完善!LCHA配置前检查:1. 两台服务器系统时间,注意软件按有无试用期问题,安装LCHA后发现时间不对,再更改时间以便有试用期是不行的,LCHA会记录安装时的系统时间,卸载重装也不行。最好在安装LCHA和应用前对系统做Ghost备份。2. 主机名设置,Linux系统的话包括/etc/hosts文件中解析设置;Public IP、Private IP设置及网卡对照关系(eth0、eth1,网卡物理接口位置),两台机器最好保持一致。存在两台机器网线接口和IP错乱导致不通的情况。3. 用户密码设置,两台机器设置一样,注意Windows2003 Server必须设置密码,否则在LCHA配置过程中不能得到对方IP,不能网络共享访问。Windows LCHA:一配置过程常见问题、注意点:1. 存储连接正常后查看磁盘顺序,存储磁盘可能是disk0,这和硬盘控制器自检顺序有关,如果可以通过更改BIOS设置、板卡插槽位置改变顺序,使本地为Disk0的话,最好更改,以免容易出现需要个更改启动顺序等问题。2. 建议本地硬盘至少分3个分区,即:C盘-系统盘、D盘-程序盘、E盘-备份盘(和系统运行程序无关,可以变更盘符),后面维护部分再介绍详细的原因和用法。3. 配置IP时尽量把两个IP的掩码配一致,和用户使用掩码一致,因为在配置Active IP时是按照第一个网卡的掩码来设置的,如果第一个网卡配置的是心跳线,用户使用的掩码比较特殊的话可能导致终端访问不到服务器。4. 安装LCHA前一定注意系统时间和软件的试用期,避免重新安装系统。5. 配置心跳和IP资源过程中注意两个网卡的选择,如果不能找到对方的IP,需要确认系统密码是否不为空,两个IP都可以互相ping通,两台机器可以互相访问共享资源,然后重启服务器(不同时重启),应该可以看到了。如果网上邻居也不能找到对方的话可能是用户交换机设置的规则屏蔽了135、136端口。6. 建议配置Volume资源时不要选择Hard clock,Hard clock容易导致一些奇怪的问题。7. 建议配置Volume资源时把盘符设置为靠后面的字母,如S、O等,和本地的分区盘符中间有几个间隔,以免在服务器上插有U盘、移动硬盘时切换服务,导致盘符被占用,服务切换失败。8. 配置完成后停止HA服务,在Tools菜单中备份配置信息(txt和reg两种方式),方便以后故障时参考或用户自己恢复。系统盘最好做Ghost备份,Windows还时很容易因为病毒等原因瘫痪的,出现问题时恢复系统可能就解决了,不用再上门调试。9. 平时用户需要手工stop、start应用服务调试时,经常直接在服务管理里面stop,导致双机自动切换,无法实现调试,这是因为服务stop后HA侦测服务失败自动切换。正确方法是在HA管理界面把应用服务Bring Out,HA不再对服务进行监控,此时再手工stop应用就不会导致自动切换,调试完成后再Bring In就可以恢复正常的HA状态。二维护:修改IP:需要在HA管理界面中移除IP资源相关项,配置新IP后重新配置删除的资源。当一台服务器故障时,在此服务器恢复支持前不用重启支持的服务器,以免出现资源被Bring Out而不能Bring In的情况。HA中Bring In资源时需要两台服务器均为支持状态。如果出现此种情况,可以手动分配共享磁盘盘符、更改实际IP为Active IP、手动启动应用服务。存储故障,没有修复的情况下,先恢复应用:以SQL Server2000数据库为例:SQL常用的备份方法有两种,A.直接拷贝物理库文件;B.通过企业管理器备份/导出数据库(可以设置自动作业)。HA只是服务器的热备,存储设备仍是单点故障,以如何在存储故障的情况下快速恢复应用、减小故障对客户的影响为出发点,可以做如下工作:1. 本地硬盘分3个分区,建议安装SQL时程序安装在D盘,减少C盘的容量、碎片,提高性能;SQL设置自动备份作业,备份数据放到E盘或其它本地硬盘。假设共享盘符为S。2. 在HA配置完成、数据库已经建立、SQL系统库(master库)不需要再更改后,在主机上把SQL Server资源Bring Out(服务运行时不能拷贝),把共享磁盘中的库文件(包括目录结构)一起拷贝到本地E盘。3. 建议用户设置自动备份作业,备份文件放在本地硬盘,可以每天或每周。4. 当存储设备故障时,在LCHA中只Bring In IP资源,把本地分区E改为S,手工启动SQL服务,因为库文件的目录结构和文件都拷贝了,所以SQL服务可以启动。5. 这时库文件的数据日期是拷贝文件日期,需要再把自动备份的数据再恢复,这样数据就是最近备份日期。不需要等存储设备恢复就可以恢复应用,降低对用户的影响。Sybase数据库也可以使用这种方式,据说Oracle识别的是物理磁盘(如Disk0、Disk1),直接更改盘符可能不能启动服务,没有验证过,哪位有机会可以验证一下。Linux LCHA:一Linux LCHA配置过程中容易存在的问题、注意点:1. 存储硬盘设备名称在本地硬盘前,导致系统有时不能启动,如存储硬盘为sda,本地为sdb。是因为系统先加载了连接存储的板卡驱动(SCSI卡、HBA卡),需要更改/etc/modules.conf(2.4内核)或/etc/modprobe.conf(2.6内核)文件,把本地硬盘控制器的驱动顺序放在前面,并且更改hostadaptec*顺序,然后重新编译初始化文件。有些驱动在安装过程中会自动编译初始化文件,所以建议安装完系统后先更改modprobe.conf文件,再安装板卡最新驱动。2从笔记本等终端通过ssh等上传的脚本在执行时报命令错,可能存在两个原因,A.脚本文件格式不对,需要使用”dos2unix filename“命令转换文件格式为unix文件格式;B.没有权限,使用”chmod 755 filename”为脚本赋予执行权限。使用ll 命令察看文件的权限属性,保证脚本文件属性为 -rwxr-xr-x(有可执行权限)。 3LCHA自带有agent的应用,如Oracle、Sybase、Apache等,配置后存在服务启动两分钟左右就报进程错误自动切换的问题,可能原因A.agent脚本中应用的目录位置和实际安装的目录位置不一致;B.应用的配置文件中对主机名和服务IP的设置和HA中的设置不一致(sybase中存在此配置)。4运行./hacon打开LCHA管理界面登录后没有状态显示、service菜单不可选择的情况,是因为系统中已经存在该进程,可能在之前登录此界面时没有从Tools菜单中选择Exit退出,而是直接退出远程登录,导致该进程没有关闭。需要执行./lcha restart重启LCHA服务。5配置服务时默认Auto Switch back是Yes,最好改成NO。6如果共享磁盘数量超过10块的话,不能在配置界面中Volume中设置,只能在start和stop脚本中添加mount命令,具体脚本参考最后附录。7卸载LCHA时不知道对应的rpm包名称和版本号,rpm qa LC-HA或rpm -qa | grep -i lc-ha查询到具体的LCHA版本,如:LC-HA-6.1.0-1,再rpm e LC-HA*(版本号)卸载LCHA。8LCHA的日志在/opt/lcha/etc下,hostname.log记录的是比较详细的日志,如果出现切换故障,最好先要到两台机器的日志文件,对比查看问题的可能原因。二对于Linux LCHA已经调试完成后,其中一台服务器出现故障,需要重新安装系统和LCHA的情况下,原来的配置因为两台服务器不全是OK状态,无法从service菜单中移除配置,建议安装步骤:1 能备份故障服务器中LCHA信息的话,把/opt/lcha/bin目录下的config.ha和服务对应的脚本文件(如:apache_start.sh、apache_stop.sh、ha_ag_apache.sh)备份出来,主要需要的是config.ha文件中的License信息;2 断开服务器和存储连接,参考正常服务器的配置信息安装系统,安装设备驱动设置好IP和主机名;3 安装LCHA;4 停止正常服务器的LCHA和应用服务;5 备份共享磁盘中在重新安装过程中受到影响的数据,空间足够的话改变目录名称就可以,有些应用服务安装过程中不需要更改,如Apache,数据库需要更改,umount存储共享磁盘;6 把正常服务器中/opt/lcha/bin/config.ha和/opt/lcha/etc/config.ha改名;7 连接故障服务器和存储,启动两台服务器系统,启动LCHA服务,按照LCHA全新配置步骤重新配置。如果主板、网卡没有更换,原来的License应当可以继续使用,即使HostID可能不一样。附录:1. Linux LCHA超过10块共享盘脚本:start.sh脚本内容中:将蓝色部分的内容按照16个共享卷的顺序,分别修改名称,将序号从1逐一修改到16,红色部分按照本地主机的设备名称和mount点填写。DISKDEV1=/dev/sda1MOUNTPOINT1=/website1DISKDEV2=/dev/sda2MOUNTPOINT2=/website2.DISKDEV16=/dev/sda16MOUNTPOINT2=/website16.MOUNTDISK $DISKDEV1 $MOUNTPOINT1MOUNTDISK $DISKDEV2 $MOUNTPOINT2.MOUNTDISK $DISKDEV16 $MOUNTPOINT16apache_stop.sh脚本内容中:将蓝色部分的内容按照16个共享卷的顺序,分别修改名称,将序号从1逐一修改到16,红色部分按照本地主机的设备名称和mount点填写。DISKDEV1=/dev/sda1MOUNTPOINT1=/website1DISKDEV2=/dev/sda2MOUNTPOINT2=/website2.DISKDEV16=/dev/sda16MOUNTPOINT16=/website16.UMOUNTDISK $DISKDEV16 $MOUNTPOINT16.UMOUNTDISK $DISKDEV2 $MOUNTPOINT2UMOUNTDISK $DISKDEV1 $MOUNTPOINT1具体的脚本例子如下,里面有fsck的部分,如果磁盘很大的话可以屏蔽掉fsck部分,否则校验很长时间:蓝汛Apache_start.sh脚本:#!/bin/sh# This file: apache_start.sh# Version: 4.0.1HAHOME=cat /etc/init.d/HAHOMEexport HAHOMEout=$HAHOME/bin/APIOUT.xSERVICENAME=$2# When Another Server are Down, You MUST sleep awhile.# You can change this value to meet your requirement if need.if $1 = anotherdown then/bin/sleep 30fi# Define share disk device name and mountpoint from 1 to 16DISKDEV1=/dev/sdc1MOUNTPOINT1=/data/download1DISKDEV2=/dev/sdd1MOUNTPOINT2=/data/download2DISKDEV3=/dev/sde1MOUNTPOINT3=/data/download3DISKDEV4=/dev/sdf1MOUNTPOINT4=/data/download4DISKDEV5=/dev/sdg1MOUNTPOINT5=/data/download5DISKDEV6=/dev/sdh1MOUNTPOINT6=/data/download6DISKDEV7=/dev/sdi1MOUNTPOINT7=/data/download7DISKDEV8=/dev/sdj1MOUNTPOINT8=/data/download8DISKDEV9=/dev/sdk1MOUNTPOINT9=/data/download9DISKDEV10=/dev/sdl1MOUNTPOINT10=/data/download10DISKDEV11=/dev/sdm1MOUNTPOINT11=/data/download11DISKDEV12=/dev/sdn1MOUNTPOINT12=/data/download12# Mount share disk from 1 to 12MOUNTDISK ()$HAHOME/bin/dflush $1#下面是fsck检查磁盘部分,磁盘容量很大时会很长时间,建议屏蔽#fsck -a $1#if test $? -ne 0#then#$out INFO fsck .#fsck -yf $1#fimount $1 $2mount | grep $1 on $2 /dev/null 2&1if test $? -ne 0then$out INFO Cannot mount .exitfiMOUNTDISK $DISKDEV1 $MOUNTPOINT1MOUNTDISK $DISKDEV2 $MOUNTPOINT2MOUNTDISK $DISKDEV3 $MOUNTPOINT3MOUNTDISK $DISKDEV4 $MOUNTPOINT4MOUNTDISK $DISKDEV5 $MOUNTPOINT5MOUNTDISK $DISKDEV6 $MOUNTPOINT6MOUNTDISK $DISKDEV7 $MOUNTPOINT7MOUNTDISK $DISKDEV8 $MOUNTPOINT8MOUNTDISK $DISKDEV9 $MOUNTPOINT9MOUNTDISK $DISKDEV10 $MOUNTPOINT10MOUNTDISK $DISKDEV11 $MOUNTPOINT11MOUNTDISK $DISKDEV12 $MOUNTPOINT12MOUNTDISK $DISKDEV13 $MOUNTPOINT13MOUNTDISK $DISKDEV14 $MOUNTPOINT14MOUNTDISK $DISKDEV15 $MOUNTPOINT15MOUNTDISK $DISKDEV16 $MOUNTPOINT16$HAHOME/bin/ha_ag_apache.sh $SERVICENAME 0 if test $? -eq 0then$out INFO The service has started. exitelse$out INFO Start apache server. /usr/local/apache2/bin/httpd -k stop /dev/null 2&1/usr/local/apache2/bin/httpd -k start /dev/null 2&1fi$out INFO Start shell finished.蓝汛apache_stop.sh脚本:#!/bin/sh# This file: apache_stop.sh# Version: 4.0.1HAHOME=cat /etc/init.d/HAHOMEexport HAHOMEout=$HAHOME/bin/APIOUT.xSERVICENAME=$2# Define share disk device name and mountpoint from 1 to 12DISKDEV1=/dev/sdc1MOUNTPOINT1=/data/download1DISKDEV2=/dev/sdd1MOUNTPOINT2=/data/download2DISKDEV3=/dev/sde1MOUNTPOINT3=/data/download3DISKDEV4=/dev/sdf1MOUNTPOINT4=/data/download4DISKDEV5=/dev/sdg1MOUNTPOINT5=/data/download5DISKDEV6=/dev/sdh1MOUNTPOINT6=/data/download6DISKDEV7=/dev/sdi1MOUNTPOINT7=/data/download7DISKDEV8=/dev/sdj1MOUNTPOINT8=/data/download8DISKDEV9=/dev/sdk1MOUNTPOINT9=/data/download9DISKDEV10=/dev/sdl1MOUNTPOINT10=/data/download10DISKDEV11=/dev/sdm1MOUNTPOINT11=/data/download11DISKDEV12=/
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《火灾救援技术》第1次课教案 火灾救援概述
- 军队文职报考与体能考核准备指南
- 消化内镜科试题及答案
- 高新金属磁材料产业化生产线项目可行性研究报告模板-立项申报用
- 病毒性肝炎患者护理查房
- 极端高温天气生产作业应急管控工作预案
- 消防工程终验
- 2025年一级建造师考试(公共课程)题库含答案(山东潍坊)
- 2026年教师资格证初中综合素质学生观试题及答案解析
- 情感疏导:心理护理的技巧
- T/CNSS 018-2023预包装食品血糖生成指数标示规范
- 2025内蒙古赤峰林西县招聘社区工作者74人备考考试试题及答案解析
- 城市污水管网沿线绿化与恢复方案
- 新疆保密管理办法
- 肝性脑病合并糖尿病护理
- 方太电烤箱KQD50F-C2说明书
- 纵隔肿瘤手术麻醉管理
- 工艺报警分级管理制度
- 腾讯音乐2025年音乐营销手册
- 北京课改版五年级下册小学英语全册单元知识点小结
- 金矿投资合作协议书
评论
0/150
提交评论