中文mobile server例行维护_update02by liuli_第1页
中文mobile server例行维护_update02by liuli_第2页
中文mobile server例行维护_update02by liuli_第3页
中文mobile server例行维护_update02by liuli_第4页
中文mobile server例行维护_update02by liuli_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、非经本公司播。2012。 保留一切权利。技术,任何和个人不得擅自摘抄、本文档内容的部分或全部,并不得以传商标和其他商标均为技术的商标。本文档提及的其他所有商标或商标,由各自的所有人拥有。注意您的产品、服务或特性等应受公司商业合同和条款的约束,本文档中描述的全部或部分产品、服务或特性可能不在您的或使用范围之内。除非合同另有约定,公司对本文档内容不做任何明示或默示的或保证。由于产品版本升级或其他原因,本文档内容会不定期进行更新。除非另有约定,本文档仅作为使用指导,本文档中的所有陈述、信息和建议不任何明示或暗示的担保。技术地址:市龙岗区坂田总部办公楼:518129htt:客户服务邮箱:客户服务:前言

2、目的本文主要介绍UCM Mobile 故障处理的注意事项,以及对各类故障现象的处理方法,并对的要求及故障处理流程。读者对象本文档(本指南)主要适用于以下工程师:技术支持工程师工程师符号约定在本文中可能出现下列标志,它们所代表的含义如下。符号说明表示有高度或中度潜在,如果不能避免,可能会导致或严重。表示有低度潜在,如果不能避免,可能会导致人员轻微或中等。表示有潜在风险,如果不能避免,可能会导致设备损坏、数据丢失、设备性能降低或不可预知的结果。表示能帮助您解决某个问题或节省您的时间。表示是正文的附加信息,是对正文的强调和补充。隐私出于日常或定位问题的需要,可通过手工或工具连接到数据库或服务器上,获

3、取日志信息、配置系统数据或服务器参数,这些信息中可能会包含如下通信内容或个人数据:日志信息中可能包含用户号码信息,供系统定位问题使用。数据库中的数据包含用户号码信息,供业务运营使用。文件服务器上可能存有用户的相关证件附件信息,供业务运营使用。上述信息,公司均无法单方面进行或获取。在执行操作前,请向客户说明的目的,涉及的范围及影响,请务必征得客户同意后才能进行操作,如果无法定位问题,需要将日志等帮助定位的信息发到运营商网络以外请研发帮助定位,也必须征得客户的同意。建议您只有在所适用允许的目的和范围内方执行操作。在过程中,您应采取足够的措施,以确保用户信息受到严格保护。在完成服务后,必须在客户的监

4、督下对所涉及的个人数据进行安全删除,对为定位问题而更改过的服务器配置进行恢复。修订修改累积了每次文档更新的说明。最新版本的文档包含以前所有文档版本的更新内容。文档版本 01 (2013-01-10)第一次发布。批注 h1: 缺少标题。目录前 言2目的2读者对象2符号约定2隐私修订. 3. 3目 录41 例行概述6例行例行例行对目的6注意事项6的必备条件7的要求71.3.2 对设备运营安全的管理要求71.4 例行周期72 周. 8检查UCM Mobile Server 网络状态8检查UCM Mobile Server 硬件状态9检查UCM Mobile Server 是否中断服务103 月. 1

5、1检查UCM Mobile Server 操作系统状态11检查UCM Mobile Server WEB 中间件运转情况12检查UCM Mobile Server 对应数据库状态13常见操作15关于本章15登录UCM Mobile Server 节点服务器15重启启动WEB 中间件15查看WEB 中间件Tomcat 是否启动15重新启动WEB 中间件Tomcat15重新启动数据库165 附录18硬件故障18服务器无法启动18系统频繁重启18UCM Mobile Server 常用命令.191本文档主要描述UCM Mobile Server 系统的日常例行项目和方法。1.1 例例行的目的是使设备

6、能够长期稳定地运行。通过例行:发现故障隐患,将故障消灭在萌芽期,避免故障发生后的经济损失和客户满意度降低。能发现设备运行趋势,有针对性地实施优化,提高设备的运行效率。1.2 例行注意事项为了充分发挥设备的性能和作用,减少各种意外事故的发生,确保设备能够长期安全、稳定、可靠地运行,并降低成本,在操作前,必须仔细阅读并严格遵守例行注意事项。请仔细阅读并严格遵守以下事项:在更换设备部件或插拔单板过程中,要做好防静电措施,佩戴防静电腕带。在过程中遇到的任何问题,应详细各种原始信息。若遇有紧急情况,师。慎重使用正文中提到的应按照应急中的流程处理,并立即联系工程操作及命令。私自导出个人信息出客户生产环境,

7、如果因为问题定位需要把个人信息导出EEA,需要向客户申请,并提供导出方法。需要对用户号码、用户、用户地址等能够关联到自然人的信息进行处理。由运营商执行过滤或审核后提供。化功能、工具的操作,化后的数据由运营商批注 h3: 这一章内容不全,可以直接的内容行目的例行概述批注 h2: 没有前言,页眉页脚也不对。1.3 例行的必备条件在进行操作前,必须先掌握必备的技能,并遵循相关的安全要求。1.3.1 对的要求为了使日常的技能。工作达到预期的效果,必须经过一定的培训,掌握必备的应具备以下要求:了解系统各部件原理和组网。熟悉所使用的操作系统(如Linux)和数据库(如 Oracle)基本命令及其对系统的影

8、响。熟练使用常用的工具。熟悉电子和电气知识,具备电子和电气设备的安全操作技能具有初步的数据总结和分析技能。非红、黄、绿单盲或色弱。能够清晰感知告警箱声音。1.3.2 对设备运营安全的管理要求在操作设备前,必须了解并严格遵守设备运营安全的相关要求。确保,从管理上确保没限的不能接触到设备。严禁使用局域网上的终端上网、玩,避免和。将笔记本电脑等直接接入到局域网。系统安全严格控制网络服务的启用。例行网络连接状态,确保接入是经过的。定期修改用户口令,严格限制用户级别,用适当级别的用户做适当的事。数据安全严格执行备份计划,定期备份系统数据。1.4 例行周期例行周期定义了执行项目的频度,包括。如例行周期为“

9、周”的项目,表示该项目每周应执行一次。实际项目和周期由运营商定义。行备份计划,定期备份系统数据。2本章介绍每周需要执行的项目。2.1 检查 UCM Mobile Server 网络状态检查UCM Mobile Server 集群中各节点的网络状态,确保应用服务能正常运行。前提条件执行此任务的工程师需具有通过SSL 登录个 UCM Mobile Server 节点的权限。参考标准可以显示对应 IP 且可以该 IP 地址。操作步骤步骤 1步骤 2步骤 3步骤 4通过 ssh -pServORT Server IP,登录各个UCM Mobile Server 节点;ifconfig,观察网卡状态。I

10、P,测试UCM Mobile Server 所处内部网络环境是否畅通。,测试UCM Mobile Server 所处公网环境是否畅通。IP是内网测试 IP 地址,通畅为默认网关;Server IP为UCM Mobile Server 的 IP 地址;ServORT为UCM Mobile Server 的 SSL 端口。-结束周批注 h5: 参考标准需要具体化。如命令执行后显示什么信息表示正常?其它的检查项也类似,都需要具体化。UCM Mobile Server 网络正常。 内网其他 IP 地址,均可以访问。例如:执行命令10.43.0.1,可以正常10.43.0.1;批注 h4:库的可以直接参

11、考的内容,看Mobile 要检查哪些。-在季度中已经加强该数据库部分描述异常处理网络异常的可能原因是:节点对应的服务器异常。节点对应的服务器的 IP 地址被篡改。节点对应的服务器的内部网络环境出现问题。相应的异常处理方法是:检查服务器的运行情况,确保运行正常。将UCM Mobile Server 对应地址修改正确。使用 service network restart 重新启动网络。如果按照以上步骤处理完成后,问题仍未解决,请联系工程师处理。2.2 检查 UCM Mobile Server 硬件状态检查UCM Mobile Server 集群中各节点的硬件状态,确保应用服务能正常运行。前提条件执

12、行此任务的工程师需具有通过 SSL 登录个 UCM Mobile Server 节点的权限。参考标准各UCM Mobile Server 节点的硬件状态正常,CPU、内存、硬盘使用情况正常。通过操作步骤中命令查看CPU、内存和硬盘状态,CPU 的使用率在 80%以内表示正常,内存使用率在 70%以内表示正常,硬盘使用率在 70%以内正常。操作步骤步骤 1步骤 2通过 ssh -pServORT Server IP,登录各个 UCM Mobile Server 节点;通过命令 sar -u 3 10 查看节点服务器的CPU 运转状态,使用率为 80%时,表示服务器 CPU 运转正常;步骤 3通过

13、命令vms 3 10 查看节点服务器的内存使用状态,使用率为 70%时,表示服务器内存工作正常;步骤 4通过命令 df -h 查看节点服务器的硬盘使用状态,使用率为 70%时,表示服务器硬盘工作正常。Server IP为UCM Mobile Server 的IP 地址;ServORT为 UCM Mobile Server 的 SSL 端口。-结束异常处理网络异常的可能原因是:节点对应的服务器异常。节点对应的服务内部出现异常。相应的异常处理方法是:检查服务器的运行情况,确保运行正常。重新启动 Tomcat。如果按照以上步骤处理完成后,问题仍未解决,请联系工程师处理。2.3 检查 UCM Mobi

14、le Server 是否中断服务检查UCM Mobile Server 集群中各节点的状态,确保各节点运行正常,是否有服务中断或者宕机现象产生,从而保证节点上部署的业务能正常运行。前提条件执行此任务的工程师需具有通过 SSL 登录个 UCM Mobile Server 节点的权限。参考标准每个集群节点的均可通过SSLnet 10.43.0.1 8080 返回端口可以,并且net 服务端口,可以正常。例如命令操作步骤步骤 1步骤 2通过 ssh -pServORT Server IP,登录各个 UCM Mobile Server 节点;net Server IP UCM PORT,查看连接是否被

15、。如果成功则说明服务正常,如果被则说明服务中断,需要检修。Server IP为UCM Mobile Server 的IP 地址;ServORT为 UCM Mobile Server 的 SSL 端口;UCM PORT为 UCM Mobile Server 和UCM Mobile 建立连接的端口。-结束异常处理节点状态异常的可能原因是:节点对应的服务器异常。节点对应的应用服务未启动。相应的异常处理方法是:检查服务器的运行情况,确保运行正常。启动节点对应的应用服务。如果按照以上步骤处理完成后,问题仍未解决,请联系工程师处理。3 月本章介绍每月需要执行的项目。3.1 检查 UCM Mobile Se

16、rver 操作系统状态检查UCM Mobile Server 集群中各节点的操作系统状态,确保应用服务能正常运行。前提条件执行此任务的工程师需具有通过 SSL 登录个 UCM Mobile Server 节点的权限。参考标准UCM Mobile Server 各个节点操作系统状态正常。通过 vi /var/log/message 查看操作系统日志,如日志中ERROR 条数小于 20 表示正常。通过操作步骤中命令查看CPU,内存,硬盘,句柄数;如 CPU 使用率在 80%以内,内存使用率在 70%以内,硬盘使用率在 70%以内,句柄数在 8K 以内,表示正常。操作步骤步骤 1步骤 2通过 ssh

17、 -pServORT Server IP,登录各个 UCM Mobile Server 节点;通过vi /var/log/message 查看操作系统日志,查看本月操作系统是否有异常日志产生。查看并ERROR 日志。步骤 3通过命令 sar -u 3 10 查看节点服务器的CPU 运转状态,使用率为 80%时,表示服务器 CPU 运转正常;步骤 4通过命令vms 3 10 查看节点服务器的内存使用状态,使用率为 70%时,表示服务器内存工作正常;步骤 5通过命令 df -h 查看节点服务器的硬盘使用状态,使用率为 70%时,表示服务器硬盘工作正常;步骤 6通过命令cat /proc/sys/f

18、s/file-nr 查看操作系统句柄数,其中第一个数值,8K 以内属正常,如超出 8K并及时反馈。IP是内网测试 IP 地址,通畅为默认网关;Server IP为UCM Mobile Server 的IP 地址;ServORT为 UCM Mobile Server 的 SSL 端口。-结束异常处理网络异常的可能原因是:节点对应的服务器异常。节点对应操作系统ERROR 日志超过 1000 条。节点对应操作系统CPU、内存、硬盘、句柄树超过标准。相应的异常处理方法是:检查服务器的运行情况,确保运行正常。重新启动服务器。重新启动 Tomcat。如果按照以上步骤处理完成后,问题仍未解决,请联系工程师处

19、理。3.2 检查 UCM Mobile Server WEB 中间件运转情况检查UCM Mobile Server 集群中各节点的WEB 中间运转状态,确保应用服务能正常运行。前提条件执行此任务的工程师需具有通过 SSL 登录个 UCM Mobile Server 节点的权限。参考标准各UCM Mobile Server 节点的WEB 中间件 Tomcat 运转状态正常。通过命令ps -ef|greptomcat 查看Tomcat 进程是否存在,进程存在常。通过 tail f 追踪服务器日志,查常。通过cat看日志文件是否有日志信息写入,日志写入/opt/mkey3g/tomc og/logf

20、iles | grep OutOfMemory 命令查看是否有内存泄露,如果指令返回结果为空,表示正常。操作步骤步骤 1 通过 ssh -pServORT Server IP,登录各个 UCM Mobile Server 节点;步骤 2通过命令ps -ef|grep tomcat 查看节点服务器的Tomcat 进行是否存在,Tomcat 进程存在常;步骤 3通过命令tail f /opt/mkey3g/tomc og/logfile查看节点服务器的运行日志,观测 10 分 钟,如果运行日志正常,则Tomcat 运转正常;步骤 4通过命令cat /opt/mkey3g/tomc og/logfi

21、les | grep OutOfMemory 查看节点服务器的运行日志中是否包含内存溢出信息。Server IP为UCM Mobile Server 的 IP 地址;ServORT为UCM Mobile Server 的 SSL 端口。logfile为今日运行日志,由于 Tomcat 日志进行了分卷处理,所以追踪日志时需要追踪当天日志。日志命名为:MKey3GProject.yyyy.MM.dd.out,其中 yyyy 为年份,MM 为月份,dd 为日期。logfiles为本月运行日志,由于 Tomcat 日志进行了分卷处理,所以追踪日志时需要追踪当月日志。日志命名为:MKey3GProjec

22、t.yyyy.MM.dd.out,其中 yyyy 为年份,MM 为月份,dd 为日期,由于需要查看本月命令,则命令应为:cat /opt/mkey3g/tomcog/ MKey3GProject.yyyy.MM* | grep OutOfMemory。-结束异常处理网络异常的可能原因是:节点对应的服务器异常。节点对应的WEB 中间件出现,运行日志终端或内存溢出错误,则说明WEB 中间无法服务。相应的异常处理方法是:检查服务器的运行情况,确保运行正常。重新启动Tomcat。如果按照以上步骤处理完成后,问题仍未解决,请联系工程师处理。3.3 检查 UCM Mobile Server 对应数据库连接

23、数状态检查UCM Mobile Server 集群中各节点对应数据库连接数状态,保证数据库的最大连接数没有被沾满,从而保证节点上部署的业务能正常运行。前提条件执行此任务的工程师需具有通过SSL 登录个 UCM Mobile Server 节点的权限。参考标准每个集群节点对应数据库的均可使用net对应服务端口,并且连接数据库,通过shorameter ses,select count(*) from V$ses两条SQL 语句查看数据库连接数是否沾满。如可数据库,并且数据库连接并未沾满则表示正常。操作步骤步骤 1步骤 2通过 ssh -pServORT Server IP,登录各个 UCM Mo

24、bile Server 节点;net DBServer IP DB PORT,查看连接是否被。如果成功则说明服务正常,如果被则说明服务中断,需要检修;步骤 3步骤 4步骤 5通过 sysdba,登陆数据库;通过数据库命令SQL shorameter ses,查看最大连接数;通过数据库命令SQL select count(*) from V$ses连接数是否被沾满。,查看当前连接数,并确认数据库Server IP为UCM Mobile Server 的IP 地址;ServORT为 UCM Mobile Server 的 SSL 端口;DBServer为UCM Mobile Server 对应数据

25、库 IP 地址;DB PORT为 UCM Mob Server 对应数据库端口。-结束异常处理节点状态异常的可能原因是:节点对应的服务器异常。节点对应的数据库无法连接。节点对应的数据库连接数达到最大值。相应的异常处理方法是:检查服务器的运行情况,确保运行正常。联系数据库管理员,调整数据库。重新启动各节点对应 Tomcat,以占用的数据库连接。如果按照以上步骤处理完成后,问题仍未解决,请联系工程师处理。4常见操作关于本章本章介绍一些常用的操作。4.1 登录 UCM Mobile Server 节点服务器通过 SSL 登录 UCM Mobile Server通过 ssh -pServ$ ssh -

26、pServORT Server IP,登录各个 UCM Mobile Server 节点ORT Server IPServer IP为UCM Mobile Server 的IP 地址;ServORT为 UCM Mobile Server 的 SSL 端口。4.2 重启启动 WEB 中间件查看 WEB 中间件 Tomcat 是否启动通过ps -ef|grep tomca | grep v grep 查看WEB 中间件 Tomcat 是否启动。$ps -ef|grep tomcat | grep v grep如为发现 Tomcat 进行则说明WEB 中间件并未启动,如发现Tomcat 进程,则说明

27、 Tomcat 中间件已经启动。只有 Tomcat 进程存在时需要进行重新启动操作,否则仅启动 Tomcat 即可。重新启动 WEB 中间件 Tomcat通过ps -ef|grep tomca | grep v grep 命令得到 Tomcat 中间件对应的$ps -ef|grep tomcat | grep v grep通过kill -9 命令将已存在的Tomcat 进行杀死$kill -9 通过/opt/mkey3g/tomcat/bin/startup.sh 命令启动Tomcat$/opt/mkey3g/tomcat/bin/startup.shWEB 中间件 Tomcat 对应进程 I

28、D。4.3 重新启动数据库UCM Mobile Server 系统数据库故障时,可以参考下面令重启数据库。单实例的数据库重启以oracle 用户登录数据库服务器,执行如下命令:# sqlplus / as sysdbaSQLshutdown immediateSQLstartup部署的是 RAC,重启单实例以oracle 用户登录数据库服务器后执行如下操作。下列命令涉及如下参数:instance_name:odpdb01database_name:odpdb01hostname:odpdb011. 停止Oracle RAC 环境。具体命令如下:a.设置Oracle 实例名。$ export O

29、RACLE_SID= odpdb01关闭数据库控制台。$ emctl stop odpdb01关闭数据库实例。$ srvctl stop instance -d ccbmdb -i odpdb01关闭ASM(Automated Storage Management)实例。$ srvctl stop asm -n odpdb01关闭节点应用程序。$ srvctl stop nodeapps -n odpdb01b.c.d.e.启动Oracle RAC 环境。具体命令如下:设置Oracle 实例名。$ export ORACLE_SID= odpdb01b.启动节点应用程序。$ srvctl start nodeapps -n odpdb01启动ASM 实

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论