




已阅读5页,还剩79页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
IA002201 TELLIN-SCP操作与维护 ISSUE3.1课程说明课程说明课程介绍本课程介绍了SCP的配置文件和系统日志,此部分对于SCP维护人员掌握SCP系统的运行情况十分重要。因TELLINSCP系统都是双机结构,故本课程对基于HP MC/ServiceGuard的双机体系进行了介绍,并介绍了此类双机体系的管理方法。本课程最后一章还对SCP的人机界面操作管理维护台OAM进行了详尽的介绍。课程目标完成本课程学习,学员能够掌握: TELLINSCP的系统配置文件和日志 TELLINSCP的双机体系结构和管理方法 TELLINSCP的操作管理维护台OAM的使用方法相关资料TELLINSCP业务控制点 操作手册TELLINSCP业务控制点 安装手册1IA002201 TELLIN-SCP操作与维护 ISSUE3.1第1章 TELLINSCP主机软件第1章 TELLINSCP主机软件1.1 概述这一章中,我们将介绍SCP软件的维护和操作。主要介绍了SCP主机运行所必需设置的环境变量、SCP用户系统、目录结构及其目录中主要文件以及系统日志,这些内容都是维护SCP的人员所必须掌握的内容。1.2 SCP的用户管理SCP主机系统用户是指SCP软件系统及其相关软件系统INFORMIX数据库所需的用户。它包括tellin、sms和informix。除这三个用户外,还有两个用户组:scp和informix。用户tellin和sms属于scp组,用户informix属于informix组。这些用户组和用户,在操作系统安装完成后、SCP安装之前,就应该已经创建,且各自的磁盘空间也应该已得到正确地规划。在以后系统的运行过程中,不能随意对其用户环境进行更改。1. tellin用户tellin用户是SCP系统软件安装和运行所使用的用户,其用户组为scp。SCP系统软件的安装就是在该用户的主目录下进行的,SCP系统软件的启动和关闭操作也都是以tellin用户的身份进行的。tellin用户使用的shell,我们指定为csh。tellin用户的HOME目录下安装SCP,一般在SCP安装时设置为/tellin,所以在创建该用户时一般也就指定它的主目录为/tellin,否则安装后需要相应改变一些环境变量的设置。因tellin用户HOME目录用于安装和运行SCP软件,因此给其分配的可用磁盘空间应该足够大,建议在800Mbytes以上。SCP系统软件安装在tellin用户的HOME目录下,SCP系统软件的运行环境就是用户tellin的环境。因此,对其环境变量的设置有一定的要求(即在该用户的主目录下的.cshrc中要特别指定,具体的设置项目将在下面详细介绍。2. sms用户sms用户为SCP和SMP交互数据所用,主要用于交互话单数据。其用户组为scp,因为SCP与SMP之间要传递话单数据使话单保持一致,所以用该用户进行操作。sms用户使用的shell,我们指定为csh。一般在SCP安装时,指定该部分交互的目录为/tellin/sms,所以在创建sms用户时,也就指定他的用户HOME目录为/tellin/sms。因为在sms用户下,并不运行任何程序,它只是提供一个SCP和SMP共同访问的目录,所以,对其环境变量的设置没有特别要求。3. informix用户informix用户是INFORMIX数据库管理系统安装和动态数据库运行所使用的用户,其用户组为informix。INFORMIX数据库服务器的启动和关闭操作都是以informix的用户身份进行的。informix用户所使用的shell,我们指定为csh。informix用户的HOME目录,即为安装INFORMIX所在目录,一般在SCP安装时设置为/opt/informix。informix用户的HOME目录用于安装INFORMIX数据库和运行INFORMIX,它的环境变量也有特殊要求,即在该用户的主目录下的.cshrc中要特别指定,具体的设置项目将在下面详细介绍。1.3 SCP环境变量的设置tellin用户的环境变量:tellin用户HOME目录下的.cshrc文件。(1) setenv TELLIN_DIR /tellinTELLIN_DIR为SCP安装目录,也就是tellin用户的HOME目录。(2) setenv TELLIN_TEMP $TELLIN_DIR/tempTELLIN_TEMP为SCP安装目录下的temp目录。设置该环境变量前,TELLIN_DIR环境变量已经设置。(3) setenv TELLIN_SCPID 100TELLIN_SCPID为该SCP的全局编号,此环境变量必须设置。假设其值为100。(4) setenv TELLIN_TAPE_DEV /dev/rmt/0mTELLIN_TAPE_DEV为磁带所对应的设备名,HP的小型机的磁带路径一般都是:/dev/rmt/0m。(5) setenv XENVIRONMENT $TELLIN_DIR/config/oam_menu.resXENVIRONMENT为OAM所使用的菜单资源。 注意:oam_menu.res前面的路径名一定要准确,否则启动OAM后,资源文件无法找到,菜单项显示为内部变量,无法识别。(6) setenv INFORMIXDIR /opt/informixINFORMIXDIR为INFORMIX安装所在目录,一般是/opt/informix(7) setenv INFORMIXSERVER tellin_onlineINFORMIXSERVER为INFORMIX数据库服务器名,这里假设为:tellin_online。(8) setenv TELLIN_DBNAME inTELLIN_DBNAME为SCP使用的数据库名,这里假设为in。(9) setenv ONCONFIG onconfigONCONFIG为 INFORMIX数据库服务器的配置文件名,一般为onconfig,在$INFORMIX/etc目录下。(10) PATH中包含路径TELLIN_DIR/bin和INFORMIXDIR/binPATH为tellin用户执行命令时搜索该命令的路径。1.4 INFORMIX环境变量的设置tellin用户的环境变量:informix用户HOME目录下的.cshrc文件。(1) setenv INFORMIXDIR /opt/informixINFORMIXDIR为INFORMIX安装目录,也就是informix用户的HOME目录。(2) setenv ONCONFIG onconfigONCONFIG为 INFORMIX数据库服务器的配置文件名,一般为onconfig,在$INFORMIX/etc目录下。(3) setenv INFORMIXSERVER tellin_onlineINFORMIXSERVER为INFORMIX数据库服务器名,这里假设为:tellin_online。(4) setenv PATH $PATH:$INFORMIXDIR/bin:/binPATH为informix用户执行命令时搜索命令的路径。1.5 INFORMIX配置文件INFORMIX配置文件为$INFORMIXDIR/etc目录下的onconfig文件,此配置文件由环境变量ONCONFIG指定,它定义了Online Server的核心参数。与维护人员相关的一些参数有:(1) MSGPATH /informix/online.logINFORMIX系统产生的日志存放文件,一般都是informix用户HOME目录下的online.log文件。(2) TAPEDEV /dev/rmt/0m备份数据库中的数据和系统文件时的备份路径。这里的/dev/rmt/0m是指磁带机,即备份到磁带上。(3) LTAPEDEV /informix/log.dat备份informix数据库逻辑日志的备份路径。这里是备份到一个文件上:/informix/log.dat,对于SCP系统,不要求备份逻辑日志,故需要将此文件指向空设备文件:/dev/null,以丢弃逻辑日志。(4) DBSERVERNAME tellin_onlineINFORMIX数据库服务器名,用于系统内部访问此数据库时使用。这里是:tellin_online。(5) DBSERVERALIASES tellin_online_netINFORMIX数据库服务器别名,用于网络访问此数据库时使用,如SMP访问SCP时,就是使用此名字。这里是:tellin_online_net。1.6 SCP主机软件的目录结构在SCP的安装目录下,也即tellin用户的HOME目录下,设定了一些目录:(1) bin目录bin目录下存放必备的运行程序manager,scf,sdf和oam 运行程序。(2) config目录该目录下存放一些配置文件,如SYSCFG.DAT,SYSCFG.INI,oam_menu.res和DUALCFG.DAT等。(3) db目录db目录下存放一些扩展名为sql的文件,如:warning_detail_s.sql,warning_detail_s.unl,warning_s.sql,weekdiscount.sql等。这些文件主要用于安装时创建SCP系统运行所需的基本数据库表。(4) log目录该目录存放着SCP系统日志(log)文件。日志文件包括:manager.log,scf0.log,scf1.log,scf2.log,sdf.log,server.log等。启动了几个SCF进程,就有几个SCF日志。(5) sms目录sms目录为sms用户的HOME目录,或者为sms用户的HOME目录的一个符号链接。在此目录下,还有一个record子目录,用于存放话单文件,SMP正是从此目录下读走话单文件的。(6) temp目录存放着一些临时文件。例如SCF和SDF程序升级时,新版本程序即放在该目录下。 该目录可以为空。(7) servicerun目录存放着业务文件和业务配置文件。在业务加载前只有三个文件:service.bin,servicedb.dir和servicemete.bin。在业务加载后,此目录下还应有加载过来的相关业务文件(扩展名为.bin)。1.7 SCP软件系统的配置熟悉SCP系统的配置文件SCPCFG.INI对于维护人员十分重要,因为SCP的配置文件决定了SCP系统的性能和一些重要的运行参数。调整SCP配置文件的参数应当十分谨慎,做好文件更改记录。SCP配置文件的更改不会立即生效,需要重新启动SCP或更新SCF进程才能使新配置文件生效。这里介绍SCPCFG.INI文件中的一些参数。另一个比较重要的配置文件是SYSCFG.DAT,此文件不允许维护人员手工修改,必须通过SMAP操作来配置。SCPCFG.INI文件在tellin用户HOME目录的config子目录下。SCPCFG.INI配置内容将分为SCP、SCDF等多个域,以下分别对配置内容的各个域的参数进行说明,并给出一个配置的样本,即每一个参数后面的都赋了值。(1) numOfSCDFRuning = 3当前运行scf进程数目。(2) maxDlgIDOfSCP = 30000该SCP允许的最大对话号,它必须大于或等于(通常是等于SAU的配置。例如有两个SAU,每个SAU占用15000个对话号,则maxDlgIDOfSCP应该等于30000。(3) minDlgIDOfSCP = 0SCP允许的最小对话号,通常为0。(4) MaxBufferOfTSCSM = 3000每一个SCF内的最大SCSM数。该值的最小值计算方法如下:CAPS平均呼叫时长/SCF进程数。如CAPS75,平均呼叫时长假定为100秒,运行3个scf进程,则最小值为:75100/3 = 2500。实际取值应该比该计算的最小值大一些,如在该例中设为3000。(5) MaxChargeService 10需要计费的最大业务数。(6) MaxCallingTollNum = 30最大主叫区号数,即可以发起呼叫的区号数目。对于一个省网而言,其主叫区号数通常为该省的区号数。如在广东200工程中,可能作为主叫的仅为23个区号。(7) MaxTollNum 500计费中涉及到的最大区号数,通常即为全国区号数。(8) MaxInterAreaNum = 2000计费中涉及到的最大国际区号数,即可以拨往的国际区号数。(9) MaxOfficeNum = 300本地计费中,任何一个主叫区号的最大的局的个数。(10) MaxGroupno = 100本地计费中,任何一个区的任何一局的允许的最大组号。(11) MaxGroupClassNum = 1000本地计费中,任何一个区的任何一个群下的组间计费数据数目。(12) MaxChargeClassIndex = 1000计费中,最大的计费类别索引值。(13) MaxInterPrefixNum = 2最大国际前缀数。(14) TXRECHOUR = 03向SMP请求传输话单的定时器中的小时的值。如果设为1,则表示不定时请求SMP传送话单。(15) TXRECMINUTE = 00向SMP请求传输话单的定时器中的分钟的值,它和TXRECHOUR一起构成时钟。如本例,每到03:00,SCP将向SMP请求传送话单。(16) LIMITATION = 800000话单文件大小的限定值,单位为Kbytes。当话单文件长度超过该值时,将向SMP请求传输话单。(17) SCANINTERVAL = 300SCP扫描话单文件大小的时间间隔,单位为秒。此例中值为300秒,即每隔300秒,SCP就扫描一次话单文件,如果话单文件的大小超出了LIMITATION规定的大小,就向SMP传送话单,如未超过,则不传。(18) SMPPortNumber = 30200Manager中监听SMP连接的socket端口号。(19) SSPPortNumber = 5600Manager中监听SAU的MEM板连接的socket端口号。(20) CAPSControlFlag = 1Manager中对负载过重的自动控制是否有效的标志,1为有效,0为无效。(21) DETECTIONSPAN = 10监测时间间隔,用于自动过负荷控制机制。(22) ControlLevel = 3控制级别,取值范围为18。它表示一旦满足控制标准,将按照该控制级别进行呼叫控制。该值越小,控制呼叫通过率则下降的越快,即过负荷控制越敏感。(23) ControlTimeLength = 2000采取过负荷控制的一个阀值,单位是毫秒(ms)。其含义为从收到TC_BEGIN到收到TC_CONTINUE消息之间的平均时间间隔的最大值。即当该平均时间间隔大于ControlTimeLength时,将采取过负荷控制。(24) RestoreTimeLength = 1000为恢复(即取消过负荷控制的一个阀值,单位是毫秒(ms)。其含义为从收到TC_BEGIN到收到TC_CONTINUE消息之间的平均时间间隔的最小值。即当该平均时间间隔小于ControlTimeLength时,将恢复过负荷控制。 注意:维护人员除应该对系统的配置文件进行仔细分析外,还应定期查看系统的日志文件。SCP系统的日志文件在tellin用户HOME目录的log子目录下。这些日志记录着系统的运行情况。informix用户的日志文件在informix用户HOME目录下,文件名:online.log。此文件记录着INFORMIX的运行情况,也需要定期查看。1.8 TELLIN系统网络配置在SCP系统的config子目录中,有一个名为SYSCFG.DAT的文件,此文件中记录着整个TELLIN智能网系统的网络配置情况。此文件一般是在SMAP上通过SMAP的网络管理功能来配置的。该文件内各行的含义举例如下:1、SCP配置1:SCP:100:4 12 6 2 1 0 0 0:129.8.168.26字段1:表示该配置处于有效状态字段SCP:表示该配置为SCP的配置字段100:表示该节点的节点号字段(4 12 6 2 1 0 0 0):表示SCP的信令地址字段(129.8.168.26):表示SCP的IP地址2、SAU配置1:NO7: 700:129.8.160.27:129.8.160.28字段1:表示该配置处于有效状态字段NO7:表示该配置为SAU的配置字段700:表示该节点的节点号字段(129.8.160.27):表示该SAU的第一块MEM板IP地址字段(129.8.160.28):表示该SAU的第二块MEM板IP地址3、SSP配置1:SSP:2001:4 12 8 1 1 0 0 0:0755:700字段1:表示该配置处于有效状态字段SSP:表示该配置为SSP的配置字段2001:表示该节点的节点号字段(4 12 8 1 1 0 0 0):表示该SSP的信令地址字段0755:表示该SSP的国内区号字段700:表示该SSP连接的SAU编号E 说明:因SSP可以多个,因此,其配置可以为多行。小 结本章阐述了系统的软件结构、用户系统及目录结构,并着重介绍了SCP系统的环境变量、配置文件SCPCFG.INI、TELLIN系统网络配置文件SYSCFG.DAT和informix用户的配置文件onconfig和环境变量.cshrc。虽然,在本章中未详细介绍各个日志,但强调了日志文件的重要性,希望维护人员能够定期检查日志文件。习 题1-1 SCP的用户有哪些?各属于什么组?1-2 哪个目录是存放SCP话单文件的?1-3 SCP的配置文件有哪些?在什么目录下?1-4 如何设置是否启用呼叫时隙(Call Gap)?1-5 informix用户的日志文件是哪个?12IA002201 TELLIN-SCP操作与维护 ISSUE3.1第2章 TELLINSCP双机系统第2章 TELLINSCP双机系统2.1 TELLINSCP双机系统概述SCP系统是整个智能网的核心,因此其处理性能、运行的稳定性和可靠性显得尤其重要,通常情况下大都采用性能好稳定性高的小型机作为运行平台。为了达到更高的稳定性和可靠性,电信服务商有时还会选择双机系统作为其运行平台。双机是以两台机器共同组成的一个系统,其中一台机器为主机,另外一台为备机。双机的保护机制是,当主机出现了重大故障(通常是系统无法自动补救的故障)时,系统会将应用迁移至备机上运行。本节将专门讲述TELLINSCP双机系统的操作维护知识。2.1.1 TELLINSCP双机系统基本概念TELLINSCP双机系统硬件采用的是HP公司的9000系列的800类型的小型机,一般要求两台机器型号和硬件配置相同,软件采用的是HP公司的MC/ServiceGuard系统。MC/ServiceGuard是一个提供高可用性应用的软件。MC/ServiceGuard将两台HP机器用网络组织起来组成一个群组(CLUSTER),每台机器称为群组的一个节点(NODE)。运行在双机上的一个或多个用户进程组织在一起构成一个包(PKGPACKAGE)。MC/ServiceGuard监视着包的运行和每个节点的运行状况,在一个节点出现故障时,根据需要将在此节点上运行的包转移到另一个节点上去运行,以避免应用的长时间中断。在SCP双机系统中,TELLINSCP的应用进程组成一个包称为SCPPKG(用户也可改用其它名称,但建议用户使用此缺省名称)。1. 双机逻辑结构TELLINSCP双机系统的典型逻辑结构如图2-1所示。图2-1 TELLINSCP双机逻辑结构图2. 硬件系统在TELLINSCP双机系统中,每个节点(即每台服务器)上安装有三块网卡,其中10BaseT一块,100BaseT两块。电源模块、光驱、磁带机等每台服务器各有一套。磁盘柜通过SCSI电缆或光纤连到两个节点上,由两个节点共享,规划成锁盘。 用户可在不影响TELLINSCP双机系统运行的情况下安装其它所需设备。3. 网络结构每个节点上的两块心跳网卡用网线直连(即不经过集线器,使用MDI-X网线直连),形成10M心跳子网。每个节点的主用网卡都连到主用集线器上,构成主用子网;每个节点的备用网卡都连到备用集线器上,构成备用子网。主用集线器和备用集线器通过另一台集线器(或MDI-X网线)连起来。主用子网和备用子网的带宽都是100M的。 网段A和网段B是两个独立的物理网段。心跳子网:用来在双机之间传送心跳信息。双机系统中的两个节点正是通过该心跳信息来判断对方的状态的。主用子网:用来传送SCP的数据。但有时为了安全起见,网段B也配置成可传输心跳信息。即在传输SCP数据的同时,还与对端节点进行心跳通信。这样,在心跳子网失效时,心跳信息仍然存在。备用子网:是主用子网的备用子网,它与主用子网处于同一网段。在主用网卡失效时,备用网卡将接替主用网卡的工作,成为主用网卡。在主用集线器失效时,备用集线器将接替主用集线器的工作,成为主用集线器。4. IP地址在MC/ServiceGuard管理的双机系统中,IP地址分为两种大的类型,固定IP(Stationary IP address)和浮动IP(Floating IP address)。在某个节点上配置的固定IP只能在该节点使用,但该IP可以在主用网卡出现故障时切换到备用网卡上。固定IP又分两种,心跳IP(HEARTBEATIP)和非心跳IP(STATIONARYIP或NONHEARTBEATIP)。浮动IP总是绑定在主节点的主用网卡上。浮动IP不仅可以在主用网卡出现故障时切换到备用网卡上,还可以在该节点出现故障时切换到另一个节点的主用网卡上。每个节点的主用网卡和心跳网卡都需配置IP地址,而备用网卡是不配IP地址的,主用网卡和心跳网卡的IP地址不能相同,且必须分属于两个物理网段。主节点上还需要配置一个浮动地址,浮动IP不能与前述的IP相同,且要与数据网卡所配置的IP在同一个物理网段内。5. 锁盘锁盘不是用来存放数据的,它是双机可靠工作的一种保障机制。当双机系统中的两个节点之间的通信失败时,每个节点都将尝试获得对锁盘的控制权,最终获得该控制权的节点将成为主机,而另一个节点将被关闭。2.2 TELLINSCP双机工作原理2.2.1 双机系统中的操作系统与应用软件在双机系统的本地硬盘上都安装有UNIX操作系统、INFORMIX数据库系统、SCP应用软件和MC/ServiceGuard双机管理软件。也就是说,在未将两台服务器组成群集(CLUSTER)之前,两台服务器都是可以独立工作的SCP系统。在通过配置MC/ServiceGuard将两台服务器组成群集后,两台服务器上的UNIX、INFORMIX和SCP软件虽然都在运行,但两台服务器的数据库状态不同了,其中只有一台INFORMIX数据库服务器的状态为Online-Up,而另一台则为Read-Only状态。也就是说,只有主节点上的数据库是可读可写的,备节点上的数据库是处于只读状态的。另外,在群集建立起来后,应用程序包SCPPKG只运行在主节点上,这个程序包时刻监视着包括网络连接、系统资源、操作系统以及应用软件的状态。但需要指明的是,虽然两个节点上的数据库状态不一致了,但两台服务器本地硬盘中数据库中的数据却是保持一致的。这一点是通过INFORMIX系统的HDR(高速数据复制)实现的。在建立起HDR关系的两台INFORMIX数据库服务器之间,Read-Only状态的服务器将实时复制Online-Up状态数据库中的数据,以保持与Online-Up状态数据库中的数据一致。2.2.2 MC/ServiceGuard双机系统的工作原理图2-2显示MC/ServiceGuard使用的主要软件组件。图2-2 MC/ServiceGuard主要软件组件1、群集管理器Cluster Manager群集管理器用于初始化群集,监视群集的“健康状况”。在某节点出现故障时,加以识别。群集管理器运行的核心是在群集的节点之间发送和接收心跳信息。2、程序包管理器Package Manager群集中的每个节点都运行一个程序包管理器的实例;程序包管理器进行下列操作:r 确定运行、停止或移动程序包的时间和节点。r 执行用户定义的控制脚本来运行和停止程序包和程序包服务。r 对处于监视下的资源状态的改变做出反应。程序包管理器运行的核心是程序包在节点之间的切换。3、网络管理器Network Manager网络管理器的目的是检测网卡和电缆故障,并从中恢复。网络管理器在检测到主用网卡故障时,则进行IP地址“本地转换”,即将固定IP地址转移到备用网卡上。如图2-3所示。图2-3 主备网卡切换后的双机网络若主用集线器故障,则在主备节点上同时发生主备网卡的切换。如图2-4所示。图2-4 主用集线器故障后网络双机网络对于浮动IP地址,在主节点失败时,网络管理器会将浮动IP地址迁移到另一节点的主用网卡上,如图2-5所示。图中表明原主节点失效,包发生转移,锁盘由新主节点控制。图2-5 主节点失效后双机网络2.2.3 MC/ServiceGuard支持的群集管理基于MC/ServiceGuard的三个功能组件(群集管理器、程序包管理器和网络管理器),MC/ServiceGuard支持以下群集管理:r在网络出现故障的情况下,MC/ServiceGuard切换到备用网络或将受影响的程序包移动到备用节点。r在服务器出现故障的情况,在最短时间内自动地将应用程序从出现故障的服务器切换到正常工作的服务器。r在其它受监视的资源(如磁盘接口)出现故障的情况下,可以移动包到另一节点。r在软件出现故障的情况下,应用程序可以在同一节点或另一节点上重新启动,同时中断时间最短。2.3 TELLINSCP双机的启动与关闭TELLINSCP双机系统的启动与关闭需要遵循一定的顺序,否则会导致主备节点的切换或工作不正常。2.3.1 TELLINSCP双机系统的启动假设,在两台服务器尚未启动任何应用。那么启动的正常顺序应该为:1、在主机上以informix用户启动INFORMIX数据库。命令格式:$oninit执行完该命令后,需要用onstat -命令检查数据库状态,直至数据库状态变为Online-Up (Prim)。这表明主机数据库已经正常工作。2、在备机上以infomrix用户启动INFORMIX数据库。命令格式:$oninit执行完该命令后,需要用onstat -命令检查数据库状态,直至数据库状态变为Read-Only(Sec)。这表明备机数据库已经正常工作。至此,两节点上的INFORMIX数据库的HDR关系已经建立起来。3、在主机上以tellin用户启动SCP应用程序命令格式:$manager执行完该命令后,用p命令检查是否MANAGER、SCF、SDF、SCFSERVER进程已经建立起来。若是,则证明主机上的SCP应用程序启动成功。4、在备机上以tellin用户启动SCP应用程序命令格式:$manager执行完该命令后,用p命令检查是否MANAGER、SCF、SDF、SCFSERVER进程已经建立起来。若是证明备机上的SCP应用程序启动成功。5、在主机或备机上以root用户启动群集(CLUSTER)命令格式:#cmruncl -v执行完该命令后,用cmviewcl -v检查双机、包和网络状态。2.3.2 TELLINSCP双机系统的关闭假设,TELLINSCP双机系统工作正常,若要关闭双机系统,需要遵循如下顺序:1、在备机上以tellin用户停SCP应用程序命令格式:$kill_scp.sh执行完该命令后,用p命令检查是否还有MANAGER、SCF、SDF、SCFSERVER进程存在。若无,则备机SCP应用程序已经关闭。2、在备机上以informix用户关闭INFORMIX数据库命令格式:$onmode -kuyF执行完该命令后,用 onstat - 检查INFORMIX数据库是否已经关闭。3、在任一节点上,以root用户停群集和应用程序包命令格式:#cmhaltcl -v -f执行完该命令后,用cmviewcl -v检查双机、包和网络状态。该命令不但会停群集,而且会同时停应用程序包SCPPKG,主机SCP应用程序和主机INFORMIX数据库也会同时关闭。2.4 TELLINSCP双机系统的状态2.4.1 TELLINSCP双机系统的正常状态正常的状态应该如下所示:CLUSTERSTATUSHpclusterupNODESTATUSSTATEhp107uprunningNetwork_Parameters:NTERFACESTATUSPATHNAMEPRIMARYup0/0/0/0lan0PRIMARYup0/7/0/0lan2STANDBYup0/4/0/0lan1PACKAGESTATUSSTATEPKG_SWITCHNODEscppkguprunningenabledhp107Policy_Parameters:POLICY_NAMECONFIGURED_VALUEFailoverconfigured_nodeFailbackmanualScript_Parameters:ITEMSTATUSMAX_RESTARTSRESTARTS NAMEServiceup00 scp_serviceSubnetup 10.16.0.0Node_Switching_Parameters:NODE_TYPESTATUSSWITCHINGNAMEPrimaryupenabledhp107 (current)Alternateupenabledhp108NODESTATUSSTATEhp108uprunningNetwork_Parameters:INTERFACESTATUSPATHNAMEPRIMARYup0/0/0/0lan0STANDBYup0/4/0/0lan1PRIMARYup0/7/0/0lan2以上信息的含义如下:1、群集的状态CLUSTERSTATUSHpclusterup群集的状态(STATUS)可能是:r启动(UP):至少有一个节点在运行群集。r关闭(Down):各节点上都没有运行群集。r正在启动(Starting):群集处于正在确定活动节点数量的状态中,至少有一个节点已经启动。r未知(Unknown):发出cmviewcl命令的节点不能与群集中的其它节点进行通信。2、节点状态和状况NODESTATUSSTATEhp107uprunningNODESTATUSSTATEhp108uprunning节点的状态(STATUS)可能是:r启动(Up):该节点是活动的。r关闭(Down):该节点是关闭的。节点的状况(STATE)可能是:r已失败(Failed):该节点不能被另一节点发现。r群集重组(Cluster Reforming):节点欲加入群集。r正在运行(Running):节点在正常运行。r已停止(Halted):该节点被另一节点发现正常脱离了群集。r未知(Unknown):该节点已经不在是活动群集的成员,另一节点指定其为此状态。3、程序包(SCPPKG)的状态和状况PACKAGESTATUSSTATEPKG_SWITCHNODEscppkguprunningenabledhp107程序包的状态(STATUS)可能是:r启动(Up):程序包的控制脚本是活动的。r关闭(Down):程序包的控制脚本是非活动的。r未知(Unknown):程序包的控制脚本状态未知。程序包的状况(STATE)可能是:r正在启动(Starting):正在运行控制脚本中的启动命令。r正在运行(Running):服务是活动的,并且正在受到监视。r正在停止(Halting):正在运行控制脚本中的停止指令。4、程序包(SCPPKG)的切换属性PACKAGESTATUSSTATEPKG_SWITCHNODEscppkguprunningenabledhp107程序包的切换属性(PKG_SWITCH)可能是:r允许切换(enabled):程序包在故障事件中可以切换到另一节点。r禁止切换(disabled): 程序包在故障事件中不可以切换到另一节点。 5、服务(SCP_Service)的状态Script_Parameters:ITEMSTATUS MAX_RESTARTS RESTARTS NAMEServiceup 0 0 scp_serviceSubnetup 10.16.0.0服务的状态可能是:r启动(Up):服务正被监视。r关闭(Down):服务不在运行。它可能已经停止或失败。r未知(Unknown):服务状态未知。6、网络状态Network_Parameters:NTERFACESTATUSPATHNAMEPRIMARYup0/0/0/0lan0PRIMARYup0/7/0/0lan2STANDBYup0/4/0/0lan1网络接口的状态可能是:r启动(Up):该网络接口已经启动。r关闭(Down): 该网络接口关闭。 r未知(Unkown):无法确定接口是启动是关闭的。在群集关闭时可能发生此种情况。备用接口具有此种状态。7、失败切换(Failover)和失败返回(Fillback)策略Policy_Parameters:POLICY_NAMECONFIGURED_VALUEFailoverconfigured_nodeFailbackmanual失败切换(Failover)策略可能是:rConfigured_Node:程序包失败切换到程序包配置文件中节点列表的下一个节点上。TELLINSCP正是使用的此策略。rMin_Package_Node:程序包失败切换到群集中运行程序包最少的节点上。失败返回(Fillback)策略可能是:r自动(Automatic):失败切换后,当程序包的主节点重新可用时,此程序包将返回到其主节点上。r手动(Manual):失败切换后,必须由系统管理员将程序包移动回它的主节点上。 TELLINSCP正是使用的此策略。2.4.2 TELLINSCP双机系统切换后状态当因主机上的SCP应用程序失败或主机上INFORMIX数据库失败时,双机应该发生切换,此时程序包将运行于另一个节点。切换后的状态如下所示:CLUSTERSTATUShpcluster upNODESTATUSSTATEHp107uprunningNetwork_Parameters:INTERFACESTATUS PATHNAMEPRIMARYup0/0/0/0lan0PRIMARYup0/7/0/0lan2STANDBYup0/4/0/0lan1NODESTATUSSTATEhp108uprunningNetwork_Parameters:INTERFACESTATUS PATHNAMEPRIMARYup0/0/0/0lan0PRIMARYup0/7/0/0lan2STANDBYup0/4/0/0lan1PACKAGESTATUSSTATEPKG_SWITCHNODEscppkguprunningenabled hp108Policy_Parameters:POLICY_NAMECONFIGURED_VALUEFailoverconfigured_nodeFailbackmanualScript_Parameters:ITEMSTATUSMAX_RESTARTSRESTARTS NAMEServiceup00 scp_serviceSubnetup 10.16.0.0Node_Switching_Parameters:NODE_TYPESTATUSSWITCHINGNAMEPrimaryupdisabledhp107Alternateupenabledhp108 (current)以上状态表明双机程序包已经由hp107切换到hp108上,这需要引起维护操作人员的注意!而且此时,程序包在hp107上的切换状态是disabled。所以对hp107进行恢复后,应执行如下命令:#cmmodpkg -e -n hp107 scppkg以上命令将程序包在hp107上的切换状态更改为enabled。执行完以上命令后的双机状态如下所示:CLUSTERSTATUShpcluster upNODESTATUSSTATEHp107uprunningNetwork_Parameters:INTERFACESTATUS PATHNAMEPRIMARYup0/0/0/0lan0PRIMARYup0/7/0/0lan2STANDBYup0/4/0/0lan1NODESTATUSSTATEhp108uprunningNetwork_Parameters:INTERFACESTATUS PATHNAMEPRIMARYup0/0/0/0lan0PRIMARYup0/7/0/0lan2STANDBYup0/4/0/0 lan1PACKAGESTATUSSTATEPKG_SWITCHNODEscppkguprunningenabled hp108Policy_Parameters:POLICY_NAMECONFIGURED_VALUEFailoverconfigured_nodeFailbackmanualScript_Parameters:ITEMSTATUSMAX_RESTARTSRESTARTS NAMEServiceup00 scp_serviceSubnetup 10.16.0.0Node_Switching_Parameters:NODE_TYPESTATUSSWITCHINGNAMEPrimaryupenabledhp107Alternateupenabledhp108 (current)2.5 TELLINSCP双机系统的维护TELLINSCP双机系统的维护除了单机所需注意之处外,还有一些特殊的地方。双机系统维护的基本原则是:首先查看SCP应用程序日志和打印信息,数据库服务器日志和运行状态,然后查看SCP PKG日志,然后查看系统日志。E 说明:有关SCP应用程序的日志和INFORMIX数据库服务器的日志的介绍请参见第四章的内容。与单机相比较,双机系统多了一个应用程序日志:trans.log。该日志存放在tellin用户HOME目录的log子目录下。trans.log日志记录了备机切换成主机过程时与数据库有关的操作,如是否已经切换为Online-Up (Prim)状态等。双机程序包SCP PKG的日志为/etc/cmcluster/scp/control.sh.log,用于记录SCP PKG的起动、停止等过程中的信息。若因某种原因,双机系统出现了不正常情况,如双机发生了切换,则一定要按照流程谨慎处理。以下针对一些最常见的双机系统故障进行了分析。有关双机故障更多的介绍将在“TELLINSCP双机故障分析”课程中讲述。1、双机数据网络通信故障这种故障的显著标志是两节点上的数据库服务器均变为了Online-Up (Prim)状态。数据网络通信故障会导致数据库服务器全部切换为Online-Up (Prim)状态,但主、备节点的SCP应用程序正常运行;需要注意的是,双机通信故障有时也会导致双机间的切换。双机数据网络通信故障需要工程师进行更进一步
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 第四单元 多姿多彩的乐音世界 第3课时《红梅赞》教学设计-2025-2026学年湘艺版(2024)初中音乐八年级上册
- 船舶水性水线漆项目可行性研究报告
- 涂膜市场竞争态势分析报告
- 防汛救灾知识培训课件
- 防汛抢险基本知识培训课件
- 语文9哲学家的思考
- 医疗服务合同
- 建设项目全过程造价咨询服务合同4篇
- 家具买卖合同样本2篇
- 河北省秦皇岛市实验中学2025-2026学年高二上学期开学考试物理试卷
- 仓储物流部门绩效考核标准与激励方案
- 机关办公室工作课件
- 2025年民数记每章测试题及答案
- 2025年注安实务《化工安全》真题及参考答案
- 2025-2026学年新七年级上学期开学摸底考试语文试卷(天津专用)
- 制药企业清洁操作规程标准
- 尿素水解系统讲解
- 2025年事业单位工勤技能-甘肃-甘肃园林绿化工一级(高级技师)历年参考题库含答案解析(5卷套题【单选100题】)
- 高尿酸血症肾病的临床护理(模板)
- 《中国历史文物介绍》课件
- 案场退场协议书
评论
0/150
提交评论