




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、数据仓库生产环境操作手册.运维概述“数据仓库生产系统”的运行维护责任在于保障系统运行,运维方式主要是操作员通过工作机远程登陆到系统中的相关主机,对主机进行操作,包括automation调度系统、数据库、磁盘、软件环境、数据情况等,查看批出理的运行情况,一旦运行出现问题作相应的记录并通知相关的技术人员,作出相应的处理。所有运维项目成员严格按照数据仓库系统运维守则.doc»文档来进行运维检查工作,否则出现事故由值班人员和当日值班负责人承担事故责任。.运维内容1. 每日维护1.1数据检查每日批处理运行前运行完成后都需要对源头的数据和生产出的数据进行检查,确保当日批处理程序正常从事生产。检查
2、工作在每日9:00-9:30之间完成,且必须在启动程序(批处理程序)前执行。具体规定如下:1.1.1转定长数据的检查每天上午9:00-9:45之间,运维值班人员进行这项工作具体执行步骤如下:1. 在本地工作机上使用telnet远程登录工具登录到63服务器上,输入用户名sjtq,密码:cib2009edw,2. 输入命令cdEDW/sh/log3. 输入命令moreyyyymmdd当天的日志,是否有错误信息,最后数据是否都上传结束。4. 以下错误属于正常情况:03:00:03:1.检查20091031标志文件失败03:00:03:1.数据标志检查失败,等待5分钟(06001/d
3、ta_varied)正常等待情况5. 检查点如下:1)每个大任务开始的初始化操作03:00:00:=0.环境变量设置完毕=2)数据装载,卸载,上传,整个模块处理结束的情况。05:41:50:=2.装载Unl数据完毕=05:41:50:2.开始装载BAK数据05:41:50:=2.装载BAK数据完毕=05:41:50:3.开始卸载fix数据06:26:11:=3.卸载fix数据完毕=06:26:11:4.开始向批量数据交换平台送fix数据06001sendok06001sendok06002sendok06002sendok07002sendok07002sendok06027sendok060
4、27sendok06:28:56:=4.向批量数据交换平台送fix数据完毕06:28:58:END6. 查找是否存在“错误“,”出错“字样。7. 检查的模块有06001,input,06002,07002,06027几个模块的转定长情况,都要看到正常END结束。8. 检查日志中是否存在跑到一半或一部分就终止的现象。如果没有转换成功或数据晚到,时间顺延检查,并将异常情况汇报给当日值班负责人和客户,并记录异常到异常情况登记及处理单YYYYMMDD.doc»中。1.1.2源数据是否全部到达数据仓库每日06:00定时触发加载。在正常情况下,数据仓库项目组要求各系统源数据抽取必须在每日05:0
5、0之前完成,并传送到上海数据交换平台。如果数据抽取或传送出现错误,请源系统接口负责人在06:00前完成数据补导操作。加载触发之后,可以看到每台etlserver上都启动了ftpall和getall两个作业,其中ftpall脚本负责从数据交互平台获取源系统文件,getall脚本负责对源系统文件进行解压、格式检查,并将检查结果存放在DQC日志表中。检查方法:检查项检查方法1.FTP是否结束查看AUTOMATIONMonitor前台界面RunningJob是否有FTPALL_ETL1,FTPALL_ETL2,GETALL_ETL1,GETALL_ETL2任务是古止在运行。若没有以上任务,说明从数据交
6、换平台FTP数据已经完成。如果还在运行,说明有些数据文件还未到达。2.哪些接口文件未到达可能性一:数据交换平台没有该数据文件查看当日initall0090.pl脚本的日志,例如:ETLLOGCTL20060530initall0090.pl.32.log,搜索关键字'miss就可以看到数据交换平台上哪些文件(包括数据文件和标志文件)未到3.哪些接口文件未到达可能性二:FTP下载时发生错误方法一:查看ftpall0100.pl脚本的日志,例如:ETLLOGCTL20060530ftpall_etl10100.pl.29.log,可以看到每个源系统数据的实时到达情况;方法二:登陆兴业银行数
7、据仓库DQC管理系统,点击左边的源数据文件接口定义维护主题。输入源表系统名或表名进行模糊查询;处理方法:如果超过这个时间检查顺延,如果超过10:30源数据还没到etl服务器上则通知值班负责人和客户,联系方式见客户和值班负责人联系清单.doc»,并记录异常到异常情况登记及处理单_YYYYMMDD.doc»中。1.1.3下游系统数据是否全部给出每天上午9:00-9:30,检查给下游系统的数据是否全部给出,这项工作非常重要,仓库目前有很多应用,而导数及上传脚本并非都有时时报错机制,特别是上传脚本,本项工作为检查上一日给下游供数情况。具体操作如下:1.执行以下SQL如果返回结果为0
8、,表示所有下游脚本运行正常select*frometlauto.etl_jobwhereetl_systemin('SUB','ARM','AML','TSR','EBM','RPA','CS3','ICR','PMS')andLast_JobStatus<>'DONE'andenable='1'andLast_txDate=数据日期2. 查询所有给下游的数据个数,表示所有下游脚本运行正常selectcoun
9、t(*)frometlauto.etl_jobwhereetl_systemin('SUB','ARM','AML','TSR','EBM','RPA','CS3','ICR','PMS')andLast_JobStatus='DONE'andenable='1'andrunningscriptlike'%0110%'andLast_txDate='2009-11-05'3. 到168.7
10、.6.94服务器每日值班下游数据统计软件目录下运行程序,将运行结果和步骤2的结果进行比对。4.如果发现有未给出的数据,则查找原因,找到原因后通知值班负责人和客户,并记录异常到异常情况登记及处理单YYYYMMDD.doc中.1.2数据库1.2.1STAGE区库空间检查值班人员每天早上9:00必须看数据库STAGE各子库的空间情况,MaxPerm是否比CurrPerm多20%的空间,若没有,需通知通知值班负责人即时处理。具体操作步骤如下:1. 到4服务器上每日值班统计库空间软件目录下双击dbspcount.bat软件。2. 查看DatabaseSpace.log日志最近一次的统计
11、结果,如果发现对应的库的per有超过90%的使用率的就需要增加空间了。处理方法:如果空间不足需通知通知值班负责人分配库空间。1.2.2APP_SPACE库空间是否足够值班人员每天早上10:30必须看数据库APP下面各子库的空间情况,MaxPerm是否比CurrPerm多20%的空间,若没有,需通知通知值班负责人即时处理。具体操作步骤如下:1. 到4服务器上每日值班统计库空间软件目录下双击dbspcount.bat软件。2. 查看DatabaseSpace.log日志最近一次的统计结果,如果发现对应的库的per有超过90%的使用率的就需要增加空间了。处理方法:如果空间不足需通知
12、通知值班负责人分配库空间。1.2.3PDM库空间是否足够值班人员每天早上9:20必须看PMD下面各子库的空间情况,MaxPerm是否比CurrPerm多20%的空间,若没有,需通知通知值班负责人即时处理。具体操作步骤如下:1. 到4服务器上每日值班统计库空间软件目录下双击dbspcount.bat软件。2. 查看DatabaseSpace.log日志最近一次的统计结果,如果发现对应的库的per有超过90%的使用率的就需要增加空间了。处理方法:如果空间不足需通知通知值班负责人分配库空间。1.2.494、95磁盘空间是否足够值班人员每天早上9:10必须看4、16
13、5服务器d盘、e盘空间情况检查方法:1. 打开“我的电脑”,观察D盘,E盘磁盘空间,必须有30GB以上的剩余空间处理方法:2. 如果没有30G的存储空间,需通知通知值班负责人及时清理垃圾文件。3. 如果清理以后磁盘空间仍然不足,必须通知相关环境保障人员增加磁盘空间。1.3ETL批处理1.3.1AWS是否有报警显示硬件维护目前由客户方管理,因此节点硬件方面的巡检由客户方负责。1.3.2ETLAUTOMATION监控窗口是否存在异常作业值班人员每个工作日9:00-17:00必须每隔一段时间(10-15分钟之内)看下ETLMONITOR监控窗口是否有failed的脚本错误提示或其它异常
14、提示。具体操作如下:1. 打开桌面上的ShortcuttoETLMonitor.jar程序,datasource输入etldb,用户名密码输入etlauto,etlauto。2. 查看是否有failed的脚本错误提示或其它异常提示。若有发现,通知值班负责人,找到原因后通知客户,并记录异常到异常情况登记及处理单YYYYMMDD.doc»中。1.3.3Job状态是否正常值班人员每个工作日9:0017:00必须每隔一段时间(10-15分钟之内)看下ETLMONITOR监控窗口是否有failed的脚本错误提示或其它异常提示。具体操作如下:1打开桌面上的ShortcuttoETLMonitor
15、.jar程序,datasource输入etldb,用户名密码输入etlauto,etlauto。2查看是否有failed的脚本错误提示或其它异常提示。3若有发现,通知值班负责人,找到原因后通知客户,并记录异常到异常情况登记及处理单YYYYMMDD.doc»中。1.3.4数据日期的转换作业完成时间(CTLALL的时间)值班人员必须每个工作日下午13:30之前看下etljobctlall是否完成,记录完成时间。具体操作步骤如下:1.到4服务器目录下查看当日日期的ctlall的日志时间。如果在13:30还未完成,通知值班负责人并一同查找原因,通知客户,并记录异常到异常情况
16、登记及处理单YYYYMMDD.doc»中。1.3.5监控窗口是否存在长时间running或者pending的作业值班人员每个工作日9:0017:00必须每隔一段时间(10-15分钟)看下ETLMONITOR监控窗口是否有。具体操作如下:1打开桌面上的ShortcuttoETLMonitor.jar程序,datasource输入etldb,用户名密码输入etlauto,etlauto。2.看监控界面是否有很长时间都处于pending或running状态的脚本若发现有一些脚本很长时间都处于pending或running状态的脚本。若有发现,通知值班负责人,找到原因后通知客户,并记录异常到
17、异常情况登记及处理单_YYYYMMDD.doc»中。1.3.6上日ALLDON耽态值班人员必须每天9:00看下上日alldone的时间。1.到4服务器目录下查看上一日期的alldone的日志时间。若有发现异常情况,通知值班负责人,找到原因后通知客户,并记录异常到异常情况登记及处理单YYYYMMDD.doc»中1.3.7磁带空间是否足够值班人员必须在每天11:50之前查看磁带是否有足够的空间,以便数据备份需要。具体操作步骤如下:1.开始>程序>netvaultmediamanagent,查看磁带的使用情况2,重点查看L4_FS_ETL_SRC_G
18、1L4_FS_ETL_SRC_G2,L4_C旧_DAILY_DIC_G1,L4_NV_DB_G1,L4_NV_DB_G2,L4_TD_EBM_G1,L4_TD_EBM_G2.永久备份的磁带空间是使用情况。若发现磁盘满的情况,通知值班负责人和客户,并及时记录到异常情况登记及处理单YYYYMMDD.doc»中。1.4异常处理异常处理工作由每日值班负责人来主导,和每日值班人共同完成。每日值班人员要详细记录下整个处理过程。异常处理流程如下:1. 找到问题原因,确定好处理方案。2. 通知值班负责人,通知客户,说清楚问题及处理办法。3. 得到客户授权,处理异常。1.5备份数据仓库生产运行系统每天
19、生产运行结束后需要备份源数据、运行脚本、日志、数据库等进行备份,备份到磁带库进行存储,有永久和没日循环两种方式;备份方式是通过automation调度机制调度脚本来触发netvalut进行备份工作。1.5.1前一天备份耗时值班人员必须每天9:40检查上日整个备份开始到结束的时间,具体操作步骤如下:1, 打开数据库sqlassistant。2, 输入如下命令:sela1.durationfrom(seletl_system,min(starttime)(timestamp(O)asstart_time,max(endtime)(timestamp(O)asend_time,(end_time-s
20、tart_time)hourtosecond(O)asdurationfrometlauto.etl_job_logwherereturncode='O'andtxdate='2009-11-05'/*改成相应的数据日期*/andetl_system='BAK'andetl_systemnotin('dqc')groupby1)al如果发现时间很长,需要通知值班负责人进行分析,找到原因后通知值班负责人和客户,并及时记录到异常情况登记及处理单YYYYMMDD.doc»中。1.6运维日志运维值班人员需每天做运维日志,以便随时查看系统的运行状况。根据4服务器每日值班目录下的兴业银行数据仓库运维日志20090921.xls来进行每日值班检查工作,并做如实填写。如发生了异常情况,请及时填写异常情况登记及处理单YYYYMMDD.doc»2. 定期维护2.194,95服务器系统定期重启由于批处理程序长期运行,程序
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- Unit6 Rain or Shine SectionaA Pronunciation说课稿2024-2025学年人教版(2024)七年级英语下册
- 课题3 物质的转化与应用说课稿-2025-2026学年初中化学仁爱科普版2024九年级下册-仁爱科普版2024
- 2025年中考数学试题分类汇编:锐角三角函数(10大考点62题) (第1期)原卷版
- 2025年中考化学试题分类汇编:坐标图像题(第2期)解析版
- A A hard choice (Viewing and listening)教学设计-2025-2026学年初中英语沪教版五四学制2024七年级下册-沪教版五四学制2024
- 第六单元 平行四边形的认识 (教学设计)-2023-2024学年四年级下册数学西师大版
- 2025年四川高考地理试题及答案详解
- 七年级道德与法治下册 第2单元 做情绪情感的主人 第5课 品出情感的韵味 第2框 在品味情感中成长说课稿 新人教版
- 四年级语文下册一二单元测试题(附答案)
- 2025年全国高压电工作业人员操作证考试题库(含答案)
- 2025新《安全生产法》知识考试题库及答案
- 2025年苏教版(2024)小学科学一年级上册(全册)教学设计(附目录 P137)
- 《铁路运输安全管理》课件-第一章 铁路运输安全管理概述
- 高频变压器项目商业模式分析报告
- 杜邦安全培训课件
- 中职生开学第一课安全教育
- 16949工程变更课件
- 国宝文物运送活动方案
- 2024年德州市第二人民医院招聘备案制工作人员笔试真题
- 多重耐药菌感染防控与管理
- 护理沟通与服务课件
评论
0/150
提交评论