版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ETL平台案例实战Lab1任务开发和调测1.1通过插件配置完成一个简单的ETL开发.......................................................1.2手动本地方式运行ETL...................................................................................1.3跟踪本地方式运行日志..........................................................................1.3强制停顿本地方式任务实例.........................................................................1.4手动远程方式运行...................................................................................1.5跟踪远程实时运行日志................................................................................1.3强制停顿远程方式任务实例.........................................................................1.4使用JS插件动态获取时间变量.....................................................................1.4添加注释……….....................................................................1.6小结(Lab1)..............................................................................................Lab2流程设计和调测2.1创立一个单层流程......................................................................................2.2创立一个多层的流程.................................................................................2.3增加一个数据校验点2.4增加一个数据校验点2.5增加异常告警点2.6小结(Lab2)..............................................................................................Lab3流程监控2.1增加一个监控视图......................................................................................2.2通过监控视图查看流程执行状态..............................................................2.3查看流程运行时间记录............................................................................2.3查看校验点输出结果….............................................................................2.3定位异常................................................................................................2.3重处理任务................................................................................................2.6小结(Lab3)..............................................................................................Lab1任务开发目标:将表从数据源库复制到本地库。登陆进入ETL平台,切换到“设计〞场景下;展开目录,定位到目录“09测试〞下“lab〞子目录;右键单击“lab〞子目录,选择“新建任务〞,弹出任务设计视图,按Ctrl+S或工具栏上的保存按钮进展保存,命名为“T-lab01〞,按确定后确认保存成功;切换左侧TAB页签至“插件〞栏下,依次从“输入〞文件夹拖入“表输入〞插件,从“表输出〞文件夹中拖入“表输出〞插件;选中右侧设计区中“表输入〞插件实例,按住shift键同时按下鼠标连接至“表输出〞,再次保存;双击“表输入〞插件,进入插件参数配置界面。点击“新建〞按钮新建出源表所在的数据库连接,假定源表在166的crm_inter用户下:将数据库连接取名为LAB(166_crm_inter)点击“测试〞,确认配置正确。点击“确定〞返回,在当前页面,再次点击“数据库连接〞后的“新建…〞按钮,按6同样的方法新建出目标库,这里假定是134的eda用户下,连接名取为“LAB(134_eda)〞返回到“表输入〞插件配置表单。将名称改为带业务含义:“主产品实例源表〔562〕〞,数据库连接选择“LAB(166_crm_inter)〞,在SQL域填入以下容:SELECTPRD_INST_ID,PRD_INST_NAME,PRD_INST_DESC,PRD_INST_TYPE_ID,SERVICE_NBR,PHYSICAL_NBR,CUST_AGREEMENT_ID,REGION_ID,SERV_REGION_ID,E*CH_ID,RES_ZONE_ID,URBAN_FLAG,URGE_CD,PRD_INST_STAS_ID,PAY_CUST_ID,USE_CUST_ID,OWN_CUST_ID,CRT_DATE,EFF_DATE,E*P_DATE,MOD_DATE,EFF_STATE,LATN_ID,PRD_ID,OFR_ID,PLETE_DATE,SERV_NUM,INSTALL_ADDR,STAND_ADDR,ORDER_ID,CONTRACT_ID,EVOLUTION_PTY_ID,ACCT_ID,USER_BILL_ID,USER_TYPE_ID,USER_KIND_ID,ACCEPT_DATE,ACCEPT_EMPEE_ID,ACCEPT_TYPE_COD,INSTALL_DATE,INSTALL_EMPEE_ID,SUPP_ADDR_DESC,SEND_STATUS,LAST_ORDER_ID,DEV_EFP_DATE,DEV_E*P_DATE,BESP_DATE,BESP_SYMBOL,BILL_DATE,BILL_*CHG_ID,PAY_CYCLE,USER_ACCOUNT,IF_PREPAY,IP_FLAG,BASIC_STATE,E*T_STATE,VOICE_AOC_TYPE,DATA_AOC_TYPE,ISMP_AOC_TYPE,SMS_AOC_TYPE,USE_CUST_NAME1,USE_CUST_NAME2,USE_CUST_NAME3,BUSI_NAME,USE_ADDR,IF_IVPN,LOAD_DATE,LOCAL_PARTITION_IDFROMtb_prd_prd_inst_d_562WHERErownum<=100000这里表示从源表中复制所有字段,暂取其中的10万行记录;点击“预览〔P〕〞按钮进入数据查看窗体,以此验证SQL配置正确性;在SQLPlus或PL/SQLDeveloper过语句创立出目标表:createtabletb_prd_prd_inst_d_562asselect*fromcrm_inter.tb_prd_prd_inst_d_562edwwhere1=2;点“确定〞后返回,双击“表输出〞,按以下图输入配置容,切换至“数据库字段〞,点击“获取字段〞,所有的默认映射关系已按顺序自动建立。1.2手动启动本地执行双击“主产品实例接口表(562)〞插件实例翻开参数编辑状态,基于本地机器性能和网络考虑,临时修改“提交记录数量〞为100,表示每100条提交一次,便于看到演示效果;通过点击任务设计区左上角启动按钮,弹出“执行任务对话框〞;选择“本地执行〞;选中“执行前清理日志〞,选择“详细日志〞级别;点击“启动〞。1.3实时跟踪本地方式运行实例的执行情况启动一旦生效,可以看到以下几类执行信息:1、点击设计区下方“执行结果〞栏“执行历史〞页签中左上角刷新按钮,可看到当前正在运行的任务实例,以start状态表达,每执行一次这里就会产生条记录;2、设计区下方“执行结果〞栏“日志〞页签中显示的是当前实例的实时日志;3.设计区下方“执行结果〞栏“步骤Metrics〞显示的是当前任务的步骤信息、记录数信息,动态刷新;同时通过语句在SQLPlus或PL/SQLDeveloper中查询到目标端的插入记录数;selectcount(*)fromtb_prd_prd_inst_d_562t4、任务执行期间,点击任务页签上的叉号,关闭当前任务设计窗体,通过资源库目录点击再次翻开该任务,查看“执行历史〞、“日志〞和“步骤Metrics〞页签容,刷新到最新状态,可看到当前任务仍处于执行状态,但日志和步骤信息清零;稍等片刻后,日志出现“任务完成〞信息。上述过程说明,在本地执行时,关闭当前窗体并不关闭任务的执行。退出平台时,手动方式启动的本地执行实例会自动停顿。5、设计区下方“执行结果〞栏“执行历史页签〞中,点击已运行完状态为end的实例,在最底下可看到日志信息,处于start状态的日志则没有。1.4手动启动远程执行点击“当前对象〞,右击“子效劳器〞文件夹“新建〞,进入“子效劳器对话框〞配置界面;配置如下参数:配置好的效劳器将在远程执行对话框中可选;双击“主产品实例接口表(562)〞插件实例,修改“提交记录数量〞为10000;通过点击任务设计区左上角启动按钮,弹出“执行任务对话框〞;选择“远程执行〞及效劳器;点击“启动〞。实时跟踪远程方式运行实例的执行情况启动生效后,会自动弹出运行效劳器上的实例监控页签,展开任务目录,可以看到当前任务处于Running状态,并有记录数实时提示;点击“刷新〞按钮可以实时看最新的状态信息;选中任务〞T-lab01〞中的一个步骤,可在下方看到实时输出日志;通过关闭叉号关闭当前监控页:4、切换至“当前对象〞下,通过子效劳器右键菜单“监控〞,再次激活出“监控〞页签;5、点击设计区下方“执行结果〞栏“执行历史〞页签中左上角刷新按钮,可看到当前在远程运行的实例同样存有记录,以start状态表达;2、设计区下方“执行结果〞栏“日志〞页签中可以看到远程实例的启动时刻信息;“步骤Metrics〞无法显示远程执行的任务的步骤信息;3、退出平台,重新登录,观察正在运行的流程实例是否终止。Lab2流程设计目标:串联Lab1中完成的任务和一个外部程序,形成一个简单可执行的流程。双击Lab1中的任务实例翻开,通过另存为形成lab目录下的副本,存为“T-lab02-01〞,在Lab2的后面将会引用并做少量调整;右键lab文件夹,选中“新建流程〞,新建出一个流程,ctrl+s存为“J-lab02-01〞;左边资源页签切换至“插件〞,拖入“通用〞->“START〞插件,切换至“资源库〞,选中LAB1中的案例;切换回“插件〞页签,拖入“脚本〞->“shell〞插件;连线成如下形式;配置shell1参数容,使其指向我们的一个外部程序,参数暂时制定常量值;修改节点名称成如下形式,便于理解。现在一个流程已经设计完成。下面我们开场流程的测试。为了快速看到效果,将第一个任务的记录数限制到10万行;点击启动按钮,由于脚本在远程主机效劳器上,因此只能选择“远程执行〞;启动后,自动弹出的效劳器监控中心中,可以找到对应的流程和任务记录:同样,在执行结果栏中,刷新后能看到执行记录:右键设计区的任务实例:可以看到下方“执行结果〞区域有该任务的执行记录,每运行一次产生一条记录;再次查看监控中心日志:待完成后,通过SQL语句查询结果表数据:select*fromlab_ft_prd_instt2.2创立一个多层的流程.................................................................................13目标:我们将引用Lab2.1中的流程,模拟全省数据的处理流程。先并行做完3个地市的数据处理后,再做下一步的环节。单本地网做接口表抽取、根底集市表数据整合,全省做完这两步后,再进展根底集市表向汇总集市表的生成。双击T-lab02-01中的任务实例翻开,通过另存为形成lab目录下的副本,存为“T-lab03-01〞,在该例子中我们将对其做少量调整;翻开“T-lab03-01〞的“任务设置〞选项;通过“参数〞页签增加p_latn变量,使其成为可被复用的任务;修改任务名称如下:修改任务配置容,使其中的562以变量形式替换:现在可以测试该任务,远程方式启动,在p_latn参数中输入562:通过弹出的效劳器监控页签确认任务正确运行完毕;将“J-lab02-01〞另存为“J-lab03-01〞,修改其中的结点名称及配置项信息:增加流程“J-lab03-01〞的预设参数:现在我们可以测试一下流程的执行情况,仍然选择远程方式启动。该流程需输入日期和本地网两个参数。通过弹出的效劳器监控页签确认任务正确运行完毕;新建一个流程,保存为“J-lab03-02〞。在其中重复拖出三份J-lab03-01〔可配置好一个后复制〕,并做如下连线,模拟并行方式运行三个地市的数据:其中J-lab03-01实例的配置参考,564,566规则一致;设定并行方式运行:连线变成虚线即为生效。预设“J-lab03-02〞自身的流程参数:现在我们可以测试一下“J-lab03-02〞的运行情况:发现运行出错,其中除了562运行正确外,其它都是错,原因是接口目标只建了562的。补充其它两表的建立:createtabletb_prd_prd_inst_d_564asselect*fromcrm_inter.tb_prd_prd_inst_d_564edwwhere1=2;createtabletb_prd_prd_inst_d_566asselect*fromcrm_inter.tb_prd_prd_inst_d_566edwwhere1=2;再运行一次,确认成功后,通过SQL语句统计结果信息:selectlatn_id,count(*)fromlab_ft_prd_instgroupbylatn_id;新建一个流程,命名为“〞保存,拖入以下结点再保存;J-lab03-02作为这里的一个子流程;为汇总脚本程序录入信息:向“J-lab03-02〞子流程传递参数:为“J-lab03-03〞当前流程预设参数:到此,我们可以对J-lab03-03进展测试,运行完毕后,可以执行以下语句确认结果:selectlatn_id,count(*)fromlab_dm_serv_numgroupbylatn_id;Lab3流程监控新建一个监控视图右键视图设置:重命名为LAB01,从资源库中拖入我们已设计好的流程“J-lab03-03〞,通过画框和颜色设置功能调整外观;保存并发发布监控视图:切换到“监控〞场景下,从左侧“监控〞目录定位到“LAB01〞,双击翻开。可以看到绿色的状态脚标,这是我们之前运行成功的记录,由于监控周期设置为一天,显示的一天能找到的最新的实例状态。双击“J-lab03-03〞流程,翻开流程明细;可以看到,其中的子流程和脚本任务都是运行正常的;并且在下方运行结果中可以看到运行的开场时间、完毕时间、耗时。再双击“J-lab03-03〞流程中的“J-lab03-02〞流程,查看子流程明细;现在重启整个流程,查看各流程和任务的处理状态;在“J-lab03-03〞流程页签中,点击左上角执行按钮,输出参数20101021,进入执行状态;切换至监控视图页,逐层查看各层的状态,看是否与以下图片符合:稍等片刻,所有结点又会变成成功的绿色图标。现在我们演练一下流程报错的情况,查看各流程和任务的处理状态;通过SQL语句删除掉其中一个中间表:droptabletb_prd_prd_inst_d_566;在“J-lab03-03〞流程页签中,点击左上角执行按钮,输出参数20101021,进入执行状态;切换至监控视图页,逐层查看各层的状态,看是否与以下图片符合:现在我们演练一下重运行处理的操作。新增加一个数据校验点.转到〞设计〞场景下,翻开“J-lab03-03〞流程,通过〞资源库〞下,增加一个Gereral->DataVerify插件。首先,我们希望校验结果表中3个地市的数据是否全部到位,下面将在拖出的校验插件上配置这样的规则项:双击校验插件,重命名名称为“资料结果汇总校验〞,单击“添加规则〞按钮;在弹出的表单中重命名为“数据完整性校验〔全省数据是否到位〕〞;进展规则SQL项的配置:在ETL平台的校验设计体系下,所有的校验被抽象成一双成对的数据集比对过程,这两个数据集分别由两个自定义的SQL查询语句来驱动,并通过匹配键值自动进展数据关联,对每一条结果集记录判断是否通过按预设规则。同时,输出结果可以按照自定义的表头设定显示,形成一直观的小型报表。校验支持多记录、多维度、多度量指标、嵌变量。该例中,校验对象值是当前数据中不同本地网个数,参考对象值为常量3,不存在匹配的维度字段,由于统一设计的考虑,需要虚拟出一个’*’字段,用作校验对象与参考对象的匹配键,并取别名ColId。校验对象:SELECT'*'asColId,count(DISTINCTlatn_id)aslatn_countFROM
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 恶性肿瘤患者围化疗期心理干预
- 2026年全国各地中考试题分类古诗词阅读及答案
- 零售药店医疗器械各岗位培训考核试题及答案
- 2026年山东省栖霞市高三历史上册期末考试自测卷附完整答案【考点梳理】
- 2026年贵州省福泉市高三历史下册期末考试测试卷附完整答案(夺冠)
- 2026年辽宁省调兵山市高三历史下册期末考试考试卷含答案(预热题)
- 2026年浙江省余姚市高三历史下册期末考试检测卷及参考答案(基础题)
- 2026澳大经济学面试题及答案
- 2026安全运维岗位面试题及答案
- 保安员岗前安全培训考核试卷含答案
- 2026届浙江省普通高等学校招生全国统一考试仿真历史试题(含答案)
- 安徽省A10联盟2026届高三5月最后一卷历史试卷(含答案及解析)
- 智慧护理:护理创新的实践探索
- 2025-2030年老年交友相亲行业深度调研及发展战略咨询报告
- 2026年上海市春考语文试卷及答案
- 山东省青岛市2026年中考英语试题
- 2026年普通动物学通关试题库及参考答案详解【达标题】
- 20kV及以下配电网工程预算定额(2022版)全5册excel版
- 《智慧旅游运营实务》 课件全套 模块1-6 智慧旅游发展认知 - 智慧旅游规划指引
- 第十章食品添加剂
- 毕业设计-贯通测量方案设计
评论
0/150
提交评论