kettle实现表同步_第1页
kettle实现表同步_第2页
kettle实现表同步_第3页
kettle实现表同步_第4页
kettle实现表同步_第5页
免费预览已结束,剩余3页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、同步数据常见的应用场景包括以下 4 个种类型:?只增加、无更新、无删除?只更新、无增加、无删除?增加+更新、无删除?增加+更新+删除1只增加、无更新、无删除对于这种只增加数据的情况,可细分为以下 2 种类型:1)基表存在更新字段。通过获取目标表上最大的更新时间或最大 ID,在表输入”步骤中加入条件限制只读取新增的数据。获取最大ID表输入表输出这里要注意的是,获取最大更新时间或最大 ID 时,如果目标表还没有数据,最大值会获取不了。其中的一个解决方法是在获取最大 ID”步骤的 SQL 中,加入最小日期或 ID 的联合查询即可,如:SELECTMAX(ID)FROM(SELECTMAX(ID)AS

2、IDFROMT1UNIONALLSELECT0ASIDFROMDUAL)2)基表不存在更新字段。通过插入/更新”步骤进行插入。测试表输入2插入/更新插入/更新步骤选项:2只更新、无增加、无删除通过更新”步骤进行更新岂更新更新选项:区别是插入/更新步骤”中的选项,去掉不执行任何更新”的勾选:测试赛输入2插入;更希4增加+更新+删除这种数据同步情况,可细分为以下2种情况:1)源库有表保存删除、更新和新增的信息。通过条件判断,分别进行插入/更新”和删除”即可,如下图所示2)源库没有保存增删改信息Kettle提供了一种对比增量更新的机制处理这种情况,可通过含并记录”步骤实现,该步骤的输入是新旧两个数据

3、源,通过关键字进行数据值比对,对比结果分为以下4种类型:Identical”关键字在新旧数据源中都存在,域值相同“changed”关键字在新旧数据源中都存在,但域值不同“new”:旧数据源中没有找到关键字“deleted”新数据源中没有找到关键字两个数据源的数据都进入下一步骤,上述4种结果类型作为输出表的标志字段进行保存。以下为示例:?源数据库测试脚本createtablek1(f1varchar2(200),f2varchar2(200)truncatetablek1;insertintok1(f1,f2)values(1,11);insertintok1(f1,f2)values(2,22

4、);insertintok1(f1,f2)values(5,5);commit;?目标数据库测试脚本createtablek1(f1varchar2(200),f2varchar2(200)truncatetablek1;insertintok1(f1,f2)values(1,1);insertintok1(f1,f2)values(2,2);insertintok1(f1,f2)values(3,3);insertintok1(f1,f2)values(4,4);commit;合并过程如下:执行后,查询K1_TEST结果如下:222changed可以看到,该结果表的BZ字段保存了更新、删除、

5、新增的记录信息,通过条件分支即可分别对这些记录进行相应的处理。条件”选项:deleteddeletednev/changed空操诈(什么也不卿K1SOURCEk?T二R:FT含并记录”步骤的选项:%合并行注氏;TARGETK1_TESTj/刑除z步骤名称合并记聂旧数寮源:TARGET新放猿源:SOURCE标志字施b2匹配的关建室1数森学照:#关注字座堆数据字段1FL1F12F2表取关键字段(IQ宗取直手段(V)I镉一)|-0插入.,更辐SOURCE台并记录Y 海行=1旦1J弟喀称如华FieldnametoswitchBZ*UsestringcontainEcomparison3Casevalu

6、edatatypeString*CasevalueconversionmaskCase-v占IUEde-cima!symbolCasevaluegrouprngsymbolCasevaluer户#VaheTargetstep1deleted 胭跄2new播入/更新3changed 插入/更新Defaulttargetstep交提作(什么也不散1确定 2)耽削Q5测试效果Kettle提供了可视化的设计工具,基本上可通过拖拉配置的方式实现以上4种类型的数据同步,操作上相对较为简单。数据同步的性能与源数据库、目标数据库以及执行Kettle转换操作的主机相关,在笔者的测试环境上(源数据库和目标数据库部署在双核CPU/4G内存的PC机上、执行Kettle转换操作的主机配置为双核CPUx2/4G内存,JVM内存堆栈为256M)、最后一种类型的数据同步,15w的数据,在3分钟内可以完成。揖行空=b*1a.巡籍反申呢栩 w耳*A4防取喧项;用电1分不定,0Q0000evt2*Hft1.741201W3旧“601M2 访00Q吕川潮)“

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论