




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、a,1,KETTLE基本知识 主讲:韦汉靖,a,2,简介,Kettle是一款国外开源的etl工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 ETL是数据抽取(Extract)、清洗(Cleaning)、转换(Transform)、装载(Load)的过程。,a,3,内容,一、KETTLE的要求环境(JDK版本)、安装、基本操作。 二、KETTLE的组件的类型基本说明(作业与转换) 三、基于表对表的同步 四、基于文件到表的同步 五、基于表到文件的同步 六、JAVASCRIPT的基本应用 七、文件FTP下载、上传。 八、作业调用作业、转换。 九
2、、KETTLE自带例子 十、KETTLE输出日志说明 十一、启动脚本说明。,a,4,相关网站信息, ,a,5,KETTLE的要求环境(JDK版本)、安装、基本操作,KETTLE要求先安装JDK1.5版本或以上svn 下载svn:/ 无需安装下载后直接运行spoon.bat即可,a,6,KETTLE的要求环境(JDK版本)、安装、基本操作,a,7,KETTLE的要求环境(JDK版本)、安装、基本操作,a,8,KETTLE的要求环境(JDK版本)、安装、基本操作,a,9,KETTLE的组件的类型基本说明(作业与转换),Kettle中有两种脚本文件,transformation(转换,后缀为.ktr
3、)和job(作业, 后缀为.kjb),transformation完成针对数据的基础转换,好比工厂里的生产流水线,每个组件相当于一个员工;job则完成整个工作流的控制,好比工厂里的管理。 如果用记事本打开文件可发现转换和作业都是xml类型文件。,a,10,KETTLE的组件的类型基本说明(作业与转换),作业:分串行执行和并行执行,串行执行是先执行完其中一条线再执行另一条线,并行是两条线同时执行,同一条线上的两个步聚会先执行前面的再执行后面的,每个步骤执行结果分两种:true(成功)/false(失败),根据返回结果可以控制流程走向。,a,11,KETTLE的组件的类型基本说明(作业与转换),作
4、业流程图说明,a,12,KETTLE的组件的类型基本说明(作业与转换),转换:一开始所有步骤同时运行,记录会从最前端的步骤向后传递,传递到相应步骤则该记录被该步骤作相应处理,处理完成再把记录往后传递,记录传递分复制和分发两种模式。,a,13,KETTLE的组件的类型基本说明(作业与转换),复制:把一份数据复制成多份,后面步骤各占一份。 分发:把一份数据平均分配给后面步骤。,a,14,KETTLE的组件的类型基本说明(作业与转换),在转换组件上右键显示输入字段(显示输出字段)可以查看前面步骤流过来的记录字段情况和该字段是后面步骤传递的字段信息情况。,a,15,基于表对表的同步,表对表同步是最基本
5、的同步方式之一 实现步骤: 一、建立源库连接和目标库连接 二、使用表输入组件进行源表数据读取 三、对记录进行适配整理 四、使用表输出组件输出到目标表,a,16,基于表对表的同步,新建一个转换:文件新建转换,a,17,基于表对表的同步,a,18,基于表对表的同步,a,19,基于表对表的同步,a,20,基于表对表的同步,a,21,基于文件到表的同步,新建一个转换 流程:从文件读取记录插入到数据库中,a,22,基于文件到表的同步,a,23,基于文件到表的同步,a,24,基于文件到表的同步,a,25,基于表到文件的同步,新建一个转换 实现从表里读取记录生成文件,a,26,基于表到文件的同步,a,27,
6、基于表到文件的同步,a,28,基于表到文件的同步,a,29,JAVASCRIPT的基本应用,JAVASCRIPT基本语法: var jsStr = “hello kello”; /定义一个字符串变量 var javaStr = new java.lang.String(“java String ”); /java.lang.String实例 writeToLog(“m”, str); /打印字符串到日志输出 var num = 1; /定义一个整型 var arr = new Array(); /定义一个数组 无任何元素 arr.push(“添加一个元素到数组未位”); var arr1= n
7、ew Array(3, “FTP补采”); /定义一个数组,a,30,JAVASCRIPT的基本应用,If else 语句 var bool = true; if(bool) /bool值为true Alert(“正确”); else /bool值为false Alert(“错误”); ,a,31,JAVASCRIPT的基本应用,for语句 var arr = new Array(1, “2”, “this is string”); for(var i=0; iarr.length; i+) if(arri = 2) Alert(“the value is ”+ arri); ,a,32,JA
8、VASCRIPT的基本应用,方法定义 var str = “whj”; /全局变量 function sayHello(name) /带一个参数的方法 if(name = null) return “hello “ + str; else return “hello “ + name; /返回一个字符串 writeToLog(“m”, sayHello();/方法调用,a,33,JAVASCRIPT的基本应用,异常处理 trycatch try var value = 100/0; catch(e) throw new java.lang.Exception(“除数不能为0:+ e); 异常处
9、理通常是防止未知错误产生所采取的处理措施。异常处理的好处是你不用再绞尽脑汁去考虑各种错误,这为处理某一类错误提供了一个很有效的方法,使编程效率大大提高。,a,34,JAVASCRIPT的基本应用,a,35,文件FTP下载、上传,作业:FTP下载 从FTP上下载相应文件到指定目录下,a,36,文件FTP下载、上传,a,37,文件FTP下载、上传,a,38,文件FTP下载、上传,作业:FTP上传 上传本地文件到相应FTP指定目录上,a,39,文件FTP下载、上传,a,40,文件FTP下载、上传,a,41,作业调用作业、转换,文件新建作业 作业可以调用作业,这样方便流程控制。,a,42,作业调用作业
10、、转换,a,43,作业调用作业、转换,作业也可以调用转换,a,44,作业调用作业、转换,a,45,KETTLE自带例子,菜单:文件从URL打开文件samples 也可以直接到KETTLE工具下的samples目录打开,a,46,KETTLE输出日志说明,日志输出是检查程序运行情况的重要手段,也是程序维护必不可少的环节。 KETTLE在日志输出方面也有很好的控制功能。KETTLE日志输出共分七个等级:没有日志(Nothing)、错误日志(Error)、最小日志(Minimal)、基本日志(Basic)、详细日志(Detailed)、调试日志(Debug)、行级日志(Rowlevel)。默认为基本
11、日志。,a,47,KETTLE输出日志说明,Nothing:不显示任何输出 Error:仅仅显示错误信息 Minimal:使用最小的日志 Basic:缺省的日志级别 Detailed:给出日志输出的细节 Debug:调试目的,调试输出 Rowlevel:打印出每一行记录的信息,a,48,KETTLE输出日志说明,作业日志输出说明 作业运行状态有两种:true(成功)/false(失败)。 注意:失败不代表运行异常、出错。有时只是用来控制流程的一种决策、一种手段。,a,49,KETTLE输出日志说明,程序异常退出情况,a,50,KETTLE输出日志说明,转换日志输出说明 I: 当前步骤生成的记录数(从表输入、文件读入) O:当前步骤输出的记录数(输出到文件、表) R:当前步骤从前一步聚读取的记录数 W:当前步骤向后面步骤抛出的记录数 U:当前步骤更新过的记录数 E:当前步骤处理出错的记录数,a,51,启动脚本说明,KETTLE程序启动分两种,一种是作业、一种是转换。 作业调用启动脚本: kitchen.sh( kitchen.bat) 转换调用启动脚本: pan.sh( pan.bat),a,52,启动脚本说明,kitchen.sh(span.sh)说明,a,53,启动脚本说明,Kitchen.b
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东省佛山市2024-2025学年高一下学期期末检测政治试卷
- 导游知识考试题+答案
- 大学生心理健康心得体会15篇
- 初级会计职称《初级会计经济法基础》2-1
- 无人机应用技术3.9.室内编队无人机起飞前设置(实操)
- 无人机应用技术2.9.花式表演固定翼无人机
- 北京市第十二中2025届化学高二下期末学业水平测试试题含解析
- 支教报道题目及答案大全
- 政治跨学科题目及答案
- 政治初赛图片题目及答案
- 药店营业员知识技能培训
- 胸腔镜食管癌根治术护理查房课件
- 中国电力大数据发展白皮书
- 天棚涂膜防水施工方案百度
- 初中物理一等奖教学案例 大气的压强获奖教学案例分析
- 农村垃圾清运投标方案
- 轨道交通信号工国家职业技能标准
- 贵州大方富民村镇银行股份有限公司(筹)招聘上岸提分题库3套【500题带答案含详解】
- GB/T 5470-2008塑料冲击法脆化温度的测定
- GB/T 40998-2021变性淀粉中羟丙基含量的测定分光光度法
- GB/T 31848-2015汽车贴膜玻璃贴膜要求
评论
0/150
提交评论