版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021/3/91Kettle 培训培训 飞牛运营部商务智能朱胜2021/3/92Kettle 培训内容nKettle 功能与产品介绍nKettle 控件介绍nKettle 案例演示nKettle 调度2021/3/93Kettle介绍nKettle 是一款开源的、元数据驱动的ETL工具集,是开源 ETL 工具里功能比较强大的一个。 nKettle 是”Kettle E.T.T.L. Envirnonment”只取首字母的缩写,这意味着它被设计用来帮助你实现你的ETTL 需要:抽取、转换、装入和加载数据;翻译成中文名称应该叫水壶,名字的起源正如该项目的主程序员MATT 在一个论坛里说的哪样:希
2、望把各种数据放到一个壶里然后以一种指定的格式流出。2021/3/94Pentaho 产品线nPantaho产品线nReporting:可集成Jasper和BIRTnData Mining:WekanAnalysis:MondriannDashboards:nData Integration:Kettle2021/3/95Kettle 家族nKettle 5.0家族目前包括几个产品:Spoon转换(transform)设计工具 (GUI方式) Pan转换(transform)执行器 (命令行方式) Kitchen工作(job)执行器 (命令行方式)Carte 基于Jetty的,监听Http请求E
3、ncr 用户加密密码2021/3/96Kettle 四大家族n Spoon允许你通过图形界面来设计ETL转换过程(Transformation)和作业。例如,从一个SAP系统抽取数据,并把这些数据存储到一个文件里的转换任务如下:n Pan允许批量运行由Spoon设计的ETL转换(例如使用时间调度器)。Pan是一个后台执行的程序,没有图形界面。nKitchen允许批量使用由Chef设计的任务(例如使用一个时间调度器)。KITCHEN是一个后台运行程序。Job和Transformation的差别:Transformation专注于数据的ETL,而Job的范围比较广,可以是Transformatio
4、n,也可以是Mail、SQL、Shell、FTP等,甚至可以是另外一个Job。 2021/3/97Kettle 的安装n要运行此工具你必须安装Sun 公司的JAVA 运行环境1.4 或者更高版本,相关资源你可以到网络上搜索JDK 进行下载n绿色免安装,解压即可用。n在不同的平台上运行Spoon 所支持的脚本:nSpoon.bat: 在windows 平台运行Spoon。nSpoon.sh: 在Linux、Apple OSX、Solaris 平台运行Spoon。2021/3/98Kettle转化功能介绍 1nKettle 中有两种脚本文件,transformation (.ktr)和 job(.
5、kjb),transformation 完成针对数据的基础转换,job 则完成整个工作流的控制。n所有功能支持控件化,使用简单n支持多样化数据源类型:n基本的文本文件nAccess、Excel、XML、Property文件格式nMDX查询语言、 Cube文件、Streaming XML数据流n自动产生空记录或者行n从XBase类型文件(DBF)读取数据n关系型数据库n获取系统信息如文件名称、系统时间等2021/3/99Kettle转化功能介绍 2n特殊目标数据源支持n把数据写入到Cuben把数据写入XMLn支持多种查询n调用数据库存储过程n基本的数据库查询n判断表以及列、操作系统文件是否存在n
6、从URL接收查询n使用Web服务查询信息n使用数据流中的值作为参数来执行一个数据库查询n流查询:从转换中其他流里查询值n转换功能n值映射、分组、去重、拆分字段、行列转换n复制行2021/3/910Kettle转化功能介绍n支持的脚本nJS脚本nSQL脚本n正则表达式n支持渐变维度更新n批量加载:nGreenplum Bulk LoadernOracle Bulk LoadernMSSQL Bulk LoadernMYSQL Bulk LoadernPostgreSQL Bulk Loadern支持分区表和集群2021/3/911Kettle作业功能介绍 1n可以执行操作系统命令和操作:nPin
7、g 主机n写日志n发送邮件n从POP Server获取邮件并保存在本地n比较文件夹、文件n创建、复制、移动、删除、压缩文件n从HTTP获取或者上传文件n操作延迟等待2021/3/912Kettle作业功能介绍 2n判断文件是否存在n执行JavaScript、SQL、Shell脚本n支持安全FTP获取、上传文件n删除远程文件n支持SSH2上传下载2021/3/913数据库连接类型和访问类型n支持的数据库连接类型,截图如下,n有些数据库类型需要完善jar包,以确保数据库能够正确连接2021/3/914访问类型n数据库访问类型支持如下几种:nJDBCnOCInODBCnJNDI2021/3/915K
8、ettle实施步骤n双击运行 kettle 文件夹下的 Kettle 文件,出现 kettle 欢迎界面。n创建资料库(可省略)n创建数据库连接n创建转换n创建Jobs,进行流程化控制2021/3/916Kettle案例n案例描述:n把文本文件中的格式化数据导入到oracle数据库的指定表中2021/3/917n打开Kettle 选择没有资料库2021/3/918创建数据库连接n创建数据库连接2021/3/919n输入数据源连接名称,选择数据源类型和访问方式2021/3/920n输入服务器主机名和数据库名称2021/3/921n输入数据表空间和索引表空间名称2021/3/922n输入用户名和密
9、码2021/3/923n测试数据库连接2021/3/924n数据源建立成功2021/3/925n右击转换,新建出现如下界面创建转换2021/3/926n从左侧输入栏目中选择文本文件输入控件,拖拽到右侧工作空间中2021/3/927n从输出栏目拖拽表输出控件到左侧工作区2021/3/928n选中两个控件,在其中一个控件上右击,选择新建节点连接2021/3/929n选择起始步骤2021/3/930n双击文本文件输入控件,进行编辑2021/3/931n文本文件“内容”标签编辑2021/3/932n点击获取字段按钮,可自动获取字段名称,然后编辑相关属性,预览记录。2021/3/933n编辑输出表控件属
10、性2021/3/934n然后点击绿色按钮,启动转换2021/3/935n保存转换2021/3/936n可以查看执行结果2021/3/937n可以加入执行SQL脚本2021/3/938在核心对象中有很多控件可用来实现数据的ETL功能。2021/3/939创建作业n从左侧通用栏目中拖拽两个控件2021/3/940n双击Transformation 1进行编辑2021/3/9412021/3/942n保存保存jobs后执行任务后执行任务2021/3/943Kettle 调度n利用Kitchen工具实现作业的调用nKitchen.bat /file:D:job_name.kjb /level:Basic2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 素养导向的高考数学新题型2课件-2025届高三数学二轮复习
- 税务局考试申论题目及答案
- 2026二年级数学下册 数学广角自主学习
- 2026五年级数学上册 小数乘法的价值引领
- 2026五年级数学上册 小数乘法的文化传承
- 2026九年级上语文孤独之旅人物形象分析
- 供应商质量追责制度
- 管理评审程序试题及答案
- 人格权合理使用制度
- 造价咨询考核奖惩制度
- 2026年安庆医药高等专科学校单招职业适应性测试题库含答案详解(b卷)
- 湖北省云学名校联盟2025届高三年级2月联考物理(含答案)
- 2026年安徽工贸职业技术学院单招职业技能考试题库及答案详解(基础+提升)
- 2026云南德宏州瑞丽市人民法院招聘聘用制书记员2人考试参考试题及答案解析
- (一模)2026年深圳市高三年级第一次调研考试数学试卷(含官方答案及解析)
- 2026年亳州职业技术学院单招职业技能测试题库及答案详解(基础+提升)
- GB/Z 149-2026天然食品成分使用指南
- 2026年春人教PEP版(新教材)小学英语四年级下册教学计划及进度表
- 高速公路危化品救援课件
- 除颤仪使用课件
- 2026年采购经理岗位面试指南与经典问题集
评论
0/150
提交评论