etl专业视频教程基础进阶实战课时kettle

上传人：环*** IP属地：四川上传时间：2022-02-12 格式：DOCX 页数：186 大小：5.29MB 积分：25 举报 版权申诉

已阅读5页，还剩181页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

1、Kettle 3.2 使用说明书目录概述71. Kettle 资源库管理71.1 新建资源库更新资源库11资源库登陆和用户管理12资源库登录和没有资源库登录的区别162.菜单栏.文件18编辑19视图21资源库21转换22作业25向导26帮助26变量262.9.1 变量使用262.9.2 变量范围2 环境变量2 Kettle 变量2 内部变量273.工具栏.283.1 转换 Transformation 工具栏283.2 工作 Jobs 工具栏294. 主对象树304.1

2、转换主对象树314.1.1 新建转换324.1.2 转换设置324.1.3 DB 连接374.1.4 Steps(步骤)404.1.5 Hops(节点连接)40 右键节点连接，可以新建和排序连接4 右键单击每个具体连接，可以编辑和删除该节点连接的属性424.1.6 数据库分区 schems424.1.7 子服务器434.1.8 Kettle 集群 schems434.2 Jobs 主对象树4..44.2.5新建 Job44设置 Job 属性45DB 连接45作业项目47子服务器475.转换对象475.1 Transform48

3、5.2 Input485.3输入495.3.1 Access Input495.3.2 CSV file input505.3.3 Cube 输入立方体515.3.4 Excel 输入515.3.5 Fixed file input535.3.6 Generate random value545.3.7 Get file Names555.3.8 Get Files Rows Count555.3.9 Get data from XML555.3.10 LDAP Input575.3.11 LDIF Input.585.3.12 Mondrian Input605.3.13 Property

4、Input.605.3.14 StreaXML Input615.3.15 XBase 输入655.3.16 XML 输入6..20文本文件输入70生成71获取系统.71表输入735.4输出755.4.1 Access Output.755.4.2 Cube 输出755.4.3 Excel Output.765.4.4 Properties Output765.4.5 SQL File Output785.4.6 XML 输出7.85.4.9删除80/更新81文本文件输出835.4.10 更新835.4.11 表输出84.85 5.5

5、.1 Check if a column exists .8 File Exists865.5.3 HTTP.875.5.4 Table exists885.5.5 Web 服务.89.8..9数据库数据库连接91流.92调用 DB过程945.6转换945.6.1 Abort955.6.2 Add XML 增加 XML.965.6.3 Add a checksum 增加检查和975.6.4 Analytic Query 分析985.6.5 Append Streams985.6.6 Blocking Step 被冻结的步骤995.6.7 C

6、lone row995.6.8 Closure Generator 闭包.1005.6.9 Data Validator 数据检测1005.6.10 Delay row 延迟行1015.6.11 Identify last row in a stream 标记流中最后一行1015.6.12 Metadata structure of stream 流中据结构1025.6.13 Null if 设置为空值1025.6.14 Row Normaliser 行正规化1035.6.15 Split field to rows 分离行1035.6.16 Switch / case1045.6.17 XS

7、D Validator1045.6.18 XSL Transformation10....265.6.275.6.285.6.295.6.305.6.31值106分组107去除重复.108增加常量109增加序列109字段选择110拆分字段111排序. 112空操作113行扁平化113行转列115计算器116过滤. 119连接1205.7.1 Merge Join1205.7.2 Sorted Merge1215.7.3 XML Join1 合并.1225.7.5关联（笛卡尔输出）1235.

8、8 脚本1245.8.1 Modified Java Script Calue1245.8.2 Regex Evaluation1255.8.3 执行 SQL 脚本1275.9 数据仓库1285.9.1 维度更新/5.9.2 联合更新/.128.1295.10.130（子转换）130输入规范131输出规范1325.11作业1325.11.1 Get Variables 获得变量1325.11.2 Get files from result1335.11.3 Set Variables 设置变量1345.11.4 Set files in result1355

9、.11.5 从结果获取.1355.11.6到结果1365.12内联1365.12.1 Injector1365.12.2 Socketer1375.12.3 Socket writer137实验138不推荐的134.1 聚合.1395.15 Bulk loading1405.16 History1426. 任务 Jobs对象1436.1 General1436.1.1 Dummy Job1436.2 通用1446.2.1 START1446.2.2 Dummy Job14..6中断任务145显示消息框145任务(Job)146a ho

10、st1476.2.7 Success1486.2.8 文本输出1486.2.9 Write to Log1496.3 邮件1496.3.1 Write to Log1496.3.2 Mail150文件管理15....9向结果中添加文件名152比较文件夹152拷贝文件153拷贝或移动结果文件名153新建文件夹154新建文件155删除文件155从结果集中删除文件名155删除文件1566.4.10 删除文件夹1566.4.11 文件比较1576.4.12 HTTP1576.4.13 Move FIles1586.

11、4.14 文件解压缩1596.4.15 等待文件1596.4.16 文件打包160条件16..56.5.6检查文件夹是否为空161检查文件是否161检查数据库表中的列是否.162检查文件162检查表是否.163等待1636.6脚本1646.6.1 Mail1646.6.2 SQL1646.6.3 SHELL165批量加载1666.7.1 批量从Mysql 中加载数据至文件1666.7.2 从文件中向 MS SQL Server 数据库中批量加载1666.7.3 从文件中向 Mysql 数据库中批量加载1676.76.8 XML1686.8.1

12、 Check if XML File is well formed1686.8.2 DTD Validator1696.8.3 XSD Validator1696.8.4 XSL Transformation1706.9 文件传输1716.9.1 FTP1716.9.2 FTP Delete.1736.9.3 Put a file with FTP1736.9.4 Put a file with SFTP1756.9.5 SSH2 Get1766.9.6 SSH2 Put1776.9.7 Secure FTP179资源库1806.10.1 Check if connected to repos

13、itory1806.10.2 Export repository to XML file181实验1816.11.1 Evaluate rows number in a table1826.11.2 MS Access Bulk Load1826.11.3 Set variables1846.11.4 Simple evaluation1846.11.5 Truncate tables1856.11.6 Wait for SQL1866.106.11概述Kettle 中文名称叫水壶，该项目的主程序员 MATT 希望把各种数据放到一个壶里然后以一种指定的格式流出。Kettle 主要四部分，分别为

14、 Chef，Spoon，Kitchen，Pan。 Kettle提供一个图形用户界面 Spoon，用来设计数据转换过程。在 Spoon 中，用户可以使用左面的组件树，在右面的面板中设计转换流程，并在 Log了图形用户界面 Spoon 中各组件的使用。View 面板中查看运行结果。该文章1.Kettle 资源库管理登陆时可以选择”没有资源库”Kettle，此时所定义的转换和工作将只能在本地磁盘上，以.ktr文件和.kjb文件的方式。若使用资源库登录，则所有定义的转换和工作将会到资源。实际上，资源库就是一个数据库，比如SQL SERVER数据面了Kettle定义的元素的相关据，简单而言，就是据库。如

15、果资源库创建完毕，则资源库的相关将在文件 “reposityries.xml”中，它位于你的缺省home 目录的隐藏目录“.kettle”中。如果是windows 系统，这个路径就是c:Documents andSettings<username>.kettle。1.1 新建资源库1）新建到资源库的的数据库连接点击”新建”按钮，弹出以下框:a.数据库连接是让我们选择数据库连接，这里意思为我们可以在本地数据库新建一个或多个数据库(比如 sql server 数据库)做资源库，然后连接到该资源库 b.表示资源库的名字我们最初没有资源库，则点击新建按钮，新建一个数据库(做资源库)连接，注

16、意前提是（sql server 为例）已如何建立到数据库的连接：该数据库，（1）我们首先以在 sql server 下创建的KettleZyk 数据库为例，我们选择 ODBC 方式连接到sql server。首先配置 KettleZyk 数据库的 ODBC 源：（2）点击新建按钮，做如下设置。点击编辑按钮可以编辑这个连接。删除则删除该连接。2）创建资源库选择好刚创建的数据库连接，填写好资源库名称，点击按钮创建新资源库弹出：意思是“对于资源库用 ODBC 连接支持不是很好，最好用本地ODBC 方式支持不是很好，最好使用本地连接。我们继续，弹出：连接”，因为资源库对意思为在这个数据库连接下创建资源

17、库，即在 kettleZyk 数据库中创建资源库选择是，弹出：“你是否想做一次演练以在执行之前评价产生的 sql 语句”。意思为创建资源库这个过程执行之前您是否想看看这个创建过程的具体 sql 语句（因为创建资源库就是在 KettleZyk 数据库中创建表，它询问我们要不要看这些建表的语句）我们选择“否”，则直接创建资源库，完成后弹出：我们选择“是”，则弹出 sql 语句语句。相关数据的 sql框，里面显示的是创建所有表和点击关闭则创建资源库的过程，点击 clear cache 则清空数据库缓存，点击 Excetue 则执行这些 sql 语句,创建资源库：我们回过头来看这些 sql 语句，我们

18、发现它不仅创建了表，还向表中们看到有几行语句是，了相关的数据，我CREATE TABLE R_PROFILE (ID_PROFILE BIGINT PRIMARY KEY, NAME VARCHAR(255), DESCRIPTION VARCHAR(255);INSERT INTO R_PROFILE(ID_PROFILE, NAME, DESCRIPTION) VALUES(1,'Administrator','Administrator profile, manage users');INSERT INTO R_PROFILE(ID_PROFILE, NA

19、ME, DESCRIPTION) VALUES (2,'User','Normaluser, all tools');R_User 和 R_Profile 两个表是登陆资源库的用户的，登陆名、和用户权限，我们必须先弄清 R_User 表的这些，因为它已经了，我们在登陆时需要用到这些用户。关于用户即如何登陆在“资源库登陆和用户管理”中详细描述。1.2 更新资源库创建了资源库后我们可以更新资源库：点击首页的“编辑”、“新建”按钮均可以进入到创建资源库界面，INSERT INTO R_PROFILE(ID_PROFILE, NAME, DESCRIPTION) VAL

20、UES(3,'-only','-only users');我们再看创建完资源库后数据库中表的情况：R_Profile 表CREATE TABLE R_USER (ID_USER BIGINT PRIMARY KEY, ID_PROFILE INT, LOGIN VARCHAR(255), PASSWORD VARCHAR(255), NAME VARCHAR(255), DESCRIPTION VARCHAR(255), ENABLED CHAR(1);INSERT INTO R_USER(ID_USER, ID_PROFILE, LOGIN, PASSWORD

21、, NAME, DESCRIPTION, ENABLED) VALUES(1,1,'admin','2be98afc86aa7f2e4cb79ce71da9fa6d4','Administrator','User manager','Y');INSERT INTO R_USER(ID_USER, ID_PROFILE, LOGIN, PASSWORD, NAME, DESCRIPTION,ENABLED)VALUES(2,3,'guest','2be98afc86aa7f2e4cb79ce7

22、7cb97bcce','Guest ','-only guest','Y');我们再看创建完资源库后数据库中表的情况：R_User 表当数据库连接选择后，我们开始创建资源库了，单击按钮可以创建新资源库或者更新原来已有的资源库，弹出：意思是“对于资源库用 ODBC 连接支持不是很好，最好用本地续，弹出：连接”。Xp 下我们继选择是，弹出：输入 Admin 的（资源库登陆和用户管理中描述），确定，更新资源库的步骤类似创建资源库，不同的是它是创建索引。1.3 资源库登陆和用户管理R_User 和 R_Profile 两个表我们展开两个表分别做说

23、明：R_Profile 表了资源库的用户，登录名、和用户权限。它说明有 3 种权限的用户：1 Administrator 权限超级管理员，可以管理其它用户2User 权限普通用户，可以使用所有工具3-only只读用户，理解为只可读不可写，即可以使用工具，但是不能保存，后面再进一步研究R_User 表LOGIN 是登录名，PASSWORD 是（注意是经过加密的，所以在此以 16 进制显示，在这里我们不研究加密算法），ENABLED 表示用户是否可用，Y 是可用，N 是不可用，在工具里体现为：我们从表中可以看出是经过加密的，由于我们不知道他的加密算法，我们不知道原。但是我们想登通过陆资源库登录

24、Kettle，如果用 admin（具有超级管理员权限）能登陆，则可以创建其它权限的用户，从而不再需要这些初始化的用户如何登录：。下面我们就来探讨1. 我们猜测 admin2. 我们在 R_User 表中默认为 admin，发现就是 admin3 行,因为表设计的可以 PASSWORD 为空，如果在登录界面没有限定不能为空，则我们可以通过 zkl 登陆了，（实际如果真是这样，这便是 KETTLE 的一个小漏洞，应该做不能为空的限定），我们试一下，使用用户 zkl，为空登录，发现出现以下错误：实际上这都是因为 ODBC 连接资源库的原出现此问题。而是能登录进入 Kettle。因，如果是使用 Nat

25、ive（）连接数据库就鉴于 ODBC 连接资源库的缺陷，以下所有叙述我们均基于 Native(（1）Administrator 权限用户)连接资源库。使用资源库并用“zkl/空”或者“admin/admin”登录。该权限用户有以下权限：1）修改当前用户的点击资源库Æ编辑当前用户2）管理资源库中的转换、任务、用户、点击资源库Æ探索资源库（权限）a)即用户的权限Administrator 可以管理用户，使用转换，使用工作，使用 schems；可以修改。-only 没有任何权限，只能，可以修改。User 与 Administrator 用户相比少一个用户管理权限，可以修改。还有如

26、下操作b)用户Administrator 不能修改的权限（）Administrator 可以修改其它权限的用户的权限和此外，Administrator 还有以下权限：等。c)任务右键目录可以管理目录，右键任务可以管理作业。d)转换e)其它1.4 资源库登录和没有资源库登录的区别使用资源库登录后在 Kettle 中定义的转换和 Job 均到资源库的相关表中，若没有资源库登录，则会以.ktr 和.kjb 格式且有些选项功能也不一样。 1）菜单栏显示不同没有资源库：在硬盘上。此外两者登录后菜单栏显示的将不同，并资源库登录：2）文件菜单栏相关选项功能不同没有资源库：“打开”、“从 url 文件打开”均

27、是打开硬盘目录下的 kjb 和ktr 文件。“保存”和“另存为”是把转换和工作以 kjb 和 ktr 文件资源库登录：到硬盘上。“打开”是打开在资源的转换和工作“从 url 文件打开”是打开硬盘目录下的 kjb 和ktr 文件。“保存”是把相关转换到资源库。“另存为”是把转换和工作以 kjb 和 ktr 文件到硬盘上。把本地的转换和工作源库中。到资源库只用先打开本地的转换和工作，点击保存即可以保存到资2.菜单栏2.1 文件导出到 XML 文件：将定义的转换和 Job 导出到 xml 文件从 XML 文件导入：从导出的 xml 文件中导入定义的转换或 Jobs。另存为（VFS）：VFS 的作用就

28、是采用标准的 Unix 系统调用读写位于不同物理介质上的不同文件系统。2.2 编辑撤销：撤销操作搜索据：搜索当前转换或 Jobs 的相关据，可以过滤，可以查看所有，资源库实际上就是据库。设置环境变量：显示环境变量：见变量叙述显示参数：清除选择：选择所有的步骤：全选定义的转换或 jobs 的所有步骤。所选的步骤到剪贴板：步骤。从剪贴板步骤：相当于粘贴步骤。浏览数据库：单击浏览数据库，弹出选择框选中接，确定，查看数据库表和视图等。选项：2.3 视图工作区大小设定。2.4 资源库连接资源库：进入登录首页连接资源库。断开资源库连接：编辑当前用户：编辑和权限探索资源库：管理转换、工作、用户、等。详情见资

29、源库中 Administrator 权限。2.5 转换运行：执行当前转换预览：预览本次转换的结果调试：和预览类似重放：重新运行转换校验：检验转换的输出影响分析：分析转换的影响获取 SQL：显示最近一次影响分析：显示最近一次影响结果：转换到剪贴板：从剪贴板粘贴转换：转换图片到剪贴板：设置：设置转换的属性2.6 作业运行：运行本作业：粘贴：设置：设置 JOB 的属性，“日志”可以日志到数据库表中2.7向导2.8帮助2.9变量2.9.1 变量使用变量可以在转换步骤或者任务条目中使用。变量可以在转换中的“SetVariable”步骤中设置，或者在Kettle 的属性文件Kpe

30、rties 中设置。Kettle 目录如下：$HOME/.kettle(Unix/Linux/OSX)C:Documents and Settings<username>.kettle(windows)使用变量的可以如下指定： $VARIABLE（UNIX） % VARIABLE %(WINDOWS)两种格式都可以使用，甚至混合使用。2.9.2 变量范围变量的范围可以在定义的地方指定。环境变量变量最先的使用是设置环境变量。例如很容易指定临时文件的位置，你可以使用变量：$java.io.tepdir。这个变量在/Unix/Linux/OSX 机器上的位置是：direc

31、tory/tmp，在Windows 机器上的目录是：c: Documents and Settings<username>Local SettingsTemp。使用环境变量唯一的问题是：不能动态的使用变量，如果你用动态的使用它就会出现问题。如果你在一个应用程序服务器上同时运行2 个或者。在所有运行的虚拟机上修改环境变量是很需要。的转换或者任务，就会出现 Kettle 变量因为环境变量的范围非常广泛，所以我们引入来说是局部的。Kettle变量，它们对于设置变量的任务内部变量下面这些变量被定义的：下面这些变量在转换中被定义：下面这些变量在工作中被定义：3.

32、工具栏3.1 转换 Transformation 工具栏功能对应菜单栏里的转换、文件、视图。新建：新建转换、工作等打开：打开转换或作业保存当前转换或工作以不同名字保存当前转换或工作，即另存为运行当前工作或转换暂停当前运行的工作或者转换停止当前运行的工作或转换预览当前转换或者工作调式当前转换或者工作重放校验影响分析：分析该转换或工作的影响获取 SQL：产生需要运行这个转换的 SQL相当于编辑下的浏览数据库隐藏、显示执行结果面板相当与菜单栏里的视图，放大、缩小工作区3.2 工作 Jobs 工具栏新建：新建转换、工作等打开：打开转换或作业保存当前转换或工作以不同名字保存当前转换或工作，即另存为运行当

33、前工作或转换暂停当前运行的工作或者转换停止当前运行的工作或转换获取 SQL：产生需要运行这个转换的 SQL相当于编辑下的浏览数据库隐藏、显示执行结果面板相当与菜单栏里的视图，放大、缩小工作区4.主对象树双击转换即新建一个转换，双击后主对象树变为以下样式，对象变为以下样式：双击转换即新建一个转换，双击后主对象树变为以下样式，对象变为以下样式：4.1 转换主对象树转换主对象以下列表4.1.1 新建转换右键单击转换，新建4.1.2 转换设置右键单击，设置属性单击设置转换属性，名称、日志等解释：“获取依赖”按钮：自动探测依赖SQL 按钮：生成创建日志表的 SQL 脚本。4.1.3 DB 连接右键 DB

34、连接属性新建、编辑数据库连接数据库用法：右键单击具体的连接SQL Editor：SQL 编辑器有时候当你创建表、删除索引或者修改字段的时候，有一个简单的SQL 编辑器是再好不过了。Spoon 提供的简单SQL 编辑器完全可以帮助你实现这些。事实上，大多数的DDL，例如“create/alter table”、“create index”或者“create sequence”命令可能通过SQL 编辑器窗口运行。注：多个 SQL 语句时必须用“;”隔开。Explore：数据库浏览器你浏览你连接的数据库。在这个时候，它仅仅显示可用的表、目录或者表模式。可以利用右边的按钮最低限度的展示表或者视图。你

35、可以选择下面的选项： Display the first 100 rows of Display the first lines of Show the size(in rows) of thethe table（显示表最开始的100 行） the table（根据你输入的行数展示表）table（显示表的行数） Show layout of the table（显示表结构） Generate DDL：（生成该表的DDL语句） Generate DDL for another connection :（在其它的数据库连接中生成该表的DDL 语句） Open SQL for:（在SQL 编辑器中生

36、成该表的SQL 语法） Truncate table：（生成“Truncate table”的语句）4.1.4 Steps(步骤)显示当前转换或者工作的所有步骤，Edit：编辑该步骤的属性Duplicate：副本，删除：删除步骤Share：共享步骤步骤4.1.5 Hops(节点连接)显示当前转换或工作的所有节点连接（即各步骤之间的数据连接，表示数据流向）。接连接两个步骤。数据流的方向使用箭头来指定。连接可以使它可用或者禁用。右键节点连接，可以新建和排序连接创建接：你可以简单的使用下面的选项来创建个连接：使用鼠标中间的按钮在图形界面上拖拉。使用鼠标左边的按钮和SHIFT 键在

37、图形界面上拖拉。选择菜单树上的两个步骤，鼠标右键选择“新连接”。选择图形界面上上的两个步骤，鼠标右键选择“新连接选择起始步骤和目的步骤，是使连接反向。排序连接：按名称将节点连接排序拆分接:您可以很简单的一个新步骤到在两个步骤间的新连接上，在图形界面上拖拉步骤通过接，直到那个连接变成粗体。转换连接颜色:下面是所有使用的颜色：右键单击每个具体连接，可以编辑和删除该节点连接的属性Edit：编辑连接的属性删除：删除该连接4.1.6 数据库分区 schems右键新建数据库分区新建分区右键每个具体 schems，可以编辑、删除、共享数据库分区4.1.7 子服务器右键单击子服务器新建子服务器

38、右键单击每个具体的子服务器，编辑、删除、共享、Monitor资服务器中的工作和转换4.1.8 Kettle 集群 schems新建4.2 Jobs 主对象树4.2.1 新建 Job4.2.2 设置 Job 属性单击设置，修改属性4.2.3DB 连接右键 DB 连接属性新建、编辑数据库连接右键单击具体的连接SQL Editor：SQL 语句编辑器Explore：浏览连接的数据库4.2.4作业项目显示该作业中的所有项目右键单击每个具体项目，编辑、删除步骤4.2.5 子服务器右键单击子服务器新建子服务器右键单击每个具体的子服务器，编辑、删除、共享、Monitor资服务器中的工作和转换5. 转换对象新

39、建一个转换后，对象变成如下形式5.1 Transform5.2 Input5.3 输入数据输入选项，5.3.1 Access Input从 Access 文件输入数据（1）先选择源 ACCESS 文件文件中先点击浏览，定位到已，右键单击，编辑步骤的 ACCESS 数据库文件(里面右表)然后点击增加按钮，添加文件路径到下面表格中（2）内容中选择表（3）字段选择选择输入数据的字段5.3.2 CSV file inputCSV 逗号分隔值文件（Comma Separated value），是一种用来数据的纯文本文件格式，通常用于表格或数据库。5.3.3 Cube 输入立方体在 BI 领域，CUBE

40、是立方体的，主要用于支持联机分析应用（OLAP），为企业决策提供支持。Cube 文件扩展名是.cube。编辑步骤，浏览到.cube 文件，从 cube 文件输入数据。5.3.4 Excel 输入从 Excel 文件中(1)文件浏览并选择 Excel 文件，然后点击增加按钮增加选中的文件到列表中数据；(2)工作表选择 EXCEL 文件中的工作表(3)内容以下设置会在输出表中显示限制即输出数据的行数，导出数据到 excel 表结果如下：(4)字段输出数据的相关字段5.3.5 Fixed file input固定长度的数据输入，编辑步骤5.3.6 Generate random value产生一个某

41、类型的随机值，编辑步骤：5.3.7 Get file Names得到硬盘上文件的详细5.3.8 Get Files Rows Count得到文件行数5.3.9 Get data from XML5.3.10 LDAP Input5.3.11 LDIF Input5.3.12 Mondrian Input5.3.13 Property Input从 properties 文件中输入数据5.3.14 StreaXML Input流 XML 输入：这个步骤主要提供值的，它信赖于SAX器，在大文件上能提供更性能。它与XML 输入非常相似，仅仅在内容和字段制表符上略有不同。解释：5.3.15 XBase

42、输入使用这一步可以大多数被称为XBasefamily派生的DBF文件5.3.16 XML 输入它也提供一个接口，你可以定义你想等。的文件名、XML 文件的数据重复部分、获取的字段解释：5.3.17 文本文件输入从文本文件中(1)文件数据出来，编辑步骤(2)内容：按照文本内容的分隔样式来输入数据5.3.18 生成些空或相等的行，编辑步骤生成 10 行，如下：5.3.19 获取系统获取系统的相关，编辑步骤：输入名称，点击类型，选择的类型，有以下类型的数据：5.3.20 表输入从数据库表中输入数据(1)(2)若选中数限制为 0，会发现中文内容会显示为乱码(3)意为从前面步骤数据到此点击按钮，弹出数

43、据库内容框，点击左边的表，右边呈现可用状态意思分别是: 显示前 100 行显示 x 行表数据总行数显示表的|当选中左表，点击前 3 行任意一行，再一直确定即可得到|该表的语句布局生成数据库模式定义语言 DDL，即该表的建表语句生成其它连接下(比如 oracle 连接下)该表的建表语句打开 sql 语句编写器删除该表的内容编写该表的相关语句5.4 输出各种形式的数据输出5.4.1 Access Output输出数据到 Access 文件中，步骤属性Database filename 直接输入名字即可，不需要首先创建，最好不要用中文Target table 直接输入名字即可，不要用中文，转换运行过

44、程中自动创建 ACCESS 数据库文件和表。Access 输出是输出从前面来的所有字段，若要选择相关字段，则在之前用到。5.4.2 Cube 输出在 BI 领域，CUBE 是立方体的，主要用于支持联机分析应用（OLAP），为企业决策提供支持。输出数据到 Cube 文件中5.4.3 Excel Output和文本输出设置类似，可以选择相应字段5.4.4 Properties OutputProperties 格式文件是 Java 中的文件，类似 XML 文件，都是用来按一定结构保存数据用于资源文件、配置文件，xml 也多用于数据传输。具体干什么用要看你的业务需的，求。使用 MyEclipse T

45、ext Editor 可以编辑、打开此格式文件：编辑步骤：选择字段名字和字段值Content（内容）：选择输出文件路径5.4.5 SQL File Output把“数据输入到相关数据库表”这个过程的 SQL语句输出到 Sql 脚本文件，但是成数据到数据库表的，只是生成 Sql 操作脚本。并编辑步骤：General（通用）：中选择需要数据的目的表中选择 sql 脚本在本地磁盘的路径完成操作后，输出的 sql 脚本文件内容如下：5.4.6 XML 输出输出数据到 XML 文件中选择文件路径：文件：选择 XML 文件路径字段：选择相关字段，点击可以获得所有字段内容：设置输出 xml 文件的相关属性，

46、具体如何体现可以在 xml 文件中看出，分割每一个：意思为每一个 xml 文件中的数，比如共有 50 行，则会产生 50/5=10个 xml 文件，若为 0 表示，只产生一个 xml 文件，所有输入的数据生成的一个 l 文件内容如下：5.4.7 删除基于关键字删除目的表表字段：目的表里的字段流里的字段：前面输入数据流中的字段首先选择目的表 stu，然后选择关键字；删除符合一定条件的目的表里的数据，条件即为：目的表中关键字段值与输入数据中的关键字段值相等。如以上就是删除 stu 表中 BJDM句：于输入数据流中 bjdm 字段的学生，相当于 sql 语Delete from stu where bjdm in (select bj dm from 输入表)，若是多个条件则条件为 and 形式，如：Delete f

人人文库> 全部分类> 应用文书

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

etl专业视频教程基础进阶实战课时kettle

文档简介

温馨提示

最新文档

评论

etl专业视频教程基础进阶实战课时kettle

文档简介

温馨提示

最新文档

评论

相关文档