




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Informatica学习整理1.Informatica产品介绍: PowerCenter:Informatica PowerCenter是世界级的企业数据集成平台,它在ETL领域中无论是执行能力还是战略远见方面都是佼佼者,是Informatica的核心产品 。2.ETL环节中最重要的: 大家可能大部分会认为转换才是最重要的环节,但事实上是加载环节。 按重要程度递减排序,分别是load(装载)、clean(清洗)、transfer(转换)、extract(抽取)3.具有2个server: Informatica Repository Server:资料库server,管理ETL过程产生的元数据,用来管理对资料库中元数据的请求和操作; Informatica server:实际的ETL引擎;4.具有5个client: PowerCenter Designer:设计开发环境,定义源及目标数据结构;设计转换规则,生成ETL映射 Workflow Manager:合理地实现复杂的ETL工作流,基于时间、事件的作业调度 Workflow Monitor:监控Workflow和Session运行情况,生成日志和报告 Repository Manager:资料库管理,包括安全性管理等,元数据维护和安全操作,如:元数据查找,用户、组、权限管理等。 Repository Server Administrator Console:对知识库的操作,如:知识库的创建、备份、恢复等。5.基本的ETL任务设计和部署的大致步骤: 使用Designer客户端,获取源数据表的元数据。 使用Designer客户端,获取目标数据表的元数据。 使用Designer客户端,设计一个Mapping,其中就是源-目标的ETL规则。 使用Workflow Manager客户端,针对上面实现的Mapping,实例化为一个Session,为其指定实际的数据源、目标连接,以及其他属性。 使用Workflow Manager客户端,创建一个Workflow,其中包含上述的Session以及其他的Task,在Workflow中可实现复杂的流程控制。 运行上述Workflow,使用Workflow Monitor客户端,监测最终的任务运行结果。6.一个简单的Mapping设计过程(8.1.1版本):第一步:进入Repository Manager,在你的库下建立一个文件夹,用来储存自己的Mapping,如图1.1: 图1.1第二步:假如你所建的文件夹名称为org_wellzaj,然后打开Powercenter Designer,你就会看到你所建的文件夹org_wellzaj,右击OPEN此文件夹,会发现有很多的子目录,点击Sources子目录,从数据库中导入表结构,如图1.2: 图1.2第三步:导入目标表结构,导入过程和导入源表结构一样,假如源表为DEPTINFO,目标表为USERANDDEPT,现在可以设计自己的mapping了,将目标表和源表组件拖到设计台中,在工具栏中选择一个你想要处理的控件,假如为Filter也拖放到mapping设计台中,通过名称和位置进行连接关联,效果如图1.3: 图1.3第四步:打开workflow manager,创建自己的Session,如图1.4: 图1.4第五步:create一个workflows,会产生一个绿色的Start(这个是自动产生的),再将做好的Session拖放到workflow的设计台中,将start和session关联(Link)如图1.5: 图1.5第六步:保存你的workflow,右击运行此workflow(kk_org),如图1.6: 图1.7第七步:此时会进入workflow montitor,可以查看workflow、session的log,如图1.8:说明:数据库的安装配置,服务端的安装配置在此没有说明,请查阅相关资料Informatica学习笔记二1. Expression transformation:类似与过滤控件,可以起到过滤的作用,当选择为O或者V时,才可以对Expression进行编辑,如图2.1: 图2.12. Filter transformation:过滤控件,对相应字段写出自己的过滤条件,如图2.2: 图2.23. Aggregator transformation:基于多行记录的汇总计算,如:取平均值和总和,如图2.3: 图2.34. Lookup transformation:从数据库表中,按条件查找相关的值专送给其它的对象,如图2.4: 图2.4Lookup另外一种用法,在平台中单独出来,在Expression控件中进行调用,如图2.5: 图2.5LKPTRANS控件被单独的独立出来,但在Expression中调用它,也起到了查找的作用;5. Sequence Generator transformation:当你目标表中莫个字段是递增形式时,就可以使用此组件,如图2.6: 图2.6使用此组件可以将DEPTID,不断的递增;6. Joiner transformation:关联组件,比如内连接,左联接等,如
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 辽宁电气技能题库及答案
- 安全知识考试题(燃气安全应急物资使用)
- 中考物理手绘真题及答案
- 2025年不良事件考试试题及答案
- 农户电商参与行为与增收效应的研究
- 复杂地质环境中旋挖桩施工管理与质量控制
- 污水厂基础知识培训内容
- 2025安阳工学院考试真题及答案
- 风险指标建模-洞察与解读
- 江城子苏轼课件
- 《房产市场动态》课件
- 【大学课件】病毒性脑炎
- 园艺学概论课程练习题及答案全套
- 《淡水生态系统之谜》课件
- 泵站日常运营与维护方案
- 北师大版小学五年级数学下册教案全册
- 中国少年先锋队成长故事征文
- 种草养鹅项目实施计划方案
- 无人机网络安全防护-洞察分析
- T-EERT 040.1-2024 环保设备设施安全管理 总则
- 2025工程施工包工包料承包合同
评论
0/150
提交评论