Informatica完全快速学习手册_第1页
Informatica完全快速学习手册_第2页
Informatica完全快速学习手册_第3页
Informatica完全快速学习手册_第4页
Informatica完全快速学习手册_第5页
免费预览已结束,剩余23页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、iNFORMATiCA1Informatica概述32安装Informatica服务端安装32.2客户端安装73配置管理服务器93.1创建知识库和集成服务93.2客户端到集成服务端的连接124PowerCenterDesigner学习134.1概念和基本定义134.2Mapping设计和组件的使用154.2.1实例一:聚合抽取154.2.2实例二:取TOP前三条记录164.2.3实例三:抽取XML源194.3WorkFlow的设计和使用204.3.1创建Session204.3.2设计WorkFlow224.4RepositoryManager23*Informatica 概

2、述Informatica一直致力于为客户提供具有强大的元数据管理、数据集成和个性化分析递送功能的世界通行标准的统一数据服务平台。Informatica的基础设施产品以可伸缩的、可扩展的企业级数据集成平台为特点,并广泛支持来自Informatica和其他的领先商务智能提供商的数据仓库基础设施和分析型应用软件的开发和管理,提供元数据管理解决方案,帮助企业集成、优化、审核信息资产以提高运营效率,增加客户收益,取得竞争优势。口.rnfcirnmtieii概述概述. .d详见文档:比*安装 Informatica8.6.1pc0l_client_win32_x86fzip通通pc861_HotFix8_

3、Client.zip凌凌pc861_HotFix8_win32_xS6.zip灌灌pc861_win32_xB6.zip这里以Informatica8.6.1为例:%服务端安装服务端安装找到安装目录pc861_win32_x86.zipServerWindowsDisk1InstDataVM下linstall.exe点击安装选择安装语言,这里以中文版为例点击下一步,并选择安装PowerCenter8.6.1必须选择事先准备好的安装密匙选择安装路径HTTPS配置,配置管理控制台与配置管理器的安全通信(如果没有使用该端口就采用默认)配置好Informatica域并进行下一步,取掉为特定用户启动In

4、formaticaServices,点击完成安装2.2 客户端安装选择安装设置安装路径安装完成后可以看到包含的所有工具3 配置管理服务器3.1 创建知识库和集成服务接下来我们主要是配置知识库管理服务器,PowerCenter数据整合引擎是基于元数据驱动的,提供了基于元数据驱动的元数据知识库(Repository),知识库是PowerCenter的核心。在InformaticaServices启动的的情况下,我们可以通过管理控制台来操作。InformaticaPowerCenter8.6,1ClientServicesJInformaticaOrchestrationSer,PowerCente

5、rAdministrationC从控制台里我们可以看到很多选项,我们主要是创建存储库服务(Repository)和集成服务,存储库服务(Repository)存储所有的ETL元数据,包括:源、目标表的物理和逻辑元数据,ETL转换规则,知识库用户权限,ETL任务运行历史信息等元数据。首先我们创建一个用于测试学习的存储服务器,事先在Oracle中建好要用到的数据库此处如果无法创建成功有以下可能:.需要设置环境变量,将C:InformaticaPowerCenter8.6.1Serverbin;C:InformaticaPowerCenter8.6.1RepositoryServerbin;移到Pa

6、th最前边.代码页一定要如下选择而 MetadataManagerReferenceTableManager 脂箝SAPBW 飓芳飓芳WebSerwieesHub概述概述上次更我时间:星明四五月611:04:352010存楮库塞疗存楮库塞疗U文件荚近网格生节点许可证集斶眼芳吸有即免】三eLE=iIoeLE=iIo pn=pn=创建创建域详细信息:Donmin_hhaivuanPCMSWindowsSimplifiedChinese,supersetofGB231Z-80,EUCencoding、3.设置知库链接用的数据库用户要有DBA角色权限连接字符串设置为当前的Oracle服务名节点no加O

7、l_lihsHyunn-PC正在运行。关闭期建存储库展努期建存储库展努以下项的操作状态创建内容:成功,以下项的操作状态创建内容:成功,幻幻 W W 第第1页页,共,共7。倒倒保存关闭保存关闭存错库眼努在以独占模式运行,盾重领启动存储库服务以更改为普通模式。存错库眼努在以独占模式运行,盾重领启动存储库服务以更改为普通模式。创建内容操作(在存储库创建内容操作(在存储库 学学习则式习则式用例库用例库1上)开始于上)开始于口目口目06/201014:19:09.DROPTABLEOPB_REPOSITDROPTABLEOPB_SUBJECTDROPTABLEOPBZPICDSCDROPTABLEOPB

8、_SRC_FLDDROPTABLE口口PB二二SCHEMADROPTABLEOPB_SRCDROPTABLEOPB_SELINFODROPTABLEOPB_TARGDROPTABLEOPB_TARG_FLDDROPTABLEOPB_FLDL麻麻DROPTABLEOPB_TARGINDEXDROPTABLEOPB_TARGINDEXFLDDROPTABLEOPB一一RTSEQDROPTABLEOPB_DBDDROPTABLEOPB_LQAD_SESSIONDROPTABLEOPB_LQAD_FI|_ESDROPTABLEOPBZBTCH_SESSIONDROPTABLEOPB_LOAD_BATC

9、H,*in 卜卜接下来创建集成服务,因为集成服务是依赖于知识库的,注意关联的存储库服务选择刚建好的学习测试存储库,存储库默认要设置用户名和密码为:Administrator至次我们完成了服务端的基本配置,服务端可以对知识库备份和恢复等很多功能,也可以建立其相应的服务,这里不再多述!3.2 客户端到集成服务端的连接我们开发ETL要使用到PowerCenterDesigner工具,详细的介绍在概述中有,接下我们配置女DDesigner与集成服务的连接:从客户端工具中打开PowerCenterRepositoryManagerQInformatics替rRepo?itor-h/-Tiager-从菜单

10、上选择存储库配置域如下:在集成库下的一层子目录iiiiuriiidLiLdruveivtr_rfpu-KUyividridyci-L于于 U U 出出口工口工LEHUH存储库存储库(R)鼐簿旧鼐簿旧查看查看M文件夹文件夹旧旧版本控制版本控制M安全性安全性分析分析,蹿事|*朗中眉屈臂|画国,画00O存赭库导航器存赭库导航器至此,打开PowerCenterDesigner就可开发使用了学习测式用网寄学习测式用网寄IE-名称注释名称注释用汨件用用汨件用.,4PowerCenterDesigner 学习概念和基本定义最基本的ETL包括源的定义,目标定义,和映射,另外我们还可以创建可以重用的Mapple

11、t。使用到的工具如下映射设计:传输件设计:炉包身国,Mapplet组件设计:|-无必幼”源分析器是用来定义源的结构,这里的源虽然是从某个数据库导出进来的表结构也可以是某个XSD定义的XML结构等等,但是仅仅绑定了数据库类型,并不是指定了链接要从那个数据库里抽取数据。这里我们从菜单可以导入表结构,Informatica提供了ODBC的方式链接多种数据源源分析器:目标设计器:我们以一个DW事实表为例: :键名称键名称数据类型数据类型长长: :PRIHT_BOCUNElTr_COI)EPRIHT_BOCUNElTr_COI)Evarch&r22020i i: :SHOUlfPATnOciHEMTCO

12、DESHOUlfPATnOciHEMTCODEvarchar22020: :REPORTMONTHIDREPORTMONTHIDnumber(p,工)6 6= =: :BVSSIWESS_FARTHER_IBBVSSIWESS_FARTHER_IBnumber(p,5)1515:COKTRACOKTRA T_ACCOWIT_IDT_ACCOWIT_IDnumber 二)1515= =:CONTRACT_IBCONTRACT_IBnumber(p,E)ISIS: :TRADEIBTRADEIBnumLer(p,s)1515: :DEPAKTMEHTIDDEPAKTMEHTIDnumbergs)1

13、515:COBSU1!IE_KIHD_IDCOBSU1!IE_KIHD_IDtkumlergs)ISIS: :COCO SWE_TYFE_IDSWE_TYFE_IDnujiiber 电 5) )ISIS:READERIDrvumberas)15152 2: :EHTERACCEHTERACC 口 iniT_MnHTHiniT_MnHTHIDIDnxunber。尸E)6 6:OIE_CmGEOIE_CmGEnumber 电E)IBIB : :PAYMENTPAYMENT卵卵Enumber(p,s)ISIS;: :CREATEJUTECREATEJUTEdate1919.J*H同样我们可以定义目标

14、结构,常规也是导入表结构,我们也可以在Mapping设计中自动创建目标表结构,源定义和目标定义中,我们可以对导进来的表名以及表的结构进行修改以满Informatica学习快速入门文档足我们的设计需求,但是我们在WorkFlow中实现数据抽取中对应的源和目标要和此结构相同,如果要满足变化的源和目标,可以通过Visio设计来转换为Mapping来实现。Mapping 设计和组件的使用PowerCenterDesigner通过Mapping来完成从源到目标的转换,Mapping设计器中包含了大量的转换组件固3剧则0a/p7。A*弘毒涯关于组件详尽的说明,可以打开文档具体学习:D.D.TnmEojjn

15、iition使他口口正口组件详解使他口口正口组件详解. .1由说明由说明.dococ转换组件一般包含,转换、端口、属性、以及元数据扩展转换:可以对该转换更改名称和附加具体说明。端口:转换组件大都包含转换输入端口和输出端口以及特定的操作或表达式。属性:该转换组件的特定设置元数据扩展:|巴胫噫到u目量浮第曝五法实例一:聚合抽取从源到目标,我们中间用聚合组件,对OWECHARGE进彳TSUM并按几个维组来聚合,如下图:从下图我们可以看到该组件端口中字段属包含:I、O、V、表达式、GroupBy等属性,对于OWE_CHARGE字段我们仅设置输入,创建自定义属性端口SUM_OWE_CHARGE,其表达式

16、为SUM(OWE_CHARGE),对于维度键勾选GroupBy,这样实现了细粒度到粗粒度的聚合每种组件都有自己特定的属性和特定的端口属性,我们通过属性设置或表达式来实现组件的特性,不同组件的搭配来完成整个Mapping的设计实例二:取 TOP 前三条记录源表数据则Mu*Quailfffrf当15,*,名粽翻据类型PBIHTJBONEirr_CDDE工红皿ESHQlO_FAYJ0Cl.fflErrjLXJDEstrsiieBEP0RT_H0HTK_ID靛连矗近F啰工屋丽啊_工口d*ciHCOWTBACT=ACCCilfflT_rDdec逅alCOKTEACTJHdsi-QTEADE.工口Ulrm

17、MEWT_IIIdacsMblCOJTSUME_Ki_IDdecinalCOWSVIflE_TMPE_IIlhniaalKEADEE_fD一加FKTEKACCOWnJSil町H_LD(ksohiOWE.CTORGIdtcinalPAIMEm:_OWE_IBCKEA.TEjm;专f,.,t.1.-.n,.=core2*1r_arjk_TaTifit_-D-rou.i!lCCTA7ari*tPsfiPiitiCTs睡右郭颜据类型:idlrninb电电!E)idZminb5。SCDFC!nunbr飙a),工Bre2nunbsr03)*number%i)rrrrrrjrr.rfrr,FFFFffff.

18、UIH协据空出,:工L.idlnmh位rt%id2nijilcr(p,scorelnaiber(p,scoreZ0BarkklhdifeKheb包:1jt?1)1)Lidn泰所 TfiANJZHDIX通滤女弼虱*时球top/bottom:取前或后NumberOfRanks:取多少位抽取结果:工 DIDI1V2SCQKE1SCQKE1KANKIHEEXKANKIHEEX_15S S8T8T7T7T1245 557577S7S2 23 35 5S S51515T5T3 3q q5 5S S8787777715 54 45 5575775752 2U6 6s5 5515157573 3实例三:抽取

19、XML 源雇员DTD定义:ELEMENTXHL_EMPLOYEESEMPLOYEE+)EMAIL*,EMPLOYMENT)!ELEMENTSTATEMELEMENTZIP(#PCntRTAELEMENTSALARY(fPCDATA设计如下:导入XML源结构为源,通过SQ分别将雇员信息分解为雇员表,雇员电话,雇员邮件,雇员薪水,具体设计如下图:WorkFlow 的设计和使用仓 1J 建 Session在做完Mapping设计之后,我们要抽取数据,接下来的任务就是WorkFlow的设计,在WorkFlow设计器中,数据抽取的基本组件是Session,Session是映射的一个具体实例,在创建一个S

20、ession时必须指定一个映射,并由这个Session决定了数据抽取的默认源和目标。|EMPLOYEEiJ_EliIPIjTEE)IXPItjMPL.iDEPIID./eiEPriD亭BMPaZOENFID二LASTHA1IE./USTSAMEonRsrawffi“WTNWEO-STKEETMI./AJHEESS.OCITT./ADimESS.STATE./ADDRESS.OB.DURESS.一号卧PLSTATa/nPUDTM.rDATEOFKIEE,/EFFLDTM.OPKDHE.刊ENAILd_EMJkIL)一VKPK-ENAIL-FK_EHP.ENAIL,;SALARYiJ._5ALAR

21、T)国EHLS*.:卜a:,第FK_EHH.OSALARYE3MLDSQ_ML_&plFMlTJEjJ皿SQUTCVQus.lifiT名称IPalLhX_EMPU0YEE一XFK-EHPL卜用DEFTJZD./enEriiD.ElflPID,/SHFD*QLA5THWIE./LASTXJfflEOFIBSTffAME./riRSTBWIIESTREET疝./ABDMSS.0cIH./ABDKESS.OSTATE./IDRISSOZIF./ABDKES3.rDMEDFHIRE./EMFLOIM.*XJHDKE一节,FK.F加配FB:_EMPLCHEEfF而NEraMAILrVXFJLEHAILK

22、_EMFLO.BEWAIL,*,.IK_SAARrXFEALART蹄FIL丽LO.QSUJiET.*11卜键名林数据类VKfK_EHMTEEnuftber:HEFTEDvaTith-e!-EMFID中物d:LA5TNWIEvareht:FIESTMEvarch-a,TPTtwrATinfTr,I匡FJQNIQf.FHDlfE)名称名称XP.th如错类或Bunber(v-arckar键名称皆.XfK_FHDlfE电FK_EMPUYEE:FHOXB数据类坦aiMiter(msibn*fqT型由钻2XFILEIIAILV:FK.EMPUtKfEBO:EHIIL键名称Q.XFK_SnAEf电:FE_E

23、MFL(JYEE1:EALAEY熟桥类工nimher工aumtfer(fvu-chu-Session,我们打开WorkFlow设计工具,从工具上选择这样我们就可以创建我们的源是Oracle表结构,在这里相应的设置数据库连接即可,如果源是文件,则要指定TracingLevel设置为Normal,TracingLevel为数据抽取监控日志的级别淮疑闻性前生时爱联肘|殂件元物指耕足IStxskwn,何引用j江京GW碱二B口祐葫菖ACGTOANS诲3nMeTPAN5嗤笔告路径和文件名,我们将源的从库中选择已经设计好的Mapping,确定双击已经创J建好的Session,设置默认的映射,源,以及目标实例,例如在设计源的时候,尸鸣-COCcmnevtionM.aECreEt口 JIEs-t.5M_SZM_FAI1I!1T_O白锄陋电连按由内存医生&文件目录嵇命专Sfl_SZDI_FATBIrr!-Eg”设计 WorkFlow打开打开启动任符启动任符通过任务后的工喻通过任务后的工喻. .冷启动任务冷启动任务逋逋过任务冷启动工彳过任务冷启动工彳恢复任箝恢复任箝属性属性查看查看永久值永久值.从WorkFlowMonitor上可以看到动行状况并查看日志,在完成Session创建后,点击f.Sn

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论