数据仓库中的ETL和Metadata_第1页
数据仓库中的ETL和Metadata_第2页
数据仓库中的ETL和Metadata_第3页
数据仓库中的ETL和Metadata_第4页
数据仓库中的ETL和Metadata_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据仓库中的ETL和Metadata2023/5/27数据仓库中的ETL和Metadata数据仓库简介元数据的实际问题元数据与维护数据仓库数据仓库中的ETL和Metadata数据仓库简介数据仓库中的ETL和Metadata数据仓库是……数据仓库是面向主题的、集成的、不可更新的(稳定性)、随时间不断变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程W.H.Inmon数据仓库中的ETL和Metadata元数据组成(Metadata)业务系统到数据仓库

数据仓库

数据展现工具ETLTargetDatabaseFront-EndTool数据采集数据传输数据转换数据清洗数据加载数据汇总数据模型人事销售库存财务RDBMSODS/StagingAreaRDBMS数据仓库数据集市企业经营分析客户关系管理业务流程分析财务分析Metadata外部系统StatisticsClusteringNeuralNetsArtificialIntelligence业务股东管理OLAP数据仓库中的ETL和Metadata“维”Keys属性Facts地点Table时间Table产品Table客户TableManyRecords...数据仓库中的ETL和Metadata数据仓库不是……某种具体的产品简单的数据物理集中只能输入而不能输出的仓库报表中心可以一期到位的工程业务分析专家的替代品……数据仓库中的ETL和Metadata术语解释ETL(Extract/Transform/Loading)是数据从业务系统抽取转化到数据仓库的过程Metadata可以理解成Dataaboutdata,关于数据的数据数据仓库中的ETL和Metadata术语解释OLAP(On-LineAnalyticalProcessing)面向分析的在线处理OLTP(On-LineTransactionalProcessing)面向交易的在线处理数据仓库中的ETL和Metadata术语解释数据集市则是范围较小,面对单一主题或部门,同样是为了查询、报表、分析等目的进行优化ODS(OperationalDataStore)通常作为混合性可操作数据源StagingArea是数据处理区域,为了实现ETL过程的临时存储数据挖掘是通过一些数学方法对数据进行深层次的分析从而发现其规律数据仓库中的ETL和Metadata前端开发ETL开发需求/建模数据仓库项目三部曲数据仓库中的ETL和Metadata元数据的实际问题数据仓库中的ETL和Metadata数据仓库中的ETL和Metadata仓库过程仓库操作转换XML记录型多维关系型业务信息软件发布UML1.3对象OLAP数据挖掘信息可视化业务术语数据类型表达式键索引类型映射管理资源分析基础对象模型举例:CWM模型数据仓库中的ETL和Metadata数据仓库中的ETL和Metadata数据仓库的整合性是基于元数据的统一ETL是数据仓库从业务系统获得数据的必经之路,元数据则是地图建立可维护的数据仓库依赖很多因素,ETL/Metadata是非常重的两大块数据仓库中的ETL和MetadataCustomerCustomerNumberNameAddressComments建模工具CustomerTblCustomerIDNameAddressAddress1CommentsETL工具CustomerDetailsCustomerNumberNameAddressRemarks前端工具CustomerIDNameAddress1Address2Descr数据仓库客户标记,加前缀进行区分对公和对私客户客户标记,01打头表示对公客户,02打头表示对私客户无描述客户标记,01打头表示对公客户,02打头表示对私客户,03打头表示海外客户多个系统都包含元数据数据仓库中的ETL和Metadata不同的字段名补充字段业务定义不同CustomerCustomerNumberNameAddressComments建模工具CustomerTblCustomerIDNameAddressAddress1CommentsETL工具CustomerDetailsCustomerNumberNameAddressRemarks前端工具CustomerIDNameAddress1Address2Descr数据仓库客户标记,加前缀进行区分对公和对私客户客户标记,01打头表示对公客户,02打头表示对私客户无描述客户标记,01打头表示对公客户,02打头表示对私客户,03打头表示海外客户数据仓库中的ETL和Metadata哪份正确?正在使用哪份?应该用哪份?CustomerCustomerNumberNameAddressComments建模工具CustomerTblCustomerIDNameAddressAddress1CommentsETL工具CustomerDetailsCustomerNumberNameAddressRemarks前端工具CustomerIDNameAddress1Address2Descr数据仓库数据仓库中的ETL和Metadata项目中经常遇到的问题元数据定义在业务层面难以在多个系统或部门间统一数据质量的元数据被忽略需求难以确认,而且在不断变化对业务系统的元数据尚缺乏理解,就匆匆开始开发ETL过程,不断返工数据仓库中的ETL和Metadata建议首先做选择题,是否要先有模型再有数据仓库,然后决定元数据是否要统一结合业务系统文档,对数据质量做初步的评价,在ETL过程中引入校验点,然后不断完善数据仓库中的ETL和Metadata建议尝试用简单的报表和公式跟用户交流需求,分阶段来冻结需求对业务系统清晰的理解,会减少歧义而且及早的发现问题数据仓库中的ETL和Metadata项目中经常遇到的问题项目周期不断在压缩、延迟中反复,开发人员不再关心如何维护元数据的版本来自各种角落的元数据五花八门最终用户过分依赖报表本身,而不是元数据技术人员对元数据期望过高,集中在理论层面数据仓库中的ETL和Metadata建议当项目压力很大的时候,至少要做到分阶段的元数据一致性根据项目的具体情况,制定元数据管理的策略及形式,简单的项目可以尝试自行开发元数据管理,对于仓库模型及ETL的参数进行一些必要的管理数据仓库中的ETL和Metadata建议提供给业务人员一个友好的元数据访问、查询界面元数据的管理及标准尚未成熟,格式转换、查询、版本管理实现比较简单,并容易看到效果,进一步的分析则应该结合具体项目需求数据仓库中的ETL和Metadata元数据与维护数据仓库数据仓库中的ETL和MetadataLegalHROperationalDataSourcesDataSourcesDataWarehousemetadataExtract/Transform/LoadBusinessIntelligenceDataforAnalysisExecutiveInformationManagementReportingDailyReportingProductOperationalDataStoreFinancialCustomerStoreExtractTransformLoadExtractTransformLoadRealEstateDataQualitymetadataDataQualityEnterpriseMetadata数据仓库中的ETL和Metadata项目一期开发14个月ETL开发了9个月3.5个版本最终还是没有元数据二期……重做数据仓库中的ETL和Metadata用元数据维护仓库及时发现系统变化找出需要调整的ETL程序给出仓库中数据和指标的来源及规则调整仓库的数据模型促进项目组成员的沟通监控数据质量采用元数据跟用户确认新的需求数据仓库中的ETL和Metadata小结数据仓库中的ETL和MetadataETL/元数据配合整体的建设策略从简单元数据管理做起,规范ETL设计项目必须分阶段依据元数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论