datastage企业版产品白皮书之四_第1页
datastage企业版产品白皮书之四_第2页
datastage企业版产品白皮书之四_第3页
datastage企业版产品白皮书之四_第4页
datastage企业版产品白皮书之四_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Ascential,(ERP,(SCM(BI,ETL,数据质量和元数据AscentialProfileStageAscential数据管理技术。数据和建立企业数据管理系统的过程自动化、简单化。AscentialProfileStage使分析。AscentialProfileStageAscentialProfileStage信息建造数据模型并且优化目标数据库定义。AscentialProfileStage靠全面理解AscentialDataStageETL寻求从周围企业组合数据的所有项目都挣扎在同样的岩石上:元数据。结构,即所用域的类型,哪些域是关键字,域的长度,数据之间的相互关系,和数据的其他信息。例如,在 务部门的顾 (工 )和在运送部门的顾(家庭)AscentialProfileStage,项目能自动避免在数据库里存有错误的的问题。分析家研究显示超过百分之75%的数据综合项目不是超出预算的限制就是彻底失这么高率?在很大程度上,传统的数据综合方法采取下列步骤:分析用户的需求并且建立目标数据库说明书:在用户之后,为数据库模型设分析可利用的数据源:一套来自旧系统、操作系统、等等的数据,为了目标数据库,而被编辑分析,以确定他们的关联性。可能得不到数据源的文档,或者可能建立一套源数据到目标数据库的映射:设计一个把各种各样的数据源转换成目标ETL工具或手编码程序来完成这步。准备数据:源数据被装载到集结地区,被整理、清洁,并转换为目标数据所需的形式。为规范数据和连接,数据质量软件可以部署在这个阶段。数源中获得。很多公司在数据综合项目上已经花费了数百万,仅仅发现源数据不支序员独立小组手工完成的步骤组成,而每步之间的不连续性经常导致发生。2有自动化元数据逆向工程工具,开发者要亲自源数据。旧系统元数据的文档通常通常能解释数据的人员已经离开公司。对数据仅使用偶然的推测而不是内容完整的分析这导致在开发周期中综合源数据往往被错误地修改调整进入目标数据元数据里的错误不是在设计阶段被发现而是反映在产品系统中。正如史蒂夫・McConnell所的,...如果一个瑕疵在早期(在需求或设计期间)10100(1)在数据综合情况W.H.Inmon的工具,就要花费企业数据仓库预算中的大部分。AscentialProfileStage,数据综合项目有很多缺陷要克服,这是昂贵说明的数据描述软件,经常导致企业花费他们项目预算中不必要的规模可观的,AscentialProfileStage元数据与实际数据不匹配。通过多种方法,数据已经与正确的元数据之间存在差/调试阶段才发现这错10100倍。现有的数据经常无效。例如,在新系统里日期域可能包含无效日期,譬如在MMDDYYYYYYMMDD源数据的文档不存在或者确保证是独特的并且能被用作关键字的域已被并引起以前两个单独系统合并,为代码值建立了相的域值。例如,对未来期望值,110B使用A-F的范围表示,而新公司的文档指1-10的数值。数据元间的关系在原来系统里不存在。这个问题由数据标准化而引起。例如,COBOL也许要求综合多。这一过程的具体的例子将是把一个记录中COBOL,假设依赖关系是不正确的。例如和的部分之间的关系根据说明是一,多的关系,但有很多没有相应的部分原说明中声称是冗余的域而实际上却不是。例如,用户可能告诉我们那两栏可能在数据模型标准化期间消除,但数据里的实际值表明存在一种关系,这与我们所目标数据库必须从基数据库的数据模型手工建造出来。这是容易出错的过程,可能导致缺少或丢失数据,同样,在再建立存在数据库的关系的过程中也容综合进行修改将导致的错误出现。东不能有效参与。在后续的过程中,来自这部分数据的输入经常远离数据的正常ETL的范围巨大的大项目将产生不可避免的ETL处理成为一系列循环,一再重复处理过程,调试结果数据库,而不是核AscentialProfileStageAscentialProfileStage在理解源数据之后,综合数据项目研究小组仍然令人生畏的,使用有意AscentialProfileStageAscentialProfileStage,整个过程能很容易地加快。AscentialProfileStage方法由两项基本的活动组成:DDL程序。第一部分分析在于为建立源数据库广泛地描绘出源数据。这描绘确定数据和存在于各种各样元间的关系的特征。分析的10字符数字字段可转换成带符号的2字节整数,但是实际范围将需要4个字节。分布类型:值的分布表现形式。某一确定数值超出N的标界,这是否了?能空/NULL用户建议转换类型。求值时,用户可为源数据指定转换类型。例如,各种各样的普通数据类型。数据符合普通数据类型的模式吗?如,,社会AscentialProfileStageAscentialProfileStage实的项目有关源数据的任何现有的有效文献可以被核实列分析之后源数据的完整数据库的列分析时,创建源数据的实例分析样本,用于下一个分析期间的分析。通过利用数据的分析样品,大量计算的运行性能被戏剧性的改进了。到元数据贮藏库。在列分析完成之后,用户将准备表分析。表分析是在一内找出列之间的关系。用这些关系计算功能的依赖性。MannilaRaihaX_Y表明,对于被给定值与属X,YC1是功能地C1C2x%,x这些功能的依赖性来自那些真实的源数据,而不是来自问题文档或是猜测出来的。通过利用表分析的结果,AscentialProfileStage能推断项目单元(例如关键字,标准化参考者,和获得的列。这信息能用来测试用户对在数据内包含的关系的理解。数据内的事务规则可以被推断。AscentialProfileStage里,数据库包括项目里有关所有元数据的信息。这个仓库提供依据,为产生数据轮数据轮廓报告能用来详细描述来自建立数据轮廓阶段的信息。以这些报告为依据,可以估计项目的范围,可以从最终用户和股东那里获得签字,还可以源数据的真实结构。报告能输出到用户的屏幕、、文件、或者到HTML。分析能确定那些被外关键字表示的关系。因此,AscentialProfileStage能提示用户确认存在的外关键字。如果这些关系并不意味着外关键字,那么关系可能真是多AscentialProfileStage系,AscentialProfileStage能为数据综合产生映射。用户可使用映射环境修改那些源到目标的映射,这些映射是被自动映射产生器定义的。来自AscentialDataStage的ETL功能可被包括作为的一部分。编辑器为源到目标之间的映射提供下拉式编辑环境。这些映射可作为一份报告通过网络从其他用户那儿买进。ETL数据库产生时,AscentialDataStage因为AscentialProfileStage方法为目标数据库从被在AscentialProfileStage元数据贮藏库的信息处获得数据模型,将自动计算源到目标的映射。AscentialProfileStage为修改源到目标的映射提供一个直接并且有效的接口,包括附加专栏、转换和概要。AscentialProfileStageAscentialDataStage工作变换的代码。上述例子把非标准化源数据库转变成完全标准化的目标数据库。程AscentialDataStage(DDL)和装载目标数据库的AscentialDataStage工作只是功能强大的AscentialProfileStage的一小部分。AscentialProfileStage也产生星型图解。为把数据从操作数据存贮区移到星型图解结构去,自动ETL工作。通过用现有的工具进行严密的集成,AscentialProfileStage为规则的建立和ETL的产生提供环境。在用户确认源到目标的映射的正确性后,AscentialProfileStageAscentialDataStageASCIIAscentialDataStage统的步骤合并进综合的过程,避免了传统的手工过程的缺陷。使用AscentialProfileStageAscentialProfileStage根据实际存在,而不是从那些开AscentialProfileStage确保规则是被正确定义过的。描述源数据的准确文档自动从系统里的报告生成、并由用户证实。文档是作为一个副产品自动产生的,并能反映出存在系统的实际数据信息。并没有对开发了生成源数据的应用程序的程序员的依赖。唯一需要的资源是对数AscentialDataStageAscentialProfileStage题。但是通过消除传统的各种步骤的数据综合项目遇到的一系列巨大的缺陷,AscentialProfileStage能戏剧性地降低项目所需要的时间和工作量。AscentialProfileStageAscentialProfileStageAscential(纳斯达克:ASCL)户和使用Ascential的企业综合套餐安心地把数据转变成准确的、可靠的和完AscentialWestboro,Mass.,3,000伙人,涉及行业为金融服务和银行业、业、业、零售

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论