




已阅读5页,还剩10页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
一个典型的bi系统介绍商业智能系统应具有的主要功能:读取数据可读取多种格式(如excel、access、以tab分割的txt和固定长的txt等)的文件,同时可读取关系型数据库(对应odbc)中的数据。分析功能关联/限定关联分析主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。关联分析的重点在于快速发现那些有实用价值的关联发生的事件。数据输出功能打印统计列表和图表画面等,可将统计分析好的数据输出给其他的应用程序使用,或者以html格式保存。定型处理所需要的输出被显示出来时,进行定型登录,可以自动生成定型处理按钮。以后,只需按此按钮,即使很复杂的操作,也都可以将所要的列表、视图和图表显示出来。以国外的一个bi系统为例,我们来介绍一个bi系统的主要功能,这个系统主要包含数据仓库管理器(warehousemanager)、数据复制(datapropagator)、多维数据库(olapserver)、前台分析工具(wiredforolap)以及数据挖掘(intelligentminer)、ondemand。数据仓库管理器(warehousemanager)它主要由以下几部分功能组成:数据访问,数据转换,数据分布,数据存储,靠描述性数据查找和理解数据,显示、分析和发掘数据,数据转换过程的自动化及其管理。它缩短了复杂的海量数据与有洞察力的商务决策之间的差距,有助于公司更进一步了解其业务、市场、竞争对手和客户。数据复制(datapropagator)datapropagator提供的复制功能允许从一个数据源读取数据并把它送到另外一个地方,而且可以是双向的。当发生冲突时,可自动检测出来并进行补偿。此外,它还有以下特色:1)pullarchitecturethroughstagingtables(分级表牵引式体系结构):二个组成部分-capture和apply。capture部分在源数据库服务器上运行,它捕获要被复制的数据,并把数据放入服务器分级表中;apply部分在目标机上运行。在用户定义的时间间隔里或某个事件发生后,它连到源数据库中,并从分级表中抽取所需的数据。这种被动的“牵引式”体系结构减少了数据源的额外开销,能够支持数据源及目标机的独立运作性以及新一代流动计算机作为目标机的数据复制。这种体系结构还支持中介分级表,其中最初的源可以复制到区域目标中,然后再复制到各区域内的目标机上。(2)支持更新和修正:既支持更新也支持修正复制。apply可以完全替换目标数据或者仅仅修正上次复制以来所发生的改变。(3)改变事务运行记录的capture:捕获数据修改。它从数据库运行日志(log)中读出修改,从而抓取用于复制的数据修改,进而安排好这些数据。这就减少了对源的额外开销,不需要另外处理如触发器。甚至可以直接从内存中读运行记录,以减少i/o。(4)加工数据:数据首先要从运行记录移到分级表,所以能在复制之前加工或处理它;由于分级表是数据库表,使用标准sql就能定义加工处理功能。除了通过sql来构造子集,汇总并连结表以外,分级表还能提供基于时间分析源数据改变的方法。这要考虑到整个新一类的应用包括检查跟踪,历史分析,”asof”查询等等。(5)gui管理机构:通过图形用户界面可以定义和管理数据拷贝,定义代码和触发器没有专门语言。这样最终用户就有权定义和管理,而不仅仅是dba和程序员的范围。多维数据库服务器(olapserver)该工具在商务智能中扮演着重要角色,可以深入最终用户的业务,对桌面上的数据进行实时操作,能够快速地分布传统监视和报告范围之外的应用程序数据。数据挖掘工具(intelligentminer)当用户的数据积累到一定数量时,这些数据的某些潜在联系、分类、推导结果和待发现价值隐藏在其中,该工具帮助客户发现这些有价值的数据。wiredforolap使用该功能可以提高信息技术组织的效率。信息技术人员可以让用户利用分析和报表的功能获得他们所需的信息,而不会失去对信息、数据完整性、系统性能和系统安全的控制。(1)强大功能的报表繁忙的信息技术部门可以在几分钟内创建用于在企业中分发的完善的报表。,决策人员可以从该web页面上找到可用的一系列报表。(2)图形化分析远远超出对数据的静态图形化视图,提供强壮的图形化olap分析。决策人员可以根据需要排序、分组数据并改变“图表”(chart)的类型(直方图、饼形图、线图、堆积图)。图表中的元素可以被“钻取”到其他的细节层次,并可以返回来恢复一个概要性的视图。(3)多种图表视图:直方图、线图、组合图、饼形图、堆积图和离散点图(4)可在任何地方“钻取”没有路径的预先定义(5)完善的报表:复合报表通过用各种不同的形式(交叉表、图表、表格或以上几种形式的组合)来表现分析结果,对工作进行概括;优美格式的商用报表。(6)交互式的、立即的“所见即所得”(wysiwyg)显示ondemand该工具提供给客户一套高性能的解决方案来进行在线捕获、存储和重取计算机输出的文档。它使得落后的纸张文件搜索和使用缩微胶片阅读器搜索称为历史。有了ondemand,客户可以立刻发现特定的信息并且很容易地浏览它,而不用在庞大的数据和纸张中苦苦寻找;存储、重取和分发企业产生的信息比以前更加方便和易于接受。泰康人寿以bi实现战略转型泰康人寿保险公司从建立之初,就意识到信息化建设对企业发展的重要性。为促进业务的开展,泰康人寿已经建立有多个业务信息系统,主要包含:财务系统、个险系统、团险和银行险系统,呼叫中心以及用于开展电子商务的泰康在线交易系统。这些系统从企业不同需求层面很好的支持了泰康人寿的业务运营。但由于各个系统都有自己的数据,如何将分散在不同系统的客户数据集中起来有效使用,为各部门提供数据分析能力,为决策提供依据,成为目前需要解决的问题。为此,泰康人寿希望建立一套以crm为核心的商务智能系统(bi),使公司管理人员能够对与客户(现有客户以及潜在客户)有关的各种要素(需要、方式、机遇、风险、代价等)和企业运营当中各项关键指标(kpi)做出分析与评估,以便于为本企业赢得最大的回报。泰康人寿商务智能项目最终选择了sybase寿险行业iws解决方案,并以此为基础整合原有的五大业务系统,实施九项业务分析主题。在实施方法上,泰康保险采用了增量式开发,也就是整体设计、分布实施的策略,这可以使泰康人寿能够边实施边见效,并且使用过程中的反馈信息将有助于下一步的开发工作,因此极大地提高了开发的效率。bi项目分成两个主要阶段:第一阶段,完成bi项目的一个或二个分析主题。第二阶段,以第一阶段建立的分析环境为原型,进行更进一步的需求调研,完善和明确bi项目的业务需求,全面地进行iws的客户化工作。商务职能系统能够使泰康人寿在成本、收入和战略方面获益。成本方面:借助商务智能系统,泰康人寿可以得到完整的视图,来分析成本构成,改变成本管理现状,降低业务运作成本。通过crm系统提供的各项分析数据,泰康人寿能在商业活动中,以更低的风险,做出最明智的决策。收入方面:通过对营销员和营销机构产能的分析、利润的分析,可以大大改进泰康人寿在营销过程中的效率,加速产品上市时间,获得更精确更全面的市场和客户信息,实现与合作伙伴之间更好的合作,提高团队效率,保证将重要客户信息提供给需要方而提升交叉销售业绩。战略方面:借助商务智能平台,泰康能对不断变化的市场环境、客户需求做出更快的反应。从历史数据中选择不同的角度考察消费行为,评估客户价值,细分客户群;针对不同的客户群发掘消费特点,建立数据模型,对不同的客户群做出预测;估计对收益或利润的影响,对市场活动的效果进行预测,通过设置商业规则,进行复杂的市场划分;最终帮助泰康实现从以产品为中心的战略,转换到以客户为中心的战略。session1:医院智能分析业务与需求session2:解决方案技术框架与demo效果;session3:关键技术和实现;etl-如何确定起始来源数据howisthesystem-of-recorddetermined?如何确定起始来源数据?答:这个问题的关键是理解什么是system-of-record。system-of-record和数据仓库领域内的其他很多概念一样,不同的人对它有不同的定义。在kimball的体系中,system-of-record是指最初产生数据的地方,即数据的起始来源。在较大的企业内,数据会被冗余的保存在不同的地方,在数据的迁移过程中,会出现修改、清洗等操作,导致与数据的起始来源产生不同。起始来源数据对数据仓库的建立有着非常重要的作用,尤其是对产生一致性维度来说。我们从起始来源数据的越下游开始建立数据仓库,我们遇到垃圾数据的风险就会越大。etl架构师面试题(中文)etl架构师面试题(中文)本部分的题目来自kimball的etltoolkit著作,原著未直接给出答案。这里的中文题目和答案是我参考其原著按自己的理解整理而来的,仅供参考。对于其中不确切的地方,欢迎大家一起沟通。有兴趣的朋友可以直接阅读原著。-答案持续更新中,点击题目可见答案。分析1什么是逻辑数据映射?它对etl项目组的作用是什么?2在数据仓库项目中,数据探索阶段的主要目的是什么?3如何确定起始来源数据?架构4在etl过程中四个基本的过程分别是什么?5在数据准备区中允许使用的数据结构有哪些?各有什么优缺点?6简述etl过程中哪个步骤应该出于安全的考虑将数据写到磁盘上?抽取7简述异构数据源中的数据抽取技术。8从erp源系统中抽取数据最好的方法是什么?9简述直接连接数据库和使用odbc连接数据库进行通讯的优缺点。10简述出三种变化数据捕获技术及其优缺点。数据质量11数据质量检查的四大类是什么?为每类提供一种实现技术。12简述应该在etl的哪个步骤来实现概况分析?13etl项目中的数据质量部分核心的交付物有那些?14如何来量化数据仓库中的数据质量?建立映射15什么是代理键?简述代理键替换管道如何工作。16为什么在etl的过程中需要对日期进行特殊处理?17简述对一致性维度的三种基本的交付步骤。18简述三种基本事实表,并说明etl的过程中如何处理它们。19简述桥接表是如何将维度表和事实表进行关联的?20迟到的数据对事实表和维度表有什么影响?怎样来处理这个问题?元数据21举例说明各种etl过程中的元数据。22简述获取操作型元数据的方法。23简述共享业务元数据和技术元数据的方法。优化/操作24简述数据仓库中的表的基本类型,以及为了保证引用完整性该以什么样的顺序对它们进行加载。25简述etl技术支持工作的四个级别的特点。26如果etl进程运行较慢,需要分哪几步去找到etl系统的瓶颈问题。27简述如何评估大型etl数据加载时间。实时etl28简述在架构实时etl时的可以选择的架构部件。29简述几种不同的实时etl实现方法以及它们的适用范围。30简述实时etl的一些难点及其实现方法。etl-逻辑数据映射whatisalogicaldatamappingandwhatdoesitmeantotheetlteam?什么是逻辑数据映射?它对etl项目组的作用是什么?答:逻辑数据映射(logicaldatamap)用来描述源系统的数据定义、目标数据仓库的模型以及将源系统的数据转换到数据仓库中需要做操作和处理方式的说明文档,通常以表格或excel的格式保存如下的信息:目标表名:目标列名:目标表类型:注明是事实表、维度表或支架维度表。scd类型:对于维度表而言。源数据库名:源数据库的实例名,或者连接字符串。源表名:源列名:转换方法:需要对源数据做的操作,如sum(amount)等。逻辑数据映射应该贯穿数据迁移项目的始终,在其中说明了数据迁移中的etl策略。在进行物理数据映射前进行逻辑数据映射对etl项目组是重要的,它起着元数据的作用。项目中最好选择能生成逻辑数据映射的数据迁移工具。-补充:逻辑数据映射分为两种:1:模型映射:从源模型到dw目标模型之间的映射类型有:一对一:一个源模型的数据实体只对应一个目标模型的数据实体。如果源类型与目标类型一致,则直接映射。如果两者间类型不一样,则必须经过转换映射。一对多:一个源模型的数据实体只对应多个目标模型的数据实体。在同一个数据存储空间,常常出现会一个源实体拆分为多个目标实体的情况下。在不同的存储空间中,结果会对应到不同的存储空间的实体。一对零:一个源模型的数据实体没有与目标模型的数据实体有对应,它不在我们处理的计划范围之内。零对一:一个目标模型的数据实体没有与任何一个源数据实体对应起来。例如只是根据设计考虑,时间维表等。多对一:多个源模型的数据实体只对应一个目标模型的数据实体。多对多:多个源模型的数据实体对应多个目标模型的数据实体。2:属性映射一对一:源实体的一个数据属性列只对应目标实体的一个数据属性列。如果源类型与目标类型一致,则直接映射。如果两者间类型不一样,则必须经过转换映射。一对多:源实体的一个数据属性列只对应目标实体的多个数据属性列。在同一个实体中,常常出现会一个源属性列拆分为目标的多个属性列情况。在不同实体中,结果会对应到不同的实体的属列。一对零:一个源实体的数据属性列没有与目标实体的数据属性列有对应,它不在我们处理的计划范围之内。零对一:一个目标实体的数据属性列没有与任何一个源数据属性列对应起来。例如只是根据设计考虑,维表和事实表中的时间戳属性,代理健等。多对一:源实体的多个数据属性列只对应目标实体的一个数据属性列。多对多:源实体的多个数据属性列对应目标实体的多个数据属性列。作用:1为开发者传送更为清晰的数据流信息。映射关系包括有关数据在存储到dw前所经历的各种变化的信息,对于开发过程中数据的追踪审查过程非常重要。2把etl过程的信息归纳为元数据,将数据源结构,目标结构,数据转换规则,映射关系,数据的上下文等元数据保存在存储知识库中,为元数据消费者提供很好的参考信息,追踪数据来源与转换信息,有助于设计人员理解系统环境变化所造成的影响;开发设计者可以轻松的回答以下的问题:1、这些数据从那里来?2、这样的结果通过什么样的计算和转化得来?3、这些数据是如何组织的?4、数据项之间有什么联系?5、如果源发生变化,有那几个系统,目标受影响?etl-数据探索阶段的主要目的whataretheprimarygoalsofthedatadiscoveryphaseofthedatawarehouseproject?在数据仓库项目中,数据探索阶段的主要目的是什么?答:在逻辑数据映射进行之前,需要首先对所有的源系统进行分析。对源系统的分析通常包括两个阶段,一个是数据探索阶段(datadiscoveryphase),另一个是异常数据检测阶段。数据探索阶段包括以下内容:1收集所有的源系统的文档、数据字典等内容。2收集源系统的使用情况,如谁在用、每天多少人用、占多少存储空间等内容。3判断出数据的起始来源(system-of-record)。4通过数据概况(dataprofiling)来对源系统的数据关系进行分析。数据探索阶段的主要目的是理解源系统的情况,为后续的数据建模和逻辑数据映射打下坚实的基础。选择合适的etl工具etl解决方案包括数据抽取(e)、数据传输、转换与清洗(t)、数据加载、调度(l),etl系统将贯穿整个商业智能系统的全过程。目前,商业智能系统有两种实施策略:一种是将bi系统建造在目前已有的业务系统之上,以企业应用集成(eai)系统为核心,将各个业务系统的独立数据统一成标准数据格式(如xml),然后,由bi系统进行整合、分析、展现。此类bi系统通常是与eai系统捆绑在一起的,其架构读者可通过eai系统的相关资料进行了解,此处将不做讨论。另一种是将bi系统建立在企业级的数据仓库基础上,由数据仓库将企业的业务数据统一存储在企业逻辑数据模型架构中,然后,通过在数据仓库基础上建立逻辑或物理的数据集市、数据决策系统、数据在线分析系统等子系统,完成数据的整合、分析,然后由前端展现工具对已有的数据(原始数据、整合数据)进行汇总及展现。由于此类bi系统可以分步实施,用户可逐步建立其bi系统,所以成功率比较高。以目前已有的商业智能系统来看,此种架构将成为商业智能系统发展的主流。以下的讨论将以此种架构为基础。在企业级的以数据仓库系统为中心的商业智能系统中,其组成架构包括以下几部分:源数据系统可操作数据存储系统(ods)数据决策系统(dds)在线分析系统(olap)前端展现工具元数据系统商业智能系统运行的基础是互相独立、互不兼容的、复杂的源数据系统,各个源数据系统是企业在不同的历史时期建立的,面向不同业务需求的生产系统。因此,依照合理的方式整合源数据系统,将源数据统一存储在以企业逻辑模型构建的ods系统中,dds、olap、前端展现工具依照用户需求,对数据进行汇总、展示,并按照用户喜好的方式,将结果展现在用户面前是商业智能系统的基本任务。由于企业业务系统的复杂性,各个源数据系统的数据结构、格式、定义各不相同,为了能有效的整合企业数据系统,保持数据的一致性,并将数据统一地展现在客户面前,etl解决方案是用户唯一的选择。etl解决方案包括数据抽取(e)、数据传输、转换与清洗(t)、数据加载、调度(l),毋庸置言,etl系统将贯穿整个商业智能系统的全过程,如图所示,从源数据系统到前端展示系统的整个商业智能系统各个组件之间,都存在etl过程。etl方案对整个商业智能系统的重要性可与血液与人体的作用相提并论,一个有效的etl处理方案将是系统成功的首要因素。etl方案的选择应考虑以下方面:数据操作效率;数据操作时间周期;定制的灵活性。对etl来说,数据操作的效率是最重要的考虑因素。对效率的考察,应包括以下几点:1.是否支持复杂的数据操作;2.是否支持多任务并行操作;3.是否符合系统对数据处理时间窗口的要求。数据操作时间周期的支持包括:1.是否支持各种数据处理时间周期的混合操作;2.是否支持数据的小批量持续加载;3.是否支持数据的大批量定时加载。定制灵活性包括:1.是否支持数据依赖的建立;2.是否支持数据流的建立;3.是否支持操作定时启动;4.是否可扩展;5.开发环境是什么,开发是否简单、灵活。对于etl流程的建立,通常有以下两种方式:利用数据库系统、业务子系统工具自行开发购买现成的etl工具通常情况下,etl方案中,以上两种方式是同时存在的。一般情况下,利用各个子系统提供的工具进行自行开发,可充分利用子系统的优化操作,提高数据处理效率,但其灵活性和可扩展性欠佳;购买现成的etl工具(如eai、informatic等厂商的etl工具),可灵活定制数据处理流程,简化数据开发,缩短etl方案实施周期,但其处理效率较低。因此,建议读者应结合以上的etl建立方式,在保证etl性能的前提下,购买合适的etl工具。利用udf来调用操作系统命令和db2的常用命令由于db2是不支持复合sql语句内不支持调用操作系统命令,所以一些对应我们常用的一些语句如数据导入,导出是命令行而不是sql语句,都不能在存储过程中调用,必须写一些shell或者bat文件,进行脚本编制来进行。但是在我们的这种bi应用中,etl过程中的e过程,数据的导入是一件必不可少的过程,通过脚本的控制,比较麻烦和整个过程有点不是很完整。找寻是否有其他的解决方案。不过据说在新版本的db2上是可以支持的。但是我们都是用v8.1之前看了ibm网站的一篇文章,提到可以利用udf来执行纯sql中不可用的操作。因为udf可以用外部语言(即,sql以外的其它语言,如java,c)编写,并可以通过使用create语句向数据库注册,这样我们就可以编写一个java应用程序来调用操作系统命令和db2的常用命令。当这个外部函数注册后,我们就可以在存储过程中可以使用该函数,进行数据的导入,导出。参见资料“另一篇有关高级脚本编制的文章”和“如何注册javaudf”步骤:1、编写一个java程序(os_cmdudf.java)importjava.io.*;importcom.ibm.db2.app.udf;publicclassos_cmdudfextendsudfpublicstaticintos_cmd(stringcmd)runtimert=runtime.getruntime();processp=null;intsuccess=0;tryp=rt.exec(cmd);catch(ioexceptione)success=-1;return(success);2、运行javacudflogs.java编译javacos_cmdudf.java产生的结果是一个称为os_cmdudf.class的文件,随后需要将该.class文件复制到sqllib目录3、运行jar打包udflogs.class为os_cmdudf.jarjarcfos_cmdudf.jaros_cmdudf.class4、连上数据库,运行安装.jar文件到数据库db2connecttotestsuuserdb2admindb2”callsqlj.install_jar(d:ibmsqllibjavajdkbinos_cmdudf.jar,os_cmdudf)”之后os_cmdudf.jar安装到d:ibmsqllibjardb2admin的路径下。5、运行create建立函数dropos_cmd;createos_cmd(invarchar(1000)returnsintegerexternalnameos_cmdudf:os_cmdudf!os_cmdlanguagejavaparameterstylejavanotdeterministicnosqlexternalaction;6、测试os_cmd函数是否可用db2”valuesos_cmdudf(db2cmd.exe)”返回结果,1-01条记录已选择。函数可以用。7、建立调用os_cmd函数的存储过程。createproceduredb2admin.sp_exec(-输入参数inloadstrvarchar(1024),-输出参数outo_err_msgvarchar(1024)-支持语言languagesqlp1:begin-临时变量,出错变量declaresqlcodeintegerdefault0;declarestmtvarchar(1024);declarestatevarchar(1024)defaultaaa;-记录程序当前所作工作declarestatusintdefault0;-声明出错处理declareexithandlerforsqlexceptionbeginseto_err_msg=处理|state|出错|错误代码sqlcode:|char(sqlcode);end;-程序开始setstatus=os_cmd(loadstr);if(status0)thenseto_err_msg=stmt;endif;endp18、调用存储过程callsp_exec(db2cmd.exee:work_file济南商行测试db2测试dbconn_space.bat);dbconn_export.bat的作用(清空一个表):db2connecttotestsuuserdb2adminusingdb2admin/db2”loadfrome:work_file济南商行测试db2测试space.datofdelmodifiedbynorowwarningsmessagese:work_file济南商行测试db2测试space.logreplaceintojxdx_ckzhmx”db2connectreset9、验证存储过程调用的结果。db2selectcount(*)fromjxdx_ckzhmx注意:在测试这个功能的时候有一些细节没有注意,导致函数注册后不能调用。1、编译java源文件的编译器和执行的jvm的版本必须一致的db2v8.2安装时带的”1.4.1”;而本机又另外装了一个”1.5.0_05”之前没有注意,直接使用命令javac来进行编译,用的是默认1。5版本的函数注册后,调用出错,提示sql4304reasoncode”1”的错误信息;而给出的提示是说classpath有问题,所以注意力一直放到这个方面找问题所在后来才发现真正的问题是出现在版本上。最好直接在sqllibjavajdkbin的目录下编译后再copy。2、设置java环境几个关键的设置:参见文档:解决db2udbjava存储过程的常见问题jdk_path:这是一个数据库管理器配置(dbmcfg)参数。这个参数指出用来执行java存储过程的jvm或javadevelopmentkit(jdk)的位置。这是一个非常重要的参数。它的值应该设置为包含jvmjava可执行文件的“bin”目录的上一级目录的完整路径。在windows?平台上的一个例子是c:programfilesibmsqllibjavajdk。unix?例子是/usr/java1.3.1。jvm级别也非常重要,因为根据使用的db2level和平台级别,db2udb只支持某些jvm级别。java_heap_sz:这是一个数据库管理器配置(dbmcfg)参数。这个参数决定为java存储过程和udf服务的java解释器所使用的堆的最大大小。为了避免在java存储过程中耗尽内存,可以增加这个值。但是,如果在环境中要调用许多存储过程(即,每个jvm都会分配这么多堆空间),那么分配太多内存也是有害的。一般规则是保持java_heap_sz为默认设置,即512(4k页)。其他相关内容:一、如何安装jar文件到当前数据库:db2”callsqlj.install_jar(d:ibmsqllibjavajdkbinos_cmdudf.jar,os_cmdudf)”二、如何更新当前数据库中的jar文件:db2”callsqlj.remove_jar(os_cmdudf)”三、如何替换当前数据库中删除jar文件:db2”callsqlj.replace_jar(d:ibmsqllibjavajdkbinos_cmdudf.jar,os_cmdudf)”四、如何当前数据库中删除jar文件:db2”callsqlj.remove_jar(os_cmdudf)”五、如何刷新已经调用的jar或class,不用重启实例就生效:db2”callsqlj.refresh_classes()”通俗的讲:bo完成数据查询后,查询出来的数据存储在本地;cognos完成数据查询后,查询出来的数据存储在服务器上。因此,bo可以在数据刷新完成之后直接利用客户端的切片/旋转等功能直接进行多维分析,而cognos可以将查询出来的数据以excel文件的形式保存到本地,然后使用excel的数据透视表功能进行多维分析。bo使用聚合表技术可以先将报表需要的常用维度的汇总数据存储到聚合表中,bo的语义层可以识别一个查询是否需要访问包含明细数据的表,如果该查询不需要明细数据,则生成sql时直接访问聚合表,可以提高报表生成效率。cognos不能实现此功能,所以查询部分报表的效率会有所下降,查询时间会变长。bo中的语义层类似于cognos中的主题bo在前端展现方面比较突出,用户接受程度较高。是目前主流的商业智能工具之一,但因其没有olapserver,导致数据监控功能较弱,虽然也可以与微软或oracle的olapserver挂接,但这样毕竟受制于人,给客户提供的方案也不是最集成的。介绍businessobjects商务智能解决方案作者:administrator周四,1311月200812:23businessobjects商务智能平台为客户提供了一个可扩展的基础设施平台,使信息得以准确及时地传递,提高了企业的洞察力。bo商务智能平台可以获取来自任何地方的数据,无论在最新的erp中,还是散布在各处角落的历史文件中。该系列包括:信息发现与发布(informationdiscovery&delivery)数据可视化和报表模块-通过报表和仪表盘把数字转换为容易理解的、可交互的视觉信息;能让员工安全地独立访问任意数据源,并在excel环境中创建效果惊人的仪表盘/报表。数据分析和分发模块-该模块是报表与仪表盘功能的延伸,它让普通用户直接在报表/仪表盘上分析信息,钻取数据。并把分析结果分发到各个地方,例如:移动设备,桌面,email,门户网站和搜索引擎中。企业信息管理(enterpriseinformationmanagement)数据集成(di)与数据质量管理(dq)模块-管理企业所有的数据库(包括sap与非sap),执行最常见的数据库应用,如:etl(抽取、转换和上传),数据清洗等。主数据管理模块(mdm)-使企业能够以巩固,协调和集中的方式管理关键业务数据。制定数据行业标准,帮助企业管理全球的主数据。sap集成解决方案(integrationforsapsolutions)sap基础解决方案使sap用户能够提取sap系统内包含的商务智能信息。businessobjectsintegrationforsapsolutions由以下主要组件组成:crystalreports是允许依据sap数据创建报表的报表设计工具;businessobjectsenterprise提供了用于在web上管理、计划和分发报表的框架。该解决方案允许voyager、webintelligence、liveoffice以及xcelsius之类的工具依据sap创建报表。businessobjectsinfoview允许在web上共享报表,并且sap身份验证在sap系统与businessobjectsenterprise之间实现了单一登录。rapidmartsforsap为用户提供了各个sap不同主题的数据集市etl模板,样本语义层与报表。以便用户通过bo的etl工具快速实施常用的数据集市。bi-一般的实施步骤:商业智能的实施用户不仅要选择合适的商业智能软件工具,还必须按照正确的实施方法才能保证商业智能项目得以成功,项目的实施步骤可分为:2.1需求分析在其他活动开展之前必须明确的定义企业对商业智能的期望和需求,包括需要分析的主题,各主题可能查看的维度,即需要发现企业哪些方面的规律。2.2数据仓库建模通过对企业需求的分析,建立企业数据仓库的逻辑模型和物理模型,并规划系统的应用架构,将企业各类数据按照分析主题进行组织和归类。2.3数据抽取数据仓库建立后必须将数据从业务系统中抽取到数据仓库中,首先将来自运营、财务、crm等不同数据源的不同类型数据采用数据整合平台进行抽取、净化、转换和装装载,形成可以被系统识别的统一数据格式,导人数据仓库存放。2.4建立分析报表商业智能分析报表是数据仓库信息的展现,根据客户户的不同需求,利用多种展现工具,可以将存放在数据仓库中的历史数据进行展现和挖掘,生成报表,或者生成展现图表,进行分类和聚类,进行多维度检索等。无论是企业的高层管理者,还是普通的业务人员,都可以根据展现出来的数据或者挖掘出来的关联信息,辅助自己做出下一步的生产营销决策。2.5数据测试与系统改进要使系统成功交付使用,最终用户的培训与软件测试是关键的环节,可以找出系统的不足,以更好地适应实际应用。在用户使用一段时间后可能会提出更多的,更具体的要求,这时需要再按照上述步骤对系统进
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 学生熬夜急救知识培训课件
- 学徒美甲知识培训内容课件
- 学前班育儿知识冬季培训课件
- 二零二五年度文化创意产业园区店面房租赁与知识产权合同
- 二零二五年婚礼摄影摄像行业产业政策咨询合同
- 二零二五年度二手房买卖垫资+房产交易心理辅导合同
- 二零二五年度全面财务风险控制服务合同范本
- 2025版汽车维修行业维修技师职称评定与合作合同
- 2025版建筑工地材料采购合同范本(含合同执行监督)
- 2025版房地产抵押贷款估价报告合同
- 2025年云南省高校大学《辅导员》招聘考试题库及答案
- 消费品市场2025年消费者对绿色包装认知及需求调研可行性研究报告
- 台球厅消防知识培训课件
- 充电桩运维服务协议
- 2025至2030中国防砸安全鞋行业运营态势与投资前景调查研究报告
- 2025年医疗器械仓库管理培训试题及答案
- 2024年湖南省古丈县事业单位公开招聘工作人员考试题含答案
- 工程项目成本核算制度
- um-joyo c2001跨平台监控防误一体化系统使用说明书
- 输液泵/微量注射泵使用技术操作考核评分标准
- 国家科学技术奖学科专业评审组评审范围简表
评论
0/150
提交评论