已阅读5页,还剩8页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
/ERPruanjianshiyong/SAP_ruanjian/200912/25-4913.htmlSAP BW数据仓库简介本文从一个简单的业务场景-销售分析入手,介绍SAP BW(Business InfomationWarehouse)实现多维分析的基本方案与实现技术;结合销售分析的实际需求,给出了销售分析管理数据仓库在SAP BW(业务信息仓库)模块中的实现过程描述。 1、数据仓库的基本理论1.1 数据仓库数据仓库是对数据进行提炼、加工和集成含有一定量商务信息和意义的信息。数据仓库不是为了存储数据,而是为更好地利用企业内所有可能收集到的数据进行决策支持。数据仓库拥有以下四个特点:(1) 面向主题。在数据仓库中,数据被分类,并按业务数据主题的视角,对数据进行存贮。在OLTP(联机事务处理on-line transaction processing)中,数据是按业务应用的视角进行组织和存贮。(2) 集成。某个业务主题所包括的数据不会存贮在多个业务主题中。即某数据如果属于业务主题A,则不应该同时属于业务主题B。(3) 具有时间特征。存贮在数据仓库中的数据,均表示在某一时间点上所发生的事实,所以数据仓库的数据大部分都与时间相关,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。(4) 相对稳定。一般情况下,数据仓库中的数据不会被更改或删除。1.2 数据仓库系统的体系结构一般情况下,数据仓库系统是一个分层次的体系结构,如下图:数据源:是数据仓库系统的基础,整个系统的数据源泉。通常包括企业内部信息和外部信息。数据存储与管理:是整个数据仓库系统的核心。在现有各业务系统的基础上,对数据进行重新组织,最终确定数据仓库的物理存储结构,同时组织存储数据仓库元数据;数据仓库的管理包括数据的安全、归档、备份、维护、恢复等工作。OLAP服务器:对分析需要的数据按照多维数据模型进行再次重组,以支持用户多角度、多层次的分析,发现数据趋势。前端工具与应用:前端工具包括各种数据分析工具、报表工具、查询工具、数据挖掘工具以及各种基于数据仓库开发的应用。数据仓库不仅是存放数据的载体,还包括按照业务数据对业务系统数据进行整合处理的方法流程和构建在数据仓库的分析应用。2 数据仓库的多维建模技术2.1 建模原则数据模型的创建直接反映业务需求,对系统的物理实施起着指导性的作用,是数据仓库的核心问题。而数据仓库是面向主题的,一般按照主题来建模。数据仓库建模在业务需求分析之后开始,是数据仓库构造的正式开始。主流的数据仓库模型是由Kimball提出的多维模型。该模型 降低了范式化,以分析主题为基本框架来组织数据。以多维模型开发分析主题,能够快速实施,迅速获得投资回报,在取得实际效果的基础上,再逐渐增加应用主题,循序渐进,积累经验,逐步建成企业级数据仓库。在创建数据仓库的数据模型时应考虑:满足不同层次、用户的需求;兼顾查询效率与数据粒度的需求;支持用户需求变化;避免业务运营系统性能影响;提供可扩展性。其中,数据模型的可扩展性决定了数据仓库对新的需求的适应能力,建模既要考虑眼前的信息需求,也要考虑未来的需求。2.2 事实表和维表事实表和维表是多维模型中的两个基本概念。事实表是数据分析所对应的主要数据项,一般是企业内的某项业务或某个事件。事实表中的事实一般具有数据特性和可加性,事实表中可以存储不同粒度的数据,同一主题中不同粒度的数据一般存储在不同的事实表中。维表中包含的一般是描述性的文本信息,这些文本信息将成为事实表的检索条件。维表中的维属性应该具体明确,体现出维层次的划分,能够成为分析型查询的约束条件,这是数据仓库与操作型应用在数据模型设计上的一个不同点。维表层次的级别数量取决于查询 的粒度。在实际业务环境中,多维数据模型一般含有415维,更多的维数或更少的维数一般都很少见。在具体工作中,设计人员一定要根据企业的实际情况确定相应的维。在多维模型中,事实表的主码是组合码,维表的主码是简单码,事实表中与维表主码相对应的各个组成部分是外码。事实表通过与各维相对应的外码值同维表联系在一起。查询时通过事实表和维表之间的这种对应关系。2.3 星形模型多维数据建模以直观的方式组织数据,并支持高性能的数据访问。每一个多维数据模型由多个多维数据模式表示,每一个多维数据模式都是由一个事实表和一组维表组成的。多维模型最常见的是星形模式。在星形模式中,事实表居中,多个维表呈辐射状分布于其四周,并与事实表连接。位于星形中心的实体是指标实体,是用户最关心的基本实体和查询活动的中心,为数据仓库的查询活动提供定量数据。每个指标实体代表一系列相关事实,完成一项指定的功能。位于星形图星角上的实体是维度实体,其作用是限制用户的查询结果,将数据过滤使得 从指标实体查询返回较少的行,从而缩小访问范围。每个维表有自己的属性,维表和事实表通过关键字相关联。3、SAP BW数据仓库解决方案3.1 BW 产品SAP是全球最大的企业管理和协同化商务解决方案供应商、全球第三大独立软件供应商。目前,在全球有 120多个国家的超过76,000家用户正在运行SAP软件。财富500强80%以上的企业都正在从SAP的管理方案中获益。SAP BW解决方案,是数据仓库技术在SAP平台上的具体应用,通过预先内置大量标准模板,将数据仓库技术与各行业各模块的业务紧密结合,快速实现企业各个应用的信息整合,提供灵活的多维度的联机数据分析,强调长期(以年为单位)数据积累和分析指标的汇总计算,提供强大的报表设计功能,方便用户进行特殊报表的个性定制,提供回归、聚类、决策树等灵活的数据挖掘功能,提供一定的报表美化、自动批处理、分发和预警功能。BW是端对端的数据仓库解决方案,它采用了SAP公司企业解决方案中的众多技术,基于三层体系结构构建,编程语言是ABAP(Advanced Business ApplicationProgramming,高级企业应用程序),它使用ALE(Application Link Enabling,应用程序链接)和BAPI(Business Application Programming Interface,企业应用编程接口)来链接BW与SAP系统以及其它非SAP系统。BW 的产品结构图BW数据仓库的核心工具都位于Adminstrator Workbench中,主要功能包括:数据建模,数据抽取,流程管理和数据仓库的管理。ADMINISTRATOR WORKBENCH 它是SAP BW数据仓管理管理的继承界面(AWB),事务代码为RSA1。他为数据抽取,存储和处理提供了控制,监视和维护工具。AWB的主要区域包括Modeling,Monitoring,Reporting Agent,transport connection,document,business content,translation和metadata epository。从功能上,BW与其他类似产品有两个特点:1、BW只支持最多13个自定义的维度。(SAP文档介绍,这个限制的原因是,sap维度依赖于数据库中的关键字段,大多书数据库只支持16个关键字段,sap自己用了3个)2、BW有一个亮点是:能定义依赖于时间的维度层次结构。比如说 在公司部门项目 的维度层次结构中,项目A在2000年属于部门1,在2001年,被调整到部门2了,这一特点非常有用。3.2 BW的体系结构上图显示了BW的三层体系结构:1、顶层是报表环境。它可以是BW的企业资源管理器(Business Explorer,BEx)或者第三方的报表工具。BEx包括两个组件:(1)BEx分析器。是内嵌了BW的Microsoft Excel,它具有易于使用的图形界面,用户不必编写sql语句就可创建查询。(2)BEx浏览器。其工作方式类似于一个信息中心,它使得用户可以组织并访问各种各样的信息。第三方报表工具通过ODBO(OLAP的OLE OB)与BW的OLAP处理器相连。2、中间层是BW服务器。它主要执行三方面的任务:(1)管理BW系统(2)存储数据(3)根据用户的请求检索数据。3、底层由源数据系统组成。它可以是SAP的R/3系统、BW系统、平面文件以及其他的系统。通过抽取器(即所谓的ABAP程序)实现与SAP系统相连,通过ALE将平面文件与BW或R/3相连,通过BAPI与非SAP系统相连。3.3 BW业务目录BW的最大卖点之一在于它的业务目录。业务目录包含一些标准的报表和其他相关对象。例如,BW给销售经理提供了如下一些标准报表:1、报价处理。(例如各销售区域报价的成功率,各销售区域的报价跟踪,各销售区域总体报价信息等)2、订单处理。(每月的订单和收益,销售价值,账单文档,订单、运输和销售数量,订单满足率,信誉记录,到达订单的返回率,各客户的平均返还次数,返还的数量和价值,产品分析,产品盈利分析等)3、运输。(各销售区域的运输延误,平均运输处理次数等)4、分析和比较。(销售/成本分析,高盈利性客户分析,分销渠道分析,产品盈利性分析,每周运输统计,每月运输统计,到达订单分析,销量比较,销售额比较,各客户的平均利润,产品分析,每月到达订单和收益汇总等)5、行政和管理功能。(成本中心:计划/实际/偏差等等)BW丰富的业务目录有效的缩短了BW的实施周期,降低了实施难度,本文销售分析的实例也主要基于业务目录直接构建各类报表,从而将工作的重点放在数据仓库的构建上。3.4 BW项目实施方法论实施SAP BW项目,需要一个理想的项目团队,一般来说,需要包括下述人员:数据仓库设计师:负责监督整个项目,特别是结构设计和系统整合。企业分析师:负责获取企业需求和源数据系统的数据模型,特别是R/3系统。技术开发员:必须熟悉BW,ABAP,ALE/Idoc以及VB,并且能够创建BW对象和用户界面友好的报告。基础平台和数据库管理员:负责安装、维护BW系统、系统概貌、BW系统之间的通讯以及源系统。实际实施过程中,还要遵循一定的规则和步骤,下面是SAP提供的简化的BW项目规划方案:整个项目实施分为“设计-开发-测试-培训-上线”五个阶段组织。阶段1:设计 4、BW在销售分析中的具体应用4.1 需求描述假设一个负责规划和实施销售战略的销售经理,工作任务是:(1)监控和预测销售需求以及价格变动趋势(2)管理销售目标,协调销售力量和分析商(3)审查每个销售代表,办公室和地区的销售活动而且还假设该经理拥有下表所示的有关物料、客户和销售组织的数据。表一: 物料 箱320000705CUST011SREP011MAT0153.5箱420011225上述数据只是一个简化的业务场景,实际中,数据的规模是非常大的,对这类的在线分析处理(OLAP)所消耗的计算机资源非常大,他不可能在一个业务数据库系统内通过OLTP执行,因此,我们需要构造一个专门的数据仓库系统来完成该任务。4.2 数据建模本例按照星型结构进行建模,其结构如下图所示:事实表-位于中间,维度表位于事实表周围,本例中涉及“客户”,“物料”和“销售代表”三个维度(实际上这里还有两个共有的维度,时间和单位)。一般来说该表往往非常大,通常以GB来衡量,用户感兴趣的数据就是从该表进行检索,维度表的规模一般只有事实表的1-5%。事实表和维度表通过外键进行关联。4.3 ETTL过程构建数据仓库有一个关键的步骤:从不同的数据源中抽取、传输、转换和加载数据到一个数据仓库,即所谓的ETTL过程。 ETL是BI/DW的核心和灵魂,是数据仓库的入口,它将数据从OLTP、外部数据源、脱机的数据介质中导入DW,按照统一的规则集成并提高数据的价值,是负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。1、抽取数据时,即完成从源系统(例如R/3系统)移出数据。该步的关键是识别合适的数据,因此,对于源数据系统很好的理解是基础。2、数据传输时,有规则的将不同源数据系统的大量数据移动到数据仓库中,这里的关键是规划出一个符合实际的数据传输计划,并且拥有可靠的快速网络。3、数据转换时,对数据要进行格式化处理,从而保证数据在数据仓库中保持一致。这里要面对众多挑战,不同的名称,不同的数据类型,不同的文件系统,不同的文件格式等,都需要在数据转换中正确处理。4、数据加载,就是将数据正确、快速的加载到事实表中。这一过程的关键在于开发一个稳定的、好的错误处理程序。ETTL是一个复杂的,需要花费大量时间的任务。任何错误都有可能危害到数据的质量,而数据质量直接影响到企业决策的制定,因此,对于数据仓库项目来说,能在计划的时间和既定的预算内完成具有很大的挑战。 4.4 BW实际操作过程4.4.1创建信息立方体在BW中,客户标识、物料编号、销售代表标识、度量单位以及交易日期成为特征,客户姓名和客户地址都是客户标识的属性(虽然它们实际上也是特征)。销售单价,销售数量和销售收益被称为主特征(key figure),特征和主特征都称为InfoObject。主特征可以是一个特征的属性。例如销售单价可以物料编号的一个属性,在该实例中,销售单价是事实表的一个主特征。InfoObject类似于砖块,我们使用InfoObject构建InfoCube,InfoCube是由星型架构中的事实表及其相关维度表组成。利用BW图形界面,可以方便的按照下面的5步,创建信息立方体(具体操作步骤略)。1、创建InfoArea。InfoArea类似于一个工地,信息立方体就在这个工地中建立。2、创建InfoObject编录。3、创建InfoObject-特征4、创建InfoObject-主特征5、创建信息立方体4.4.2加载数据到信息立方体创建了信息立方体,就可以将本例中描述的数据加载到这个信息立方体中,BW系统可以通过下面的步骤方便的完成数据的加载过程。1、创建一个源系统。BW可以接受来自各种源系统的数据,包括R/3系统,BW系统,平面文件,利用第三方ETTL工具的外部系统等。2、创建一个应用程序组件。Bw中,Infosource和infopackage使用应用程序组件的树状结构组织。3、为特征数据创建Infosource4、创建InfoPackage来加载特征数据5、检查所加载的特征数据6、手工输入主数据、文本和层级7、为交易过程创建Infosource8、创建信息立方体的更新规则9、创建InfoPackge来加载交易数据 4.4.3 检查数据质量信息立方体的数据质量对于整个系统而言至关重要,SAP BW提供了有效的方法对其检查和控制,主要包括:1、检查数据立方体的内容。最简单的方法通过管理员工作台的建模窗口进行检查。2、使用BW监控器。可以检查数据是否正确加载3、使用持久分段运输区域(PSA)。对于数据仓库系统而言,一旦数据加载到目的地点,再移动数据将不是一件容易的工作,BW提供了PSA的方法,将数据以最初源系统的格式存储数据,从而可以做到把数据传递到目的地之前对数据进行检查。4.4.4 创建查询和工作簿BW使用“企业资源管理器(Bex)”的工具来创建查询和工作簿,BEX包括:Bex分析器和Bex浏览器,分析器用来创建查询,浏览器用来组织工作簿。BW也可以使用变量直接访问层级节点。4.4.5 管理用户授权安全性是任何信息系统都至关重要的一个因素,BW中也不例外,BW采用一个成为“配置文件生成器”的R/3工具来管理授权,该工具基于授权对象完成授权,授权对象定义用户可以在哪些SAP对象上执行哪些操作;多个授权可以结合在一起组成一个授权配置文件,在SAP中,一个授权配置文件分配给一个用户角色,分配到某个角色的用户就可以执行该角色定义的活动。BW管理用户授权通过下面步骤和操作可以完成: 1、使用配置文件生成器创建授权配置文件;2、创建一个授权对象来控制用户对信息
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 成都市 2024-2025 学年小学五年级科学期中模拟试卷(含答案与解析)
- 高中语文必修上册同步练习 含答案-第5单元 《乡土中国》
- 2025年海南省公务员笔试冲刺押题卷
- 2025年通信技术基础试题及答案
- 2025年预防环境传播试题及答案
- 2025年初中三年级化学上学期反应方程式卷
- 2025年河南省公务员申论真题预测卷
- 个人简历模版(三页)带封面(可编辑)自我评价
- 2025借款合同担保书范文
- 2025电子产品采购合同模板
- 异常子宫出血诊断与治疗指南(2022更新版)
- 幼儿园小班数学公开课《图形宝宝找朋友》课件
- 技工教育十三五规划
- 《数据可视化》教学课件03第三章 数据可视化图表基础
- 临床医学“三基”训练医师分册第四版-吴钟琪主编-湖南科学技术出版社-p340-258-5.1.2呼吸系统疾病
- 更换收发方案球筒及阀门施工技术方案2016.01.13
- 原子簇化合物
- 高中化学答题卡模板1
- 2023年高三物理第二轮总复习(全套精品)
- 高一物理人教版必修一知识点重点总复习教学课件
- 冬季应急预案
评论
0/150
提交评论