SAP_HANA_BWOnHANA解决方案介绍_第1页
SAP_HANA_BWOnHANA解决方案介绍_第2页
SAP_HANA_BWOnHANA解决方案介绍_第3页
SAP_HANA_BWOnHANA解决方案介绍_第4页
SAP_HANA_BWOnHANA解决方案介绍_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、 HANA解决方案介绍SAP 高性能分析应用(SAPHigh-Performance Analytic Appliance,简称HANA)是一套灵活、多用途、而且与数据源无关的基于内存计算的全新应用,通过整合硬件(由 SAP 的硬件合作伙伴: 惠普, IBM, 富士通, 思科,戴尔等来提供)和优化的一套基于内存计算技术的应用。图1.1 SAP HANA系统架构示意图HANA能够让企业根据不断变化的大量详细信息来分析业务运营情况。 用户几乎可以实时的浏览和分析来自任意数据源的业务交易数据。 在发生业务时,这些交易数据将会被实时同步到HANA的内存数据库中,用户可以使用非常灵活的视图,并以思维般的高速度显示这些分析的信息。 若要做整个企业的扩展性分析,将外部数据添加到分析模型中即可。HANA能简化现有企业系统的计算层,使得企业的业务应用可以从硬件的性能提升中直接受益,从而使客户能够实时分析几乎来自任何来源的大量数据,利用实时的内存技术帮助企业提高运营效率。1. SAP HANA架构概览这里所描述HANA的架构,是HANA应用以及外围软件的整体架构,以及这些组件之间的关联关系。 图1.2 SAP HANA架构概览HANA的工作台HANA提供了一个集中管理,以及监控HANA系统的工具,以及一个做数据建模的工具,这两个工具是集成在一起,用户在使用的时候,只需要切换到不同的视图即可。HANA的展现层HANA最终展示给用户看的结果,可以根据不同的使用人群,采用不同的展示工具来展现这些信息的,下图描述了HANA的展示层的一些工具以及所面对的业务人群适用范围。图1.3 SAP HANA展现层示意图展现层中使用了不同的工具来展现技术,主要是因为这些信息所面向的人群不同,比如:针对企业的管理层,使用Dashboard方式展现企业的经营状态的报表,而针对于高级的业务分析师,则可以使用BO Explorer 或者Web Intelligence来展现报表。SAP Business Object BI 4.0的组件SAP Business Objects BI 4.0中的Data Service组件提供了ETL(Extraction-Transformation-Load)的功能,不仅支持从多个数据源抽取数据,而且可以对这些抽取过来的数据进行筛选和“清洗“,然后创建后台的作业和设定数据同步复制的时间,把这些数据同步复制到SAP IMDB中去。数据源的支持从HANA的架构图中可以看到,HANA对于数据源的支持是非常广泛的,对于SAP的ERP系统而言,可以使用SLT的方式来进行数据实时同步复制。而对于其他第三方的数据源,例如Oracle,DB2或者是MS SQL-Server数据库等等,均可以使用BO的Data Service工具来进行抽取。如果数据源是就是普通的CSV文件,可以直接使用HANA的工作台直接上传这些数据到HANA的内存数据库中,然后在HANA的建模视图中,直接预览这些上传到HANA中得数据。从图2.2中也能看到,Data Service也可以从SAP ERP中抽取数据,传输到SAP HANA中去。2. SAP HANA数据建模SAP HANA提供SAP HANA工作台和使用BW进行HANA数据建模两种建模方法。(1)使用SAP HANA工作台进行数据建模SAP HANA工作台包括以下功能:u 建模。使用SAP HANA工作台建模不需要物化的聚集,取消了聚集层;工作台提供数据库视图功能;建模过程中可选择4种不同级别的数据模型,包括属性视图、分析视图、属性视图增强的分析视图和计算视图。u 数据预览。SAP HANA工作台提供物理表格的数据预览和信息模型的数据预览。u 导入/导出。SAP HANA工作台提供多种形式的导入/导出操作,可以进行基于模型、基于数据以及系统全景的导入和导出。u 提供对于SAP应用软件的数据抽取功能。包括数据初始上载和数据同步复制。u 提供数据分析的权限和安全保障。SAP HANA数据建模器是一个图形化的数据建模工具可以设计分析模型和分析视图的权限,使用户可以安全的访问数据模型。下图是SAP HANA中的数据建模流程,包括五个主要步骤。图2.4 SAP HANA数据建模流程第一步:从数据源系统导入元数据。需要导入源表的定义信息到建模工作台,HANA中的表与源系统的表是1对1的映射关系。第二步:提供数据。需要导入数据内容到HANA表中,物理表的数据被全部上载。第三步:创建信息模型。根据场景需要,创建不同的视图来建立信息模型。包括数据视图、属性视图、分析视图以及计算视图。第四步:部署。创建基于列的视图,并且激活这些视图。第五步:使用。客户端工具连接到HANA并展示这些信息模型。选择不同的客户端和展现层工具连接到HANA,使用不同的数据接口BICS/JDBC/ODBC/MDX等获取数据。SAP HANA工作台提供多种建模手段,包括:手段1:从事实表中分离主数据模型。手段2:创建类似信息立方体的视图,用属性视图连接到事实表。手段3:如果简单的连接不能满足数据需求,可以使用SQL脚本来建模。手段4:创建数据库视图,并结合SQL脚本来建模。手段5:创建基于视图的分析视图。SAP HANA工作台提供三种视图工具:u 属性视图。属性视图是对事实表数据的描述,属性的建模是基于属性视图,可以被看作主数据表,可以在分析视图中连接到事实表,一些量度指标可以被定义为属性。u 分析视图。分析视图可以被看作信息立方体,它可以包括多维度的报表模型,事实表可以关联到维度视图。分析视图不存储实际数据,数据在视图执行时从数据库表中读取,所有的关联和计算在运行时被执行,主数据被存储在系统表中。u 什么是计算视图。计算视图时基于列的视图,可以被报表工具调用,当计算视图被访问时,相关的计算模型被执行。计算视图定义在HANA特定的SQL脚本中,计算视图的功能可以包括SQL命令,SQL命令可以被数据表和基于列的视图读取,在分析视图的SQL语句仅是“只读”属性。同时,计算视图的函数可被其他函数调用,在计算视图中实现业务逻辑的实现,HANA提供预定义的函数,例如创建关联或联合多表。(2)使用BW进行HANA数据建模SAP HANA从SPS03版本开始,支持直接使用HANA作为BW的数据库,这种使用方法被称之为BW on HANA。这种架构下,可以使用BW进行HANA数据建模。BW on HANA的架构下,HANA作为BW的底层数据库存在,所有的实体数据存储在HANA内存数据库中。BW使用其强大的建模功能作为整体架构中的建模主体;而HANA则使用其灵活的建模工具用以补充BW模型完成实时业务需求。BW on HANA系统架构见下图。图1.5 BW on HANA系统架构图BW on HANA架构下,可以通过两种方式在HANA中创建并使用数据模型(见下图):u 实时数据模型的数据建模。实时数据模型适用于实时场景的数据建模。如果基于BW的OLAP数据分析需要调用实时场景的分析视图或计算视图,那可以把实时模型发布到SAP BW系统中。同时可以调用RSDD_HM_PUBLISH来发布分析视图,而且这些分析视图或计算视图可以被分析索引或实时建模器发现。u 复合数据模型的数据建模。复合建模器可以合并BW与HANA中的数据模型和分析索引,使两类数据模型可同时用于报表和分析。复合建模器使用图形化环境,可以进行快速数据模型合并。使用复合建模器中的专家模式,数据立方体可以被加入到复合建模器中。图1.6 BW on HANA数据模型创建和使用示意图(3)两种数据建模方式比较上述两种数据建模方式有各自的特点和适用性。使用SAP HANA工作台进行数据建模是较为直接和灵活的建模方式,它可以使用HANA支持的全面三种数据同步机制,并且能够支持实时的数据同步;但是使用SAP HANA工作台进行数据建模需要在HANA中重现建立一次模型,难度和开发成本都较大。这种建模方式适合企业未深入使用BW,或者全新的实时分析场景较多的情况。使用BW进行HANA建模,可以充分利用BW中已经存在的分析场景,运用图形化的少量修改便可以直接使用已有模型,大幅度的降低开发成本和难度。由于BW无法使用实时同步机制,所以使用BW进行建模无法实现实时场景,但是在BW on HANA架构下,可以使用HANA工作台进行建模的方式进行补充,实现BW on HANA架构下实时场景的使用,确保BW on HANA架构的广泛适用性。这种建模方式适合企业已经深入运用BW,或者希望利用HANA作为企业数据分析中心的情况。表1.1两种数据建模方式比较使用SAP HANA工作台建模使用BW进行HANA建模模型效率数据模型加速在300400倍BO展现层速度提升3050倍数据上载速度提升510倍DSO激活速度提升710倍查询速度提升100倍数据上载工具SLT/Data Service/Sybase Replication ServerBW ETL,BW中只能使用原来的ETC工具更新DSO,不能用SLT/DS上载。数据传输效率实时、准实时异步数据上载(数据更新取决于任务更新频率)开发成本开发成本大,需要使用SQL脚本建立模型,实现业务逻辑。开发成本小,BW中有现成的BI content内容,有图形化建模工具。实现难度原BW模型需要在HANA中重写,对于复杂模型,实现难度较大。原BW的模型可以通过BW升级和迁移的方法转到BW on HANA平台,保持原有模型不变。权限控制HANA中的权限控制较弱,难以实现组织级别的权限控制。延用BW的权限机制,可以很好的控制数据读取权限,并与组织级别结合。后续维护模型没有版本控制,对于维护和变更难度较大。延用BW原有的版本控制和传输控制,可以较好的维护模型对象3. SAP HANA数据同步机制因为基于SAP内存计算的分析和报表处理需要将来自不同源系统的数据同步到SAP HANA的内存数据库中,所以SAP HANA 提供了强大而灵活的数据同步功能。图1.7 SAP HANA数据同步机制概念图以上这种图片描述了将数据从SAP ERP系统中导入到IMDB(SAP HANA的内存数据库)中的同步过程,然后内存数据库中得这些数据,可以在IMDB Computing Studio中建模,然后通过BO Dashboard或者Web Intelligence工具展现这些数据给最终的用户。目前的HANA的版本提供了3种不同的方式来同步数据到IMDB中,这些不同的数据同步的机制能被应用在不同的IT系统架构中,同样也可以根据用户不同的需求和业务场景来加以调整。图1.8 SAP HANA数据同步机制工具示意图以上的这张图片给出了从源系统同步到HANA的IMDB中的3种方式的基本概览,每种方法处理不同的数据同步需求,并且每种方式都有其强大而独特的功能点,用户可以根据自身现有的IT系统架构来决定那种方式是最适合自身的。u Trigger-Based Replication - 基于触发器的数据同步复制技术,需要SAP Landscape Transformation (SLT) Replicator, 对ERP的版本支持从46C to 710u ETL-Based Replication 基于ETL工具的数据复制技术,需要以下组件的支持Sybase Adaptive Server Enterprise (ASE) 15SAP Business Objects Data Services XI 4.0u Log-Based Replication - 基于数据库底层日志的数据复制技术下面内容将以上的3种不同的数据复制技术展开详细的解释和说明,各自的特点,优点和适用的场景等。(1)Trigger-Based Replication-SLT 数据同步技术Trigger-Based Replication数据复制技术使用SAP Landscape Transformation(SLT)组件将源系统中的数据传输到SAP HANA内存数据库中。图1.9 Trigger-Based Replication-SLT 数据同步技术示意图业务数据初始化导入在使用SLT的方式来传输SAP ERP系统的数据到SAP IMDB之前,需要执行“业务数据初始化导入”这个过程,这个过程是在SAP HANA的工作台(SAP IMDB Computing Studio)中执行的,从SAP HANA中发送一个初始化消息到ERP系统,然后SAP ERP系统开始为那些需要被同步到HANA中的数据库表设定数据库事务信息表,一旦这些事务表被完成,SLT系统开始多线程的从源系统高速同步数据到SAP HANA内存数据库中。初始化的导入只有在源系统的SLT服务被激活时候才能被执行,也可以通过调整线程的数据数量,以及线程的同步频率(实时或者定期)来控制系统的负载。在初始化导入数据的过程中,通过数据库指定的某些触发器(哪些数据库表需要被同步到HANA的清单),SLT系统开始监控是否在初始化导入的时候,相关的数据是否被更新了,这些修改会被记录到前面创建的事务表中,然后更新过的数据记录也会被同步到SAP IMDB中。SAP IMDB的多版本并发控制组件(MVCC)可防止在业务数据初始化导入过程中和新发生的据库事务造成的重叠问题。基于SLT的架构,提供了2种选择,用户可以根据自身当前的系统架构来选择合适的SLT方式:u 将SLT独立安装一台服务器上。u 将SLT安装在SAP ERP系统中。无论用户选择什么样的SLT安装方式,其中的数据同步机制都是相同的,具体的安装文档和详细步骤请参考/hana.图1.10独立安装的SLT服务器示意图图1.11 SLT作为组件安装在SAP ERP系统中示意图数据初始化导入之后的增量更新一旦SLT完成了从源ERP系统初始化导入过程,SLT系统会立即开始监控ERP系统中的事务表,并且实时的同步更新过的数据到SAP HANA的内存数据库中。用一个例子来说明:首先在完成必要的SLT配置之后,并且在SLT的触发器配置中加入了EKKO(采购订单的头表)EKPO(采购订单的ITEM表)作为监控的项目。一旦初始化导入完成后,某个用户在SAP ERP系统中创建了新的采购订单数据,或者更新了某个已经存在的采购订单,此时SAP数据库中的EKKO/EKPO表会被更新,同时这些更新过的数据记录会被记录到SLT为EKKO/EKPO专门设定的事务表中,然后实时的同步到SAP IMDB中去。SLT的数据同步的特点u 可以设定实时同步,或者定期的同步相关的数据到HANAu 从SAP 4.6C 版本到 SAP ERP最新版本, 全都支持u 已经被证明和广泛使用的技术(零宕机,TDMS,SLT)u 快速而简单的SLT安装设置(初始化安装和配置,一天即可完成。与HANA的UI建模界面完全集成-从SPS02开始)u 独立安装SLT的情况,不需要数据库,数据只是通过SLT,无数据滞留在SLT中,对硬件配置的要求不高Read Module的功能收集更新过的数据,并且将数据表分块成可以被SLT传输到HANA的格式。(2)ETL-Based Replication-Data Service数据同步ETL-Based Replication 是使用Data Service从源系统同步数据到SAP IMDB中的一种数据复制技术,需要SAP Business Objects 4.0 - Data Service组件的支持。图1.12 ETL-Based Replication-Data Service数据同步机制示意图ETL-Based的方法可以让用户从应用层来取得所需的业务数据,在Data Service中定义数据流,以及数据复制作业的同步频率(比如:每20分钟同步作业运行一次等)。这种方法使用的是批处理方式,用户也可以设置定多个数据源,并且可以对这些从不同的数据源中取得的数据进行加工整理,比如数据检查,数据转换和合并等等。这一过程在Data Service中称之“数据清洗”过程。上面这张图大致的描述了使用Data Service从ERP 系统中抽取数据,并同步到SAP IMDB中的过程,整个数据同步复制的过程是通过Data Service来完成的。它的最主要的组件是Data Service Designer,这是一个工具,用户能使用这个工具定义数据数据流,设定和执行数据复制的作业。Data Service 建模工具使用Data Service Designer(建模工具),可以定义新的数据源,地址和登陆账户/密码。如果是连接的数据源是SAP ERP系统的话,Data Service使用RFC的方式来连接SAP ERP系统,此时用户可以决定哪些数据库表需要被同步。建议:对于从SAP ERP系统抽取数据,然后同步到HANA 中的这种情况,SAP推荐客户使用抽取器(Extractor)方式。数据初始化导入和增量更新数据的初始化导入和之后的增量更新都是通过Data Service完成的,初始化导入通过设定一个从数据源到HANA的简单“数据流”就可完成。对于增量更新,在大多数情况下,通过增强数据流的增量处理属性就可以完成。SAP推荐用户使用增量支持抽取器完成数据到HANA的同步,但是用户也可以自行选择SAP ABAP Table方式来抽取数据。ETL数据同步的特点u 需要BusinessObjects 的Data Service支持,需要架设BO服务器作为中转站。u 支持多数据源,并且可以对数据进行转换和合并等。u 可以设定数据同步的后台作业,在非业务系统的繁忙期来抽取数据,避免了系统运行效率产生影响。u 数据同步并不是真正实时,有少量延迟u 支持多台HANA作为数据同步的对象ETL方式同步数据所需的组件u SAP BusinessObjects Enterpriseu BusinessObjects Enterprise Central Management Server (CMS), 是SAP BusinessObjects Enterprise的一个组件u SAP BusinessObjects Data Services XI 4.0(3)Log-Based Replication-SRS数据同步Log-Based Replication的数据同步技术主要是使用了Sybase Replication Agent,这个组件已经是源系统的一部分,但是需要在SAP HANA端安装Sybase Replication Server组件,才能使用这种方式进行数据同步。Log-Based Replication 使用Sybase Replication技术从底层数据库日志层面来扑捉数据库表的修改,此种方式对源系统的数据库是有依赖的。每个数据库事务上的数据修改都被实时同步到SAP IMDB,并且执行一遍。这种方式保证了HANA中数据和源系统中的数据的一致性,但是无法做到真正的并行处理。注意:如果用户不是RTC Group的成员,SAP建议客户使用客户使用Trigger-Based Replication或者SAP SLT方式, 因为这两种方式已经提供了非常丰富的特性给用户使用。图1.13 Log-Based Replication-SRS数据同步机制示意图以上这张图片简单的描述Log-Based Replication技术,Replication Agent监控底层数据库的日志,一旦发现有数据库的更新,将这些更新日志会被传输到HANA中执行一遍,Replication Server就是专门负责完成这一过程。数据初始化导入和增量更新和前面的两种方式相同,都是需要做数据的初始化导入的,SAP SAP IMDB中的Load Controller这个组件会协调整个数据复制的过程。图1.14 Log-Based Replication-SRS数据同步机制组件关系图Load Controller组件会启动从源系统初始化导入数据到SAP HANA中,并且实时的和Sybase Replication Server(在SAP HANA端)通讯协调数据的增量更新。一旦初始化导入数据的过程开始,Replication Agent(在SAP ERP端)会被立即启动,并且开始监控是否在初始化导入数据过程中有任何的数据的更新动作,这些更新会被提交到数据库日志文件中。u Replication Agent(在SAP ERP端)会将这些相关的数据更新的元日志信息通过TCP/IP连接方式传输到Sybase Replication Server(SAP HANA端)u Replication Server根据这些日志信息,重构标准的SQL语句, 然后这些SQL语句被发送到Sybase ECDA(Enterprise Connect Data Access)u ECDA 通过ODBC驱动连接到SAP SAP IMDB,在HANA中执行这些SQL语句,并且HANA的MVCC(多版本并发控制组件)能防止任何不当的数据死锁的情况。Log-Based方式同步数据所需的组件u SAP HANA Load Controller u Sybase Replication Agentu Sybase Enterprise Connect Data Access (ECDA)u Sybase Replication Serveru SAP Host Agent Log-Based方式做数据同步的特点u 数据同步是实时u 架构简单,不需要任何额外服务器做中间转换传输(4)三种数据复制技术的综合比较三种数据复制技术拥有各自的技术特点(见下表),将其特点进行比较可以分析出各自的适用场景。Trigger-Based方式能够实时复制数据,且对源系统性能影响极小,在HANA SPS02版本,仅支持ERP作为其源系统,而在HANA SPS03版本中,这种方式已经可以支持非SAP系统作为源系统,使这种数据复制技术可以适应所有实时性分析场景。ETL-Based方式支持批量的非实时数据复制,它的主要特点是能够支持多对多的数据复制方式,可以更加灵活稳定的进行数据复制,适用于对数据实时性要求不高的分析场景。Log-Based方式同样可以实现实时传递,但是其对源系统有明确的性能影响,并且支持的源系统数据库有局限,适用性较差。表2.2 HANA 三种数据复制技术综合比较表特点Trigger-Based方式(SLT)ETL-Based方式(Data Service)Log-Based方式(SRS)多对多方式进行数据复制只支持1:1支持只支持1:1支持Cluster表支持支持不支持Client dependent 数据复制支持支持不支持DDIC 数据字典更新支持(部份)不支持不支持监控或者错误处理机制支持支持不支持数据复制的实时性,速度实时有延迟实时数据复制过程中对源系统的性能影响极小取决于实施架构有内置增量更新的机制支持使用Delta-Extractor支持自动开始和结束数据复制支持定期的不支持ERP端业务逻辑重用不支持支持不支持数据库支持所有SAP支持的数据库所有SAP支持的数据库仅支持DB2 LUW/UDB二、 BW ON HANA解决方案介绍1. BW ON HANA方案快速概览依靠SAP内存计算中最先进的技术,您的公司可以将SAPNetWeaver BusinessWarehouse(SAPNetWeaverBW)部署在SAPHANA平台上运行。这个完全在内存运行的数据库可以使BW的性能达到史无前例的提升,极大地简化IT架构,并使您的业务用户更快地做出决策,以获得更敏捷的竞争优势。传统BW面临的业务挑战更快、更全面地使用您的企业数据更快地响应对业务对信息的需求减少IT部门的负担,提升利润方面的优势基于内存计算的数据仓库重要特点压缩和列式存储 减少数据存储量内存处理在内存中存储和处理数据列式的数据结构减少数据库的大小,将更多数据置于内存中方便使用的建模工具 让业务用户也能创建数据模型基于内存计算的数据仓库业务利益更快地查询和分析,减少数据延迟,加快计划速度降低总体拥有成本,减少IT的工作负担,并提升对业务需求的响应速度访问所有的数据,提升业务洞察,强化自助服务改变SAPNetWeaverBW,不需要对用户重新培训,且所有的业务内容、数据流和数据安全都保持不动2. BW ON HANA的功能特性多年来,需要管理大量数据并确保信息完整性的企业,都求助于SAPNetWeaverBusinessWarehouse(SAPNetWeaverBW)。SAP一直不断研究,逐步形成了依靠SAPNetWeaverBW来帮助建立灵活、可扩展的企业级数据仓库的基础,用来处理来自SAP和第三方数据源的数据。现在SAP提供了其数据仓库的下一代版本,可以实现在SAP HANA平台上运行SAPNetWeaverBW。(1)大幅度的提升性能如今,将SAPNetWeaverBW运行在关系型数据管理系统(RDBMS)上的企业,在迁移到由SAP HANA支持的版本后,可以体验到巨大的性能提升。SAP HANA的内存数据库架构提高了数据加载和计算处理的效率,还可以运行查询和报表。性能方面的提升能够减少数据延迟,提高决策制定所需的关键信息的可用性,从而让您做出可靠、及时的决策,帮助您获得竞争优势。传统的数据加载处理,包括抽取数据,转换数据,并将数据导入目标系统中。SAP HANA通过将大量数据抽取到服务器中,然后在SAP HANA的数据库的主存中进行服务器密集型的转换,来提升处理速度。此外,通过SAP HANA,SAPNetWeaverBW中的信息块和数据存储对象(DSO)都在内存中运行,这样会大幅提升总体数据处理的性能。而且,激活DSO进行增量计算的步骤从应用层迁移到了SAP HANA数据库层中的内存中,这样能够加快数据分级和处理,也避免了存储冗余数据。在大多数数据仓库中,为了在数据加载后构建索引以及聚合计算,就需要一个很大的维护窗口。因为SAP HANA的内存架构不需要索引和聚合表来加快查询的响应,维护窗口中的计算时间就被节约了。而且,将计算从应用层迁移到SAP HANA数据库层的内存中,会大幅提升性能。如前文所述,使用传统的RDBMS需要构建索引和进行聚合预计算,为了提升查询的性能,还需要大量的SQL调优。然而,并不是所有的查询都能进行索引构建和聚合的,查询调优所能使用的资源也是有限制的。这就导致了响应时间的次优化。架构在SAP HANA上之后,SAPNetWeaverBW去除了传统数据仓库系统中很多资源密集型的步骤,这些步骤是用来处理和发送业务用户所需的信息的。这样,即使是访问粒度最高的信息,得到结果的速度都快了很多。(2)简化管理,实现IT架构的流线化在SAP HANA上运行SAPNetWeaver BW的公司,其IT架构更加流线化,管理环境也更为简单。SAP HANA内存列式数据存储的架构,能够帮助您降低总体拥有成本(TCO),减少IT的工作负担,对业务方面的信息需求做出更快的响应。这种在操作方面更为优化的效率,帮助您减少浪费,提升使用数据的能力,从而获得竞争优势,让您的业务更卓越。SAPHANA将处理推入数据库层,这样就能够对数据、用户和查询进行线性扩展。也就不用在SAPNetWeaver BW应用层进行大量扩展。因为列式存储和弃用冗余数据,能够极大地压缩数据库的体量。在SAP HANA上运行SAPNetWeaver BW时,您不再需要一个RDBMS来运行SAP NetWeaverBW,也不再需要一个独立的服务器运行SAPNetWeaverBW加速器来加速查询。您的TCO因此会有所降低。当使用SAPHANA时,SAP NetWeaverBW会极大地减少IT负担。不再需要星型视图、非唯一性索引、聚合表或是物化视图,来提升物理数据库中的数据返回性能。因此,模型的开发维护变得更加简单快速,查询调优的工作也大幅减少。语意层的分割,简化了分区管理。与SAPSolutionManager应用管理解决方案,以及SAPNetWeaverIdentityManagement组件的集成,将管理管控的工作集中简化。而且,数据血统和影响分析能帮助您简化源系统间的点到点数据及元数据管理。SAPHANA同样可以帮助IT更好地对您的业务分析进行持续的优化服务。因为根据列式数据构建的模型,在构建、维护时会更加快速,IT就有更多的时间来对新的业务应用做支持。另外,业务函数和预测算法预制库,也能帮助IT部门更快地搭建应用。而且,改变数据模型不再需要备份和重载整个数据块,这就让IT对业务需求的的响应更快了。(3)在企业内部充分发挥数据的能量对业务人员来说,SAP HANA有助于在企业内部充分发挥数据的能量。SAP HANA能让您在最细的粒度上访问所有的数据,这是以前从未能实现的,因此能够提升业务洞察和终端用户的自助服务。数据延迟的缩短和可用性的提升,有助于您提升业务灵活性,获取竞争优势。在SAP HANA上运行SAPNetWeaverBW,您可以快速合并业务仓库和其他源,让您访问所有需要的信息,在最新的数据上做出最优决策。.能够访问所有的数据,意味着您现在可以监控整个业务中发生了什么,而非仅仅是一个部门,或是一条业务线。您可以在任何数据集中,下钻到最大粒度的详细信息,而不是只看聚合后的数据。更广泛、更深入、更快速的分析,让您能够更迅速地确定趋势和变化,更好地理解原因,以及更快地对业务环境做出改变。SAP NetWeaverBW利益点就是,它能为业务人员提供更好的自助服务。由于SAP HANA闪电般的响应速度,您可以在任何时间进行即席查询和分析。不用再等待IT来做查询调优,或是对您能访问的数据量做限制。您还可以在世界的任意地点、任意时间,在移动设备上访问您所需要的数据。另外,SAP NetWeaver在工作区的新函数,能够让用户进行临时模型的创建,这些模型可以将SAP与外部数据源整合,这就不再需要IT来构建物化视图以支持您的分析需求。(4)保护您对SAPNETWEAVERBW的投资在SAP中,我们所认可的价值,既来自于技术创新,又来自对业务影响的最小化。我们了解,您希望在SAPNetWeaverBW 中保护您的投资。这就是我们确保只使用SAP HANA作为SAPNetWeaverBW内容和安全建模的数据底层数据库的原因,这样可以减少对终端用户的二次培训。我们已经在无中断创新的方法中获取了很多经验,这也将成为您的竞争优势。对于运行SAPNetWeaver BW7.30的客户来说,只需要将数据库底层转换为SAP HANA就可以了,而不再需要应用升级或者迁移。SAPNetWeaverBW中的数据流、转换、数据建模、查询、DSO、信息块和multiprovider,都不会有改变。运行在SAP HANA上的SAPNetWeaverBW同样保护您在用户培训和技术上的投资。业务人员可以继续使用SAP工具进行商务智能方面或是其他能够关联SAPNetWeaver BW的操作。您访问数据的方式与以前一样只不过您现在访问的是最新的数据,而且比之前更详细、更快速了。投入大量时间进行安全建模的客户,他们可以放心,之前的工作能够得到保护。SAPNetWeaverBW分析的授权,在SAP HANA版本上同样支持,因此就不需要在角色、授权规则上做出变动。另外如果您使用SAPNetWeaverIdentityManagement进行预处理(provisioning)和单点登录功能,SAP HANA能够与您的设置进行整合。三、 HANA主要特点(创新点)SAP HANA利用实时的内存技术帮助企业提高运营效率,主要依靠以下技术创新点:1. 基于内存的高效数据读取和处理在传统的应用系统中,数据被存储在数据库中。当用户通过前端操作界面发出指令后,应用层从数据库中读取数据在应用层进行逻辑运算,并将结果反馈到前端操作界面进行展现或进行下一步的操作。 在这个过程中,从数据库中读取数据因为磁盘I/O的性能限制而成为瓶颈,而这一瓶颈在海量数据的读取中体现的尤为突出,基于数据仓库的报表分析就是一个最明显的例子。存在这一问题的原因是传统数据库实际上是将数据以文件的形式存储在磁盘上并为应用提供访问数据的接口。从数据库中读取数据的本质是从磁盘上读取文件,而在过去几十年的硬件发展中,内存和CPU的性能始终在飞速的提升,只有磁盘I/O的性能提升并不明显。从磁盘上读取数据的速度是毫秒级。而与之相对应的,从内存中读取数据的速度是纳秒级,这基于内存的数据读取比基于磁盘的数据读取性能要快100万倍。所以当基于数据仓库进行报表分析时,如果从传统数据库中读取海量数据需要数十分钟的时间,那么从SAP HANA中读取同样的数据只需要不到一秒钟的时间。在数据爆炸这一大趋势下,HANA 给用户带来了高效迅捷的数据处理和分析能力。图3.1 Gartner研究机构对于内存计算的统计结果2. 行存储和列存储的混合模式传统关系型数据库是按照行的方式存储数据的,能够为交易系统即OLTP应用提供高效的支持。例如一个零售商每当客户购买产品时,需要在业务系统中创建一条数据记录销售的时间、地点、客户、金额、地址等字段数据,当前端完成数据的录入并提交后台系统后,在数据库中会在数据表中插入一行记录,这条记录中会包含本次销售业务操作相关的数据。这对传统基于行存储的数据库是非常简便的操作。然而,基于行存储的数据库在支持数据分析应用即OLAP应用时则显得低效和力不从心。 同样的例子,假设这家零售公司在传统数据库中保存了3亿条记录,并且需要基于这些销售记录分析单笔销售的平均金额,则需要首先读取所有这3亿条记录,并取出其中的销售金额这一个字段,然后再进行平均值计算。这意味着实际进行分析的数据(消费金额字段)只占总体数据的5%(假设每条数据20个字段)。显然这是非常低效的方式。而在基于列存储的机制中,这3亿条记录实际上是按照列进行存储,即总共只有20条记录(20个字段,每个字段一条记录)。在进行同样的分析时,只需要取出销售金额这一列的记录并计算平均值即可,与基于行存储的机制相比,在这个示例的应用场景下,数据处理的效率提高了50倍。图3.2 某零售商HANA应用示意图 SAP HANA 是行业中唯一同时支持行存储和列存储的内存数据库,所以能够对OLTP交易系统和OLAP分析系统同时提供高效的支持。图3.3 SAP HANA架构计算引擎概览3. 高效的并行处理机制在近年IT行业硬件的发展中,技术路线发生了明显的变化。以往硬件厂商致力于提供更高主频的处理器,即提升单颗CPU的计算能力,但最近几年,硬件服务器的处理器主频提升并不明显,但是单台服务器配置更多的CPU,并且每个CPU包含更多的内核。这意味着软件系统必须提升并行处理的能力,才能够在新的硬件发展趋势下保证系统的性能能够持续的提升。SAP HANA 的研发过程中和硬件合作伙伴保存了非常紧密的协作,整体的体系架构基于Intel X处理器平台支持多服务器、多处理器的高效并行处理。首先在底层开发中,Intel为SAP提供专门的开发包,让HANA的应用能够最高效、充分的利用多处理器的并发能力。HANA在应用层的架构设计上也能够将数据处理和运算拆分并部署到多个处理器。例如计算引擎可以将数据模型拆解,将一些SQL脚本拆分成可以并行执行的步骤。这些操作将递交给数据库优化器来决定最佳的访问行存储和列存储的方案。图3.4 SAP HANA并行处理机制示意图在系统的部署架构层面,SAP HANA可以部署到多台集群的硬件服务器,保证系统的可扩展性以及健壮性。图3.5 SAP HANA并行处理机制示意图4. 高效的数据压缩优化内存利用SAP HANA的基本机制是将数据全部存储到内存中,以进行高效的数据访问和运算。虽然硬件包括内存的价格日趋低廉,但相比磁盘而言,内存仍是较贵的存储设备。而

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论