BI平台选型-文档资料_第1页
BI平台选型-文档资料_第2页
BI平台选型-文档资料_第3页
BI平台选型-文档资料_第4页
BI平台选型-文档资料_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1开源开源BI平台选型平台选型2 BI系统概述 主流开源BI系统 建议选择 Pentaho平台 Pentaho计划3BI系统介绍BI(Business Intelligence)即商务智能,它是一套完整的解决方案,用来将企业中现有的数据进行有效的整合,快速准确的提供报表并提出决策依据,帮助企业做出明智的业务经营决策。通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。组成系统:由数据仓库(或数据集市)、ETL流程、联机分析处理 (OLAP) 、查询报表、数据分析、数据挖掘等部分组成。中端BI,数据分析。高端BI,数据挖掘。低端:报表阶段。4BI系统介绍5 BI系统概

2、述 主流开源BI系统 建议选择 Pentaho平台 Pentaho计划6主流开源BI系统介绍开源BI特点量级架构大数据支持中文Openi基于Java开发的Web应用,能对关系数据库和数据挖掘服务器进行分析和报表展示,非常易于使用和部署;但目前已经不在发布单独版本,而是和pentaho集成,为其提供plugin轻使用Mondrian和Jpivot框架,报表引擎是jasper report,数据挖掘接口是R-Project,相对来说开发和学习比较简单无不Bizgres卓越的数据处理性能, 但目前已经没有维护了Pentaho以工作流为核心的、强调面向解决方案而非工具组件的BI套件,Pentaho偏向

3、于与业务流程相结合的BI解决方案,侧重于大中型企业应用。相对spagoBi来说功能较强,尤其是工作流一块做的相当不错。相关文档比较全重比较大的框架了,集成了相当多的开源项目,JfreeReport、Mondrian、Kettle、Weka基本都使用了。特别适合大型复杂项目的开发支持hbase,mapreduce支持SpagoBI使用java开发,有很强的扩展能力,相关文档较少。重Talend for ETL,JasperReports无支持jasperjasper report的支持最好,所以报表部分比较好,其它部分较弱轻使用Talend作为ETL7 BI系统概述 主流开源BI系统 建议选择

4、Pentaho平台 Pentaho计划8建议选择基于以上的对比分析,建议选用pentaho作为我们的BI平台。优点:成熟稳定性:pentaho社区版目前还不断更新中, 目前最新版本5.2文档完备性:pentaho社区版的官方文档较完备,中文文档也较多。中文支持:报表支持中文。可扩展性:pentaho集成了很多优秀的开源组件,它集成了很多优秀的开源组件,如Weka做数据挖掘,Kettle做ETL工具,JfreeReport报表组件。支持大数据接入,如Hbase, mapreduce. 劣势:重量级平台,它包含的组件很多,体系很庞大,学习掌握需要时间。虽然中文文档相对于其他开源平台为多,但多是老版

5、本的,最新版本的文档只有英文。9 BI系统概述 主流开源BI系统 建议选择 Pentaho平台 Pentaho计划10Pentaho介绍11Pentaho介绍是一个统一,综合的开源商务智能平台套件(Suite),基于它,可以访问,集成,操作,可视化,分析各种数据来源,帮助你从数据中发现所需要的知识,有收费的EE版本和开源的CE版本。目前CE最新为5.2采用的开源组件:OLAP : Mondrian数据挖掘:WEKA报表:JFreeReportETL:kettle分为2大系统:Business Analytics: BA组件,主要是可视化,报表,侧重于业务和展示。Data Integration

6、: DI组件, ETL工具等,侧重数据模型和转换。12Pentaho介绍(BA)1个核心server:BA Server和user console:web界面用来管理用户创建的报表内容和业务逻辑,4个web based Designer工具Report Designer: 报表设计器Analyzer: 过滤和可视化数据Interactive Reports: 交互性报表环境Dashboard Designer:设计dashboard3个client based Designer工具:Aggregation Designer:从不同维度创建聚合表Metadata Editor:创建metadat

7、a domain和modelSchema workbench:创建和编辑多维模型,为模型增加安全和计算13Pentaho介绍(DI)1个server:DI Server: 使用DI engine来做数据转换和基础4个Designer工具Spoon: 定义job和转换的建模工具,转换:定义了数据的flow, job:包含了资源获取,执行其他转换。Kitchen: 执行job的命令行,可以通过crontab调用Pan: 执行Transformation的命令行Carte:远程执行job和transformation的web server2个plugin:Instaview: 使用模板来管理复杂的数据访问和准备 Agile BI: 提供一套BI的协助工具14 BI系统概述 主流开源BI系统 建议选择 Pentaho平台 Pentaho计划15Pentaho计划鉴于pentaho是个庞大复杂的平台体系,学习掌握需要一定的时间和人员。但从其功能范围以及扩展性来看,一旦为我所用,则能避免很多重复的开发工作,并为后续的需求提供快捷的支持。Pentaho分为两大体系:BA

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论