




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、BI讲座,BI的诞生 BI概念 ODS DATA WAREHOUSE ETL OLAP BI展现 常用的BI 厂商和产品 BI在中国,主 题,BI的诞生,随着IT技术的进步,传统的业务交易系统有了长足的发展,已经实现了业务信息化,每一笔业务数据都记录在数据库中,星转斗移,累积了以TB为计量单位的业务数据记录。也许你会问:这么多数据,占用了很多存储设备,耗费存储成本,却又不经常访问,留着它有什么用处?可以给你肯定的回答,留着这些历史数据意义巨大,挖掘业务的规律、支持决策。典型的案例有“尿片和啤酒”的故事,尿片和啤酒本来是两样不相干的东西,可是,有人就发现,星期五在超市里购物的,购买尿片的年轻父亲
2、中有30%40%的人同时购买啤酒。原来,星期五年轻的父亲购买尿片时,还会为自己捎带买啤酒,因为,,星期五是各家电视台转播橄榄球赛的时间,于是,超市老板们就把尿片和啤酒捆绑销售获得了巨大成功。这个故事成了一个利用数据挖掘商业价值最大化的神话。由此看来,非常不关联的两样东西,通过海量的信息数据处理,可以挖掘出它们之间潜在的关联,将这种关联商业化,就会得到意想不到的新业务或新的商业模式。到底该怎样把这些占据大量存储空间的数据的价值挖掘出来,让这些数据从成本的消耗者变成利润的促进者呢?新的数据分析技术由此诞生了,完成了“数据”到“数据价值”转换的环节,同时给这项技术起了一个响亮而又神密的名字“BI”(
3、Business Intelligence),BI概念,一、BI的定义 BI是Business Intelligence的英文缩写,中文解释为商务智能,用来帮助企业更好地利用数据提高决策质量的技术集合,是从大量的数据中钻取信息与知识的过程。简单讲就是业务、数据、数据价值应用的过程。用图解的方式可以理解为下图: 这样不难看出,传统的交易系统完成的是Business到Data的过程,而BI要做的事情是在Data的基础上,让Data产生价值,这个产生价值的过程就是Business Intelligence analyse的过程。,数据价值,业务,数据,场景,说个场景,一天去街上买烤白薯,和老板那银聊
4、天。 银:“你娃干哈地呀?” 俺:“做软件的。” 银:“啥子软件?” 俺:“bi” 银:“啥东西?” 俺:“哦,就比如说你天天在街上卖烤白薯,天天有人买,可是你希望生意能再好一点,我就把你过去两年卖白薯的记录都拿出来,拿俺们的软件分析分析,就能告诉你,这疙瘩都啥样银喜欢七烤白薯,啥样白薯受欢迎,多大个的白薯涨点价还能卖得好,预测一下你下礼拜大概还能卖多少白薯” 俺:“俺们软件大概就是这东西吧” 银:“哦俺明白了”,系统结构,数据挖掘技术(Data Mining),DM的定义 数据挖掘(Data Mining)是从大量数据中挖掘出隐含的、先前未知的、对决策有潜在价值的知识和规则,为决策、策划、金
5、融预测等提供依据,使大型数据库作为一个丰富可靠的资源为知识归纳服务。 DM的特点 面向应用 涉及数据库技术 运用了统计分析、人工智能多种技术 特征和规律描述 预测和验证功能,ODS,ODS全称为Operational Data Store,即操作型数据存储,是“面向主题的、集成的、可变的、反映当前数据值的和详细的数据的集合,用来满足企业综合的、集成的以及操作型的处理需求”(Bill.Inmon)。ODS是数据仓库体系结构中的一个可选部分,ODS具备数据仓库的部分特征和OLTP系统的部分特征。,DATA WAREHOUSE,概念产生标志:以Prism Solutions公司副总裁W.H.Inmo
6、n在1990年出版的建立数据仓库(Building the Data Warehouse)。 数据仓库 面向主题的、集成的、稳定的、不同时间的数据集合,用以支持经营管理中的决策制定过程。 目的:解决在信息技术(IT) 发展中存在的拥有大量数据、然而有用信息贫乏(Data rich-Information poor)的问题。,ETL,是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。,OLAP,(On-Lin
7、e Analytical Processing)即联机分析处理,是 BI的一种全新的数据封装方式,直接产物是报表或Cube,是使分析人员、管理人员或执行人员能够从多角度对信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。 OLAP展现在用户面前的是一幅幅多维视图。 维(Dimension):是人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维(时间维、地理维等)。 维的层次(Level):人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面(时间维:日期、月份、季度、年)。 维的成员(Member):维的一个取值,是数据项在某维中位
8、置的描述。(“某年某月某日”是在时间维上位置的描述)。,度量(Measure):多维数组的取值。(2000年1月,上海,笔记本电脑,0000)。 OLAP的基本多维分析操作有钻取(Drill-up和Drill-down)、切片(Slice)和切块(Dice)、以及旋转(Pivot)等。 钻取:是改变维的层次,变换分析的粒度。它包括向下钻取(Drill-down)和向上钻取(Drill-up)/上卷(Roll-up)。Drill-up是在某一维上将低层次的细节数据概括到高层次的汇总数据,或者减少维数;而Drill-down则相反,它从汇总数据深入到细节数据进行观察或增加新维。 切片和切块:是在一部分维上选定值后,关心度量数据在剩余维上的分布。如果剩余的维只有两个,则是切片;如果有三个或以上,则是切块。 旋转:是变换维的方向,即在表格中重新安排维的放置(例如行列互换)。,商业智能的应用,典型行业: 银行 保险 证券 电信 零售,新应用行业: 税务 电力 ,前端展示工具评估,MSTR BO Cognos Brio SAS CA,BI在中国,中国拥有5000年的文化史,灿烂的文件让日常报表也非常具有凝聚力,交错纵横,里外相嵌,格式诡异、规则古怪、数据集中而闻名于世,让无数报表工具折腰
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 【正版授权】 IEC 60268-7:2025 CMV EN Sound system equipment - Part 7: Headphones and earphones
- 2024年河北省隆化县人民医院公开招聘护理工作人员试题带答案详解
- 洪洞教编初中数学试卷
- 医院项目管理课件
- 医院课件教学课件
- 《网络综合布线》教案 项目3实训任务 实施工程预算和撰写采购招标文件
- 健康管理中心课件内容
- 中国无线鼠标行业发展监测及投资战略规划研究报告
- 2021-2026年中国风光互补控制器市场竞争格局及投资战略规划报告
- 2025-2030年中国制动鼓行业市场供需态势及发展前景研判报告
- 2025年北京市中考数学真题试卷及答案
- 硬笔书法全册教案共20课时
- 模切品质培训
- 北京昌平霍营街道社区“两委”干部储备人才招募笔试真题2024
- 2025年安徽省中考数学试卷真题(含标准答案及解析)
- (人教PEP版2025新教材)英语三下期末分单元复习课件
- 19S406建筑排水管道安装-塑料管道
- 新概念英语第一册单词汇总打印版已排版
- 湘版高中音乐鉴赏《中国近现代通俗音乐》教学设计、实录与反思
- 混凝土施工仓面设计
- 电话号码中的数学问题
评论
0/150
提交评论