数据仓库、数据挖掘与商业智能BI.ppt_第1页
数据仓库、数据挖掘与商业智能BI.ppt_第2页
数据仓库、数据挖掘与商业智能BI.ppt_第3页
数据仓库、数据挖掘与商业智能BI.ppt_第4页
数据仓库、数据挖掘与商业智能BI.ppt_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据仓库、数据挖掘与商业智能BI,同济大学经济与管理学院黄立平教授,数据仓库DW和数据挖掘DM讲座内容简介数据仓库和数据挖掘技术是近十年来,世界上广泛应用的信息技术之一。其主要作用是帮助企业有效地使用企业积累的大量数据;辅助管理层和决策层提高管理和决策的水平。讲座的主要内容如下:数据仓库概要;数据仓库的工作原理;联系分析处理OLAP;数据挖掘概念、原由、发展;数据挖掘的技术分类;数据挖掘在电信行业的应用;数据挖掘与知识管理;数据挖掘国内应用存在的问题;数据挖掘的未来发展。,前言数据挖掘是近年来信息爆炸推动下的新兴产物,是从海量数据中提取有用知识的热门技术。传统的信息系统,1990年代兴起的互连网技术及ERP系统在越来越廉价的存储设备配合下,产生了大量的数据。与之相辅相成的数据分析和知识提取技术在相当长一段时间里没有大的进展,使得存储的大量原始数据没有被充分利用,转化成指导生产的“知识”,形成“数据的海洋,知识的荒漠”这样一种奇怪的现象。,数据库技术的发展,收集和数据库创建(20世纪60年代以前)-原始文件处理数据库管理系统(20世纪70年代)-层次、网状、关系数据库系统-数据建模工具:实体-联系(ER)模型等-索引和数据组织技术-查询语言:SQL、用户界面:表单、报告等-查询处理和查询优化、事务并发控制等-联机事务处理(OLTP),高级数据库系统(1980年代中期现在)-高级数据模型:扩充关系、面向对象、对象-关系-面向应用:空间的、时间的、多媒体的、主动的、科学的、知识库数据仓库和数据挖掘(1980年代后期现在)-数据仓库和OLAP技术-数据挖掘和知识发现基于Web的数据库系统(1990年代现在)-基于XML的数据库系统-Web挖掘,数据库应用中存在的问题,“数据丰富,信息贫乏”。存储了大量数据的数据库变成了“数据坟墓”难以再访问的数据档案;在大型数据库中快速增长着海量数据,理解数据的含义已经远远超出了人的能力;领导者的重要决策往往无法、及时获得信息,因为缺乏从海量数据中提取有价值知识的工具;若在当前运行的操作数据库中获取信息,则影响数据库的使用和性能。,海量数据要求强有力的数据分析工具,以前的专家系统依赖用户或某领域的专家人工地将知识输入知识库;这一过程常常有偏差和错误,并且耗时、费用高;使用数据挖掘工具进行数据分析;可以发现重要的数据模式,对商务决策、知识库、科学和医学研究作出了巨大贡献;数据和信息之间的差距,要求系统地开发数据挖掘工具,将沉寂的数据转换成宝贵的知识。,案例“啤酒与尿布”是一个发生在WalMart的关于数据挖掘的经典故事:它告诉人们:可以利用手中大量似乎没有规律的数据,找出未知的规律;沃尔玛有先进的卫星通讯网络1983年开始,用巨资建立的卫星通讯网络系统使其供货系统更趋完美;沃尔玛有完整的数据记录、存储和分析系统;如何获得客户的销售记录?数据挖掘由什么人来实现?是否每时每刻都可以进行数据挖掘?是否每次都能挖掘出理想的结果?我国在处理经济犯罪案件时,发现由于管理的落后以及数据分析应用技术的落后,不能及时发现问题,什么是数据仓库DW(datawarehouse)?,数据仓库可以看作是一种特殊的关系数据库。DW是一个面向主题的、集成的、不更新的、随时间变化的数据集合,用于支持管理部门的决策过程”。DWS允许将各种应用系统集成在一起为统一的历史数据分析提供坚实的平台,对信息处理、决策提供支持。,数据仓库的主要特征,面向主题的(subjectoriented):(1)所谓主题(宏观领域),如顾客、供应商、产品和销售组织;是在高层次上将企业IS中的数据综合、归类并进行分析利用的抽象。面向主题,是指数据仓库内的信息是按主题进行组织的,为按决策的过程提供信息。(2)DW关注决策者的数据建模与分析,而传统数据库是面向应用的,集中于组织机构的日常操作和事务处理。(3)DW排除对于决策无用的数据,提供特定主题的简明视图。,(4)传统数据库使用OLTP联机事务处理方式,进行数据组织时考虑记录每一笔业务的情况;数据仓库使用OLAP联机分析处理方式,进行数据分析处理,以主题为单位组织数据,例如:供应商、商品、顾客等。(5)面向主题的数据组织方式要求将数据组织成主题域,各主题域之间有明确的界限(独立性),在某一主题内的数据应该包括分析处理所要求的一切数据(完备性)。,集成的(integrated):(1)构造数据仓库是将多个不同的数据源,如关系数据库、一般文件和联机事务处理记录,集成在一起。(2)将多个系统的数据进行计算和整理,保证DW的数据是关于整个系统的、一致的、全局的。使用数据清理和数据集成技术,确保命名约定、编码结构、属性等的数据结构一致性。保证各数据源中数据的一致性。,不更新的(nonvolatile):(1)访问数据仓库主要是两种方式:数据的插入和查询。修改和删除操作很少。(2)DW的数据与操作环境下的应用数据分开存放。因此,数据仓库不需要在操作环境下事务处理、恢复和并发控制等机制。,随时间变化的(time-variant):(1)数据仓库记录了从过去某一时间到目前的各个阶段的信息,通过这些信息,可以表明发展历程并对未来的趋势作出定量分析和预测。(2)DW的数据结构,隐式或显式地包含时间元素;其包含的大量综合数据也与时间相关,例如:月产量。(3)DW随时间变化不断增加新的数据内容;去掉超过时限(例如:510年)的数据。,DW概念总结:数据仓库是一种语义上一致的数据存储体系结构;DW是决策支持数据模型的物理实现,并存放企业战略决策所需信息;DW通过将异种数据源中的数据集成在一起构造而成;完成各种数据查询、信息分析报告和决策支持。,操作型数据库系统与数据仓库的区别,操作型数据库系统的主要任务是执行联机事务和查询处理,称为联机事务处理(OLTP)系统。它涵盖了一个组织的大部分日常操作,如采购、制造、库存、销售、财务、银行等事务。DW在数据分析和决策方面为决策者提供服务。可以用不同的格式去组织和提供数据,以便满足不同用户的形形色色需求。这种系统称为联机分析处理(OLAP)系统。,数据仓库的数据模型数据仓库和OLAP通常是基于多维数据模型。该模型将数据看作数据立方体(datacube)形式。数据立方体由维和事实来定义;以多维的形式对数据建模和观察。维是关于一个组织想要记录的透视或实体。事实是面向某一主题的数据度量,它表示了多个分析维之间的分析结果。多维数据模型通常有星型和雪花型两种形式。,数据仓库的体系结构,数据仓库的概念结构从数据仓库的概念结构看,应该包含:数据源、数据准备区、数据仓库、数据集市/知识挖掘库以及各种管理工具和应用工具。,1.维维是人们观察数据的特定角度。例如:时间维是商品销售随时间推移发生的变化;地理维是商品在不同地区的销售分布情况。2.维的层次某个维以下存在的对细节的多个描述方面,例如:时间维有年、季度、月、日等不同层次。3.维成员维的一个取值是该维的一个成员。,4.多维数组一个多维数组可以表示为(维1,维2,维3,维n,变量);例如:(地区、时间、销售渠道、销售额)5.数据单元多维数组的取值是数据单元。例如:(上海,2002年2月,批发,2188),OLTP和OLAP的主要区别服务对象:OLTP是面向顾客的,用于办事员、客户和信息技术专业人员的事务和查询处理。OLAP是面向市场的,用于经理、主管和信息分析人员的数据分析。数据内容:OLTP系统管理当前数据。这种数据太琐碎,难以用于决策。OLAP系统管理大量历史数据,提供汇总和聚集机制,并在不同的粒度级别上存储和管理信息。数据易于用作中、高层的决策过程。,数据库设计:OLTP系统采用E-R模型和面向应用的数据库设计OLAP系统采用星型或雪花模型和面向主题的数据库设计视图:OLTP系统主要关注一个企业或部门内部的当前数据,而不涉及历史数据或不同组织的数据。OLAP系统由于组织的变化常常跨越数据库模式的多个版本。OLAP系统也处理来自不同组织的信息,由多个数据存储集成的信息。由于数据量巨大,OLAP数据也存放在多个存储介质上。,访问模式:对OLTP系统的访问主要由短的原子事务组成。这种系统需要并行控制和恢复机制。对OLAP系统的访问大部分是只读操作(由于大部分数据仓库存放历史数据,而不是当前数据),尽管许多可能是复杂的查询。OLTP和OLAP的其他区别:包括数据库大小、操作的频繁程度、性能度量等。,OLTP系统和OLAP系统的比较表,特性OLTPOLAP特征操作处理信息处理面向事务分析用户办事员、客户、数据库专业人员经理、主管、分析员功能日常操作长期信息需求,决策支持DB设计基于E-R,面向应用星型/雪花,面向主题数据当前的,确保最新历史的,跨时间维护汇总原始的,高度详细汇总的,统一的视图详细,一般关系汇总的,多维的工作单位短的,简单事务复杂查询存取读/写大多为读关注数据输入、存储信息输出操作主关键字上索引/散列大量扫描访问记录数量数十个数百万用户数数千数百DB规模100MB到GB100GB到TB优先高性能,高可用性高灵活性,端点用户自治度量事务吞吐量查询吞吐量,响应时间,数据仓库为什么是分离的?操作型数据库存放了大量数据,为什么不直接在这种数据库上进行联机分析处理,而是另外花费时间和资源去构造一个与之分离的数据仓库?主要原因是提高两个系统的性能。操作数据库是为已知的任务和负载设计的,如使用主关键字索引,检索特定的记录和优化查询;数据仓库的查询通常是复杂的,涉及大量数据在汇总级的计算,可能需要特殊的数据组织、存取方法和基于多维视图的实现方法。,操作型数据库:支持多事务的并行处理,需要加锁和日志等并行控制和恢复机制,以确保数据的一致性和完整性。数据仓库:对数据记录进行只读访问,以进行汇总和聚集。如果OLTP和OLAP都在操作型数据库上运行,会大大降低数据库系统的吞吐量。总之,数据仓库与操作数据库分离是由于这两种系统中数据的结构、内容和用法都不相同。,两种系统的数据结构、内容和用法都不相同,操作型数据库一般不维护历史数据,其数据很多,但对于决策是远远不够的。数据仓库系统用于决策支持需要历史数据,将不同来源的数据统一(如聚集和汇总),产生高质量、一致和集成的数据。操作型数据库只维护详细的原始数据(如事务),这些数据在进行分析之前需要统一。由于两个系统提供很不相同的功能,需要不同类型的数据,因此需要维护分离的数据库。,多维数据模型,数据仓库和OLAP基于多维数据模型。该模型将数据看作数据立方体(datacube)形式。数据立方体允许以多维对数据建模和观察。它由维和事实定义。维是关于一个组织想要记录的视图或实体。例如,商店可能创建一个数据仓库sales,记录商店的销售,涉及维time,item(商品类),branch(分店)和location(地点)。这些维使得商店能够记录商品的月销售,销售商品的分店和地点。,主题:多维数据模型围绕中心主题(例如sales)组织。主题用事实表表示。事实是用数值度量的。根据它们分析维之间的关系。例如,sales销售数据仓库的事实包括dollars_sold(销售的款项),units_sold(销售量)和amount_budgeted(预销量)。事实表包括事实的名称,以及每个相关维表的关键字。,例:某连锁商店的销售数据按照维time季度,item商品类的2-D视图(其中销售数据是取自Location=“Vancouver”的所有分店,销售金额单位是1000美元)。item(商品类)_季度家庭娱乐计算机电话安全设备Q160582514400Q268095231512Q3812102330501Q4927103838580,以三维角度观察该连锁商店的销售数据。例如,根据time,item和location城市观察数据。location是Chicago,NewYork,Toronto和Vancouver。location“Chicago”;location“NewYork”.(该市上述二维表略)(该市上述二维表略),多维数据库模型:星型、雪花型,关系数据库设计广泛使用ER数据模型。数据库模式由实体的集合和它们之间的联系组成。这种数据模型适用于联机事务处理。数据仓库需要简明的、面向主题的模型,便于联机数据分析。数据仓库数据模型是多维数据模型。这种模型有星型模式、雪花模式等。,星型模式(starschema):是数据仓库最常见的数据模型,其中包括:(1)事实表:包含大批数据和不含冗余的中心表;(2)一组小的附属表(维表),每一维一个。维表围绕中心表显示在连线上。例:某连锁商店的星型模式如下图所示。sales有四个维,分别是time,item,branch(分店)和location。该模式包含一个中心事实表sales,它包含四个维的关键字和两个度量dollars_sold销售的款项和units_sold销售量。,在星型模式中,每一维只用一个表表示,每个表包含一组属性。例如,location维表包含属性集location_key,street,city,province_or_state,country。,sales数据仓库的星型模式timesalesitem维表事实表维表time_key-time_keyitem_namedayitem_key-item_keyday_of_the_weekunits_soldbrandmonthdollars_soldtypequarterlocation_keysupplier_typeyearbranch_key|branch维表location维表branch_keylocation_keybranch_namestreetbranch_typecityprovince_or_statecountry,雪花模型(snowflakeschema),雪花模型是星型模式的变种,其中某些维表是规范化的,因而把数据进一步分解到附加的表中。结果,模型图形成类似于雪花的形状。雪花模型和星型模型的主要不同在于,雪花模型的维表可能是规范化形式,以便减少冗余。这种表易于维护,并节省存储空间,因为当维结构作为列包含在内时,大维表可能非常大。由于执行查询需要更多的连接操作,雪花模型可能降低浏览的性能。数据仓库系统的性能可能受到影响。在数据仓库设计中,雪花模式不如星型模式使用广泛。,该连锁商店sales的雪花模型在下图给出。这里,sales事实表与上面的星型模型相同。两个模式的主要不同是维表。星型模型中的item的单个维表在雪花模型中被规范化,导致新的item表和supplier供应商表。例如,现在item维表包含属性item_key,item_name,brand,type和supplier_key,supplier_key连接到supplier维表。而supplier维表包含信息supplier_key和supplier_type。类似地,星型模型中location的单个维表被规范化成两个表:新的location和city。新的location表中的location_key现在连接到city维。根据需要雪花模型还可以进一步规范化。,sales数据仓库的雪花模式,timesalesitem时间维表事实表商品维表time_key-time_keyitem_namedayitem_key-item_keyday_of_the_weekunits_soldbrandmonthdollars_soldtype供应商维表quarterlocation_keysupplier_type-supplier_keyyearbranch_key|(规范化)supplier_type|分店维表地点维表(规范化)branch_keylocation_keybranch_namestreet城市维表branch_typecity-city_keyprovince_or_statecountry,从1980年代末的初露头角到1990年代末的广泛应用,以数据挖掘为核心的商业智能(BI)已经成为IT及其它行业中的一类新星。当前数据挖掘应用主要集中在电信业(客户分析),零售业(销售预测),银行业(客户欺诈),电力(客户呼叫),生物(基因),天文(星体分类),化工,医药等方面。,当前数据挖掘能解决的典型问题:数据库营销(DatabaseMarketing);客户群体划分(CustomerSegmentation链接分析工具(识别不同人和活动之间的联系),分类工具(滤掉不相关的属性,对高度相关属性排级);聚类分析工具(将不同案例分组);孤立点分析工具(探测异常资金量的转移或其他行为);序列模式分析工具(分析异常访问模式的特征)。,在传统的决策支持系统中,数据库、模型库和知识库往往被独立地设计和实现,因而缺乏内在的统一性。数据仓库、联机分析和数据挖掘组成的新的决策支持系统构架解决了决策支持系统数据库内数据的不一致问题。由于内在的统一性,这种新结构很好地解决了相互间的衔接问题,实现了设计观念从处理驱动到数据驱动的转变;从而使信息的使用重点将逐步从支持面向操作层的联机事务处理、中间管理控制层的管理信息系统提高到数据模式分析,高层的决策支持和分析预测上来。,企业知识管理的成功案例:SPSS在英国电信的应用,英国电信面临问题:为了从市场营销预算中获得最大的价值,英国电信需要建立模型来确定潜在客户的购买倾向和他们变为用户之后可能的价值。建立精确的客户特征以后,英国电信打算开发针对于特定客户群的产品。预期结果是:更好的营销活动回应率,增加产品收入,并取得更大的市场份额。,英国电信选用了SPSS的数据挖掘产品Clementine,来为其“商业高速公路”活动分析数据和建立探索模型,“商业高速公路”的目标为小型商业客户服务。如今,英国电信更好地了解了这些客户和他们在电信市场的行为特征。英国电信将继续使用Clementine快速可视化的建模环境为其未来的营销活动指引道路。结果:向销售人员和营销活动提供了“最佳客户”清单直邮活动回应率提高了100%,曾经是平安无事的电信行业现在已充满了火药味。以前是垄断寡头的英国电信,现在仍然是英国本地电话、国内长途、国际长途和数据服务的领导者,年销售额290亿美元,但同时也面临着160家电信公司的竞争。为保持其原有客户,获取新的客户并最大化销售,英国电信需要准确知道哪些人在购买它的产品和服务。,为了识别这些客户,英国电信设立了客户和营销活动分析小组,由高级咨询师领导,隶属于商业联系部门。这个小组的第一个任务是为英国电信的“商业高速公路”产品建立客户特征模型,“商业高速公路”专门服务于一条线有三个电话号码(一个是标准的,两个是数字的)的小型商业客户。1998年9月进行了一次直邮活动和全国媒体宣传。,有关客户、产品、账单和历史数据分散在英国电信的不同部门。分析小组首先在一个新的数据集市(具有某一主题结构的数据仓库)收集用于数据库营销的数据。数据准备需要相当多的时间,因为数据必须从它们所在的系统中抽取出来,然后进行匹配、清理和排序;此后,才能用Clementine对这些数据进行分析。,用数据挖掘工具发现隐含的模式。为对样本数据进行挖掘并从中发现潜在的模式和趋势,英国电信选择了SPSS的高速建模环境Clementine数据挖掘工具包。因为它提供了大量的分析方法,如聚类、神经网络、关联规则和决策树。Clementine也可以轻松地处理常规数据问题,如异常值、缺失值和取值较小的数值。,过程:分析数据并建立模型。分析小组用Clementine进行数据分析和试验建模在数据分析过程中,分析小组用Clementine识别出数据质量问题,熟悉数据和数据分布,排除与购买“商业高速公路”关系不太密切的数据属性。然后,对和客户购买产品的倾向相关的单个数据属性的预示力度进行测量。如,二位区号,作为地理指示器,清楚地和回应和购买数据相联系。,进行这些分析以后,分析小组用Clementine的决策树快速地建立和检验了一系列试验模型。Clementine最大的优势在于在数据挖掘过程中不会遗漏信息。Clementine可以快速地试验多种想法,排除不合适的,这样就减少了失败造成的费用。可以在几天内建立很多试验模型。英国电信超越原始目标,并使活动的回应率提高了100%。,向销售人员和营销活动提供了“最佳客户”清单“Clementine的主要输出结果是对数据的洞察(数据挖掘的全部目的所在)和这些洞察结果的可视化展示;提供给销售人员和营销活动的是客户清单和图形,并表明了为什么他们应该向这些客户推荐商业高速公路。商业高速公路项目的成功说明了如何在商业活动中通过数据挖掘获利。有了Clementine,先前所作的探索性数据分析和可视化使英国电信可以开发出满意的客户选择标准。,下一步,分析小组计划使用Clementine识别有最大潜在利润的客户和查询了很多但不会购买的客户。未来他们或许会尝试确定客户背叛的模式。建模:投资回报成功地建立客户特征需要商业知识、合适的数据和合适的产品。英国电信新的建模方案使之可以在产品和活动的整个生命周期中定位目标客户,确定不断变化的市场的发展趋势并加强在不同市场领域的渗透。Clementine作为SPSS的数据挖掘工作平台,将为营销活动提供快速、可靠的统计分析。回报就像英国电信的商业高速公路案例所表明的:更好的客户和更高的销售。,知识不同于信息,其特征在信息要经过学习与价值认知方能形成知识。知识也不同于技术,技术是产品与服务的具体组成部份,因此仅属于有形知识的一部份,而知识还包括产品与服务的抽象组成部份,并作为驱动技术创新与产品创新的重要基础。,商务智能以零售业为例,参考深圳索迪科技有限公司夏华学二五年十月,国内零售行业IT发展的现状与趋势,总体情况和趋势根据相关统计资料显示,当前中国零售行业百强企业均不同程度地实施了企业信息管理系统。其中,与零售行业主营业务密切相关的MIS系统(主要有:财务管理、POS系统、物价管理等)系统应用较为广泛。还有CRM、决策支持管理系统等正逐步成为商业企业当前信息化建设的重点和热点。商业零售企业领导均充分认识到企业信息化建设的重要性,并积极加大对企业信息化建设的投入,逐步扩大企业信息化建设在企业发展投资中所占的比重,但受访企业没有一家对本单位信息化现状表示“非常满意”。,国内零售行业IT发展当前面临的主要问题,业务系统相互独立,现行各业务系统各自独立互不协调;从而导致很多统计口径和统计指标在不同的系统存在各自不同的表达,在统计上极易造成混乱。,统计工作重复、分散,部门间的统计报表有交叉,有些同名统计指标的表达不一致。并且数据分布在不同的系统中,而业务决策部门的要求往往是全面的数据统计,致使信息中心疲于奔命,尚不能满足业务决策部门的统计需要。,无法有效地利用现有数据,一方面,业务决策部门不能及时掌握全面的业务信息;另一方面,信息中心完善了面向于操作的业务系统,基本满足业务操作的需要,积累了大量的基础业务数据;但由于数据过于零散而且分布在各个独立的系统中,造成虽然有各种各样的数据但不能集成到一起来满足管理层决策的需要。,何为商业智能?,零售企业使用商业智能系统的条件及意义,企业上商业智能系统的条件:,零售企业上马商业智能系统的条件及意义,企业上商业智能系统的意义:,商业智能系统建设目标,建立企业数据中心,建立企业绩效考核中心,建立企业综合查询中心,建立企业决策支持中心,数据整合,数据应用,数据应用,数据应用,商业智能系统所产生的效益,短期效益,系统建设的短期效益就是通过对商品销售情况库存情况采购情况成本情况费用情况等直接关系到企业效益的经营业务数据进行分析,逐步优化产品的结构来提高商品销售金额、合理控制库存降低库存成本、对费用进行分析控制费用以及对现金流进行分析来控制安全的现金流。通过对以上经营情况进行分析来提高销售、降低成本以实现提高企业的经营效益和经营效率,增强企业的竞争优势的目的!,商业智能系统所产生的效益,通过对员工的绩效、部门的计划完成情况、用户的达成率等绩效的考核控制,逐步建立一套完成的企业绩效考核体系,提升企业经营管理水平,增强企业的竞争力。通过对商品的销售趋势分析、商品结构变化分析以及财务分析(如:成本分析、现金流分析)建立一套完整的监控预警以及决策支持体系,及时调整企业经营策略,增强企业抗风险能力。,系统建设的长期效益主要体现在如下两个方面:,长期效益,商业智能系统总体架构,商业智能系统应用层次体系,商业智能系统建设主要存在的风险,尽管零售业商业智能受到全球零售业的关注,热衷程度也逐渐升高。但是对企业而言,因为涉及的范围及层级甚广,包括信息技术、投资金额、业务流程、资料完整性等,项目的风险性极高。综观国外,仍然不乏有成功案例;反观国内,零售业者对于商业智能的信息技术与解决方案尚属萌芽阶段。零售业商业智能一般包括:客户关系管理、商店经营管理、商品组合、商品推广、财务分析与电子商务等分析范围。,商业智能系统建设风险控制,在项目实施过程中由于涉及到数据的完整性、应用的重视程度、分析模型的准确性等多方面因素,所以项目存在一定的风险,我们将通过以下手段来控制项目风险:,充分调研,充分了解企业管理以及绩效管理的焦点,建设能满足分析需求的数据分析模型。认真了解业务系统,充分把握业务系统数据,提高数据的准确性和完整性。企业领导亲自负责,通过企业领导亲自负责来提高系统的应用重视程度。,商业智能系统主要分析手段及分析方法,零售行业商业智能主要功能模块,零售行业商业智能主要数据模型,以商业销售数据为分析对象,分析商业销售情况,商品类型的销售结构、广场分布结构、供货商销售毛利贡献排行情况、品种毛利贡献情况、销售金额增长趋势、销售毛利增长趋势、销售毛利率变化趋势、主要商品销售趋势、供应商销售金额区间分析、商品品种销售金额区间分析、库区销售规模区间分析等。主要分析超市各项销售指标,例如商品销售数量、商品销售金额、会员卡销售金额、会员卡销售比重、商品累计销售金额、销售金额同比、销售金额同比增加、销售金额同比增长、毛利、毛利同比、商品销售单价、单价同比等,销售分析模型,而分析维又可从管理架构(企业组织)、时间维度、商品属性、经营方式等维度进行分析。,类型的销售结构广场分布结构销售分析供货商销售毛利贡献排行情况商品品种毛利贡献情况,销售金额增长趋势销售毛利增长趋势销售毛利率变化趋势主要商品销售趋势供应商销售金额区间分析,品种销售金额区间分析主体品种区间分析会员卡消费趋势经营类型结构分析,可进行的分析,零售行业商业智能主要数据模型,分析内容:库存直接反映企业经营状况和资金周转效率,所以对库存进行分析能够有效控制库存、降低经营风险、降低经营成本和提高经营效益。主要分析各项库存指标,例如:商品库存数量、库存对比情况、库存结构情况、库存金额情况、库存变化情况、商品存销比、库存销售天数、库存安全情况、库存盘点情况、库存损耗情况等;分析维度管理架构(企业组织)时间维度商品属性经营方式,库存分析模型,库存分析,库存变化情况分析,库存与效益情况分析,合理库存区间分析,库存流动与库存量比较分析,库存结构情况分析,当前库存健康状况,库存情况与销售情况分析,库存损耗分析,可进行的分析,零售行业商业智能主要数据模型,促销分析模型,分析内容:促销前进行促销效果预测促销后进行促销效果分析,指标设计:销售金额、毛利、促销对比期金额、促销对比期毛利。,可进行的分析,促销可行性分析促销情况分析促销影响分析(对比)促销商品的相关商品分析,零售行业商业智能主要数据模型,坪效分析模型,分析内容:以商业销售数据、营业面积为分析对象,分析商业销售情况,广场分布结构、营业绩效情况、营业绩效增长趋势、单位面积销售金额增长趋势、单位面积销售毛利增长趋势、单位面积库区销售规模区间分析等。,指标设计:销售金额、毛利、营业面积、单位面积的销售金额以及毛利。,维度设计:时间维度:年、季度、月。组织结构维度:部门、楼层商品属性维度:商品分类、商品大类、商品供应商经营方式维度:经营类型,单位面积的销售结构广场分布结构单位面积毛利贡献排行情况广场机构毛利贡献情况销售金额增长趋势,销售毛利增长趋势单位面积毛利变化趋势单位面积主题主打商品销售趋势单位面积销售金额区间分析广场销售规模区间分析,可进行的分析,零售行业商业智能主要数据模型,其他分析模型,经营分析模型,经营分析模型,财务分析模型,采购分析模型客流以及销售特征分析毛利贡献分析会员卡分析价格趋势分析,经营坪效分析人均经营贡献分析经营计划进度分析,现金流分析成本分析费用分析应收应付账款分析,商品软件:MDDAS多维数据分析平台简介,多维数据分析系统MDDAS(Multi-DimensionalityDataAnalyzeSystem)是一种按照路径求解模式的数据分析系统,用户可以从不同的路径查询分析数据。2001年实施中国烟草专卖局的经济运行分析系统时,用户是中国烟草专卖局经济运行司根据实际需求提出很多有建设意义的软件需求,例如:分析风格的自定义、自动生成文字报告、例行分析的生成到后来的分析摸板的生成等等,及时的丰富和完善了路径求解模式的产品。2002年的时候,在进一步实施商业智能项目的时候,发现路径求解模式虽然有它的优势,但是不能解决用户的其他的需求,例如:交叉表的实现、数据展开分析、数据元的选择等等,就着手维度求解模式产品的开发,及时开发出了新的产品,不仅如此,还集成了很多数据统计算法和数据分析算法,数据导出成文件等等新的功能,进一步完善了产品,形成了现在的MDDAS。,在用MDDAS平台实施项目的时候,发现查询比较大的数据量的时候,效率总是很低,后来根据实际的需求,提出了菱形结构数据模型的概念,并迅速应用到实际项目中,菱形结构数据模型取得了巨大的成功,解决在项目实施过程中的数据压力问题,MDDAS取名于多维数据分析系统,其实就其功能和解决的问题来说,MDDAS已经远远超出了多维数据分析的范围,是一个名副其实的商业智能平台产品。MDDAS提供的功能包括:多维分析、即席查询、企业报表、预警监控、统计学模型、数据挖掘、信息发布7大主要功能,支持面向关系型数据仓库和面向目前主流的OLAP多维数据仓库(IBMOLAPServer)。,MDDAS软件架构,MDDAS采用国际上最前沿的软件基础框架标准XMLWebServicess(Web环境分布式组件技术)和ActiveX技术,把各种商业智能技术整合到一个集成环境中,为企业提供新一代协同工作的商业智能环境。MDDAS另外一种集成方式是采用应用程序集成,其数据连接采用RemoteServer,具有成本低、定制灵活等特点,适合中小型企业应用。,MDDAS具备的主要功能简介,一、灵活的数据展现功能,MDDAS具备的主要功能简介

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论