BI实施常用分析方法_第1页
BI实施常用分析方法_第2页
BI实施常用分析方法_第3页
BI实施常用分析方法_第4页
BI实施常用分析方法_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、BI常用数据分析方法1、了解数数据、总总体、样样本的含含义及随随机抽样样的一般般方法;2、掌握排排列图、因果分分析图的的作图方方法和应应用;3、掌握分分层法、统计图图表法的的应用;4、了解直直方图的的原理、作用、作图方方法及应应用;培训要求求培训主要要内容:瞎子王国国里,有一只眼眼精的人人就是国国王!统计分析析工具对帐单(检查表表);流程图;散布图;直方图;排列图;控制图;因果分析析图;有一些统统计分析析工具可可供书业业公司用用来解决决经营问问题,它它们有助助于收集集和分析析数据以以便为决决策提供供依据。第一部数数据分分析概述述1、什么是是数据? 数据是对对图书销销售业务务全过程程记录下下来的

2、、可以以以鉴别的的符号。数据是是销售业业务全过过程的属属性数量量、位置置及相通通关系等等等的抽抽象表示示。数据表现现形式表现形式式一数据列表数据表现现形式二二描述性分分析:数数据分时时段走势势、差距距变化情情况以及及相相应的的时间背背景销售码洋洋趋势图图数据表现现形式三三销售码洋洋结构比比图形可以以帮助我我们将数数据转换换成信息息2、数据分分析目的的让数据说说话;行动的向向导;杜绝浪费费;提供决策策的依据据。3、数据的的分类按数据的的性质一一般可归归纳为:定性数据据。往往往用于频频数或频频率分析析。定量型数数据。可可以用数数字量化化的数值值。按数据的的来源可可分为:人力资源源数据;财务数据据;

3、营销数据据;采购数据据;仓储数据据;生产数据据;编辑数据据。4、运用统统计方法法应遵循循的原则则坚持用数数据说话话的基本本观点。有目的地地收集数数据。掌握数据据的来源源。认真整理理数据。5、统计分分析流程程确定问题题确定分分析目标标采用科学学方法收收集数据据考察数据据时效性性整理数数据统计分析析出具分析析报告,提出解解决意或或建议5、数据分分析误区区误区一:展示元素素不宜大大于3个5、数据分分析误区区误区二:时间序列列数据最最好使用用折线图图,而不不宜使用用柱状图图等误区三:研究用数数据最好好不使用用三维立立体图5、数据分分析误区区误区四:为避免免图表的的欺骗性性,图线线最好占占据2/3至3/

4、4的高度(调整Y轴刻度)5、数据分分析误区区第二部常常用的的数据分分析方法法总体:总体、个个体个体:总体又叫叫母体,是研究究对象的的全体。出版商一一个批次次到货的全部都都可以称称为总体体。构成总体体的基本本单位,称为个个体。每册书都都是一个个个体。来货检验验常用抽抽样方法法进行,即从来来货总件件数中抽抽出一部部分件数数,并测测试每件件的有关关册数是是否够数数的特性性数据,进行统统计分析析后,对对总体作作出估计计和判断断。样本:样本样本又叫子样,是从总总体中抽抽出来一一部分个个体的集集合。样本中每每个个体体叫样品,样本中中所包含含样品数数目称为为样本大大小,又又叫样本量,常用n表示。对样本的的特

5、性进进行测定定,所得得的数据据称为样本值。当样本个个数越多多时,分分析结果果越接近近总体的的值,样样本对总总体的代代表性就就越好。抽样方法法学用的统统计抽样样方法主主要有以以下三种种随机抽样样法分层抽样样法系统抽样样法书业公司抽样方法法随机抽样样指总体中中每一个个个体都都有同等等可能的的机会被被抽到。这种抽抽样方法法事先不不能考虑虑抽取哪哪一个样样品,完完全用偶偶然方法法抽样,常用抽抽签或利利用随机机数表来来抽取样样品以保保证样品品代表性性。抽样当图书品品种不多多时,随随机抽样样是一种种有效的的抽样方方法;抽样方法法分层抽样样分层抽样样是先将将总体按按照研究究内容密密切有关关的主要要因素分分类

6、或分分层,然然后在各各层中按按照随机机原则抽抽取样本本。分层层抽样可可以减少少层内差差异,增增加样本本的代表表性。抽样样本当到货产产品较多多时,分分层抽样样是一种种有效的的抽样方方法;抽样方法法系统抽样样从总体中中每隔K个个体抽抽取一个个个体的的抽样方方法,比比值K是总体容容量N与样本容容量n之比;当出版商商批量发发货及产产品特别别多时,并且易易作某种种次序的的整理时时,系统统抽样比比分层抽抽样好;1,2,.KK+1,K+2,.,2K2K+ 1,2K+2,.,3K直到N为止例,从具具有1000个个体的的总体中中抽取50个个体。总体、样样本、数数据间的的关系总体样本结论数据抽样分析管理测试数理整

7、理理和统计计抽样的目目的是通通过样本本来反映映总体。在书业公公司经营营管理中中,常常常将测试试的样本本数据,通过整整理加工工,找出出它们的的特性,从而推推断总体体的变化化规律、趋势和和性质。一批数据据的分布布情况,可以用用中心倾倾向及数数据的分分散程度度来表示示,表示示中心倾倾向的有有平均值值、中位位值等,表示数数据分散散程度的的有方差差、标准准偏差、极差等等。描述总体体数据离离散程度度的参数数为方差差2,描述总总体数据据中心倾倾向的数数为均值值。若利用用样本参参数近似似描述总总体状况况时,可可以利用用样本方方差S2近似代替替总体方方差2,利用样样本均值值X近似代替替总体均均值p。数理整理理和

8、统计计样本平均均值样本中位位值X =X1+X2+X3.+Xnn中位值是是按照数数据大小小顺序排排列位于于中间的的数值,中位值值记为X若n为偶数,则取位位于中间间两个数数值的平平均值为为中位值值;数理整理理和统计计样本极差差样本方差差和样本本标准偏偏差样本方差差和样本本标准差差就是用用来度量量数据波波动幅度度大小的的一个重重要特性性值。样样本方差差是一组组数据中中每一个个数值与与平均值值之差的的平方和和的平均均值,通通常记为为S2;样本方方差的平平方根S称作样本本标准偏偏差,它它与样本本方差一一样,是是反映一一组数据据分散程程度的特特性值:样本极差差表示一一组数据据分布的的范围,是指数数据中最最

9、大值与与最小值值的差:R =Xmax- Xmin检查表在书业公公司日常常管理中中最强调调的是事事实管理理,就是是要掌握握事实,要掌握握事实就就必须设设计检查查表收集集数据。业务记录录用检查查表层别法层别法是是所有手手法中最最基本的的概念,即将多多种多样样的数据据,因应应用目的的的需要要分类成成不同的的“类别别”,使使之方便便以后的的分析;采购营销物流财务其他他公司数据据仓库层别法用在检查查表上用在排列列图上排列图(帕累拉拉图)关键的少少数,次次要的多多数。通常所说说的80/20法则。针对问题题所收集集的数据据按其重重要性的的顺序,记录在在帕累托分分析表中中。公司80%的销售来来自于20%教辅图

10、书书产品。排列图的的作用公司要解解决的问问题很多多,但从从何入手手呢?事实上,大部分分的问题题,只要要能找出出几个影影响较大大的因素素,并加加以处置置及控制制,就可可解决问问题的80%以上。柏柏拉图是是根据收收集的数数据,以以不良原原因、不不良状况况发生的的现象,有系统统地加以以项目别别分类,计算出出各项目目所产生生的数据据(如作作业准确确率、损损失金额额)及所所占的比比例,再再依照大大小顺序序排列,再加上上累积值值的图形形产品销售售排列图图销售名次产品名称销售码洋所占%备注合计排列图的的作图方方法步骤骤将用于排排列图所所记录的的数据进进行分类类。 确定定数据记记录的时时间。 按分分类项目目进

11、行统统计。 计算算累计频频率。 准备备坐标纸纸,画出出纵横坐坐标。 按频频数大小小顺序作作直方图图。 按累累计比率率作排列列曲线。 记载载排列图图标题及及数据简简历。排列图:例1如一公司司由物流流中心人人员操作作问题,导致图图书损耗耗。记录录两季教教辅销售售期所产产生库存存损耗不不良情况况数据,并分别别将不良良项目归归结为下下表排列图:例2物流中心心由于操操作问题题导致图图书损耗耗断数数印刷质量量污染排列图:例2断数污染印刷质量量排列图:练习上例中物物流库存存损耗项项目,此此损耗为为全年损损耗码洋洋的总和和,再将将产品类类别用柏柏拉图法法分析如如下:排列图:练习排列图:练习损耗50100150

12、200比率66.7%17.9%5.1%4.1%6.1%20406080100ABCD其他排列图的的应用1、利用排排列图寻寻找图书书损耗的的改善重重点;2、利用排排列图验验证改善善图书损损耗的效效果;之前 100%之后 100%实现的改改善排列图的的应用3、利用排排列图对对图书损损耗进行行分层研研究;ABC因果图因果图某项结果果之形成成,必定定有其原原因,应应设法利利用图解解法找出出其原因因来。因果图库存损耗耗采购报订订出版社发发货运输搬运在库保管管配货呆滞库存客户市场环境库存管理模式问题仓储库存管理方面出版社问题采购管理问题未作先进先出管制未作库存管制库存帐不准延迟交货印刷错误无理性采购决策未

13、严密按照应采购量第三方进货已有积压库存原先订购量太多销售期已过不适宜定量法安全存量营销法存量水准未适当修正未作净需求复核预测方法错误客户取消订单滞库图书书因果分分析因果图运用因果果图有利利于找到到问题的的症结所所在,然然后对症症下药,解决问问题。因因果图再再经营管管理活动动中,尤尤其是在在物流作作业中、问题分分析中有有着广泛泛的用途途。库存损耗耗人的因素技术不佳佳粗心缺乏培训训无责任心心对策表对策表当利用鱼鱼刺图确确定了经经营问题题产生的的主要原原因后,有必要要采取措措施去消消除这些些原因,以达到到改进的的目的。这时,可以采采用对策策表的方方法。用以针对对经营问问题产生生的原因因制定对对策或措

14、措施,作作为实施施时的依依据。对策表的的目的对策表的的格式频数分布布表频数分布布表是一一种把分分散和不不规则的的数据,整理成成一个能能顺着其其度量的的尺度,清楚地地显示出出该数据据的集中中趋势和和离散程程度的一一种统计计方法。频数分布布表测定客户户报订教材完全全解读100次订单教材完全全解读订订货频数数分布表表频数分布布表编制制步骤11、从数据据中找出出最小值值S和最大值值L。S =11.45L =12.35频数分布布表编制制步骤22、决定组组数。m =1+3.3lgn当n =100时m=1 +3.3 lg100 =1+ 6.6=7.68频数分布布表编制制步骤33、计算组组距。组距h= = 全

15、距组数L -Sm组距尽尽可能能取为10、5、1、0.5、0.1、0.05组距h= = =0.11250.112.35-11.4580.98频数分布布表编制制步骤44、求界限限值。在划分界界限时,必须明明确端点点的归属属,所以以在决定定组的界界限值时时,可以以从每一一个界限限值上加加上或减减去1/2测量单位位。频数分布布表编制制步骤55、计算组组中值。各组的下下界限值值与上界界限值的的平均值值称为该该组的组组中值。频数分布布表编制制步骤66、统计频频数。落在各组组中的数数据的个个数称为为频数。频数分布布表编制制步骤77、列频数数分布表表。频数直方方图以坐标横横轴表示示组距,坐标纵纵轴表示示频数,

16、所画出出的矩形形图称为为频数直直方图,简称直直方图。订货码洋洋11.40511.50511.60511.70511.80511.90512.00512.10512.20512.30512.405频数直方图在在销售中中应用1、判断分分布类型型客户订货货特性值值的分布布,一般般都是服服从正态态分布或或近似正正态分布布。当客客户订货货特性值值的分布布不具有有正态性性时,往往往是公公司营销销政策不不理想,或教辅辅供应能能力不足足。因而而,由客户订货货特性值所所作的直直方图的的形状,可以推推测营销销政策是是否稳定定,或供供货是否否充足,由此可可对客户户订货作作出初步步判断。根据客客户订货货特性值值的频数

17、数分布,可将直直方图分分为正常常型直方方图和异异常型直直方图两两种类型型。正常型直直方图看直方图图时应着着眼于图图形的整整体形状状,根据据形状判判断它是是正常型型还是异异常型。正常型型直方图图具有“中间高,两边低低,左右右对称”的特征,它的形形状像“山”,字。因因此,根根据客户户订货特特性值的的频数分分布所画画出来的的直方图图是正常常型时,就可初初步判断断为经营营过程是是稳定的的,或供供货能力力是充足足的。不正常直直方图孤岛型直直方图双峰型直直方图折齿型直直方图绝壁型直直方图孤岛型直直方图在主体直直方图的的左侧或或右侧出出现孤立立的小块块,像一一个孤立立的小岛岛。出现现孤岛型型直方图图,说明明

18、有特殊殊事件发发生。造造成原因因可能是是一时供供货发生生变化,或者一一段时间间内出版版商断故故障,或或者短时时间内从从第三方方进货等等。所以以,只要要找出原原因,就就能使直直方图恢恢复到正正常型。双峰型直直方图双峰型直直方图是是指在直直方图中中有左右右两个峰峰,出现现双峰型型直方图图,这是是由于观观测值来来自两个个总体、两种分分布,数数据混在在一起。往往是是由于将将两季教教辅销售售列示在在一起所所造成的的。折齿型直直方图折齿型直直方图形形状凹凸凸相隔,象梳子子折断齿齿一样。出现折折齿型直直方图,多数是是由于备备货不合合理,或或处理数数据时分分组不适适当等原原因造成成。绝壁型直直方图绝壁型直直方

19、图左左右不对对称,并并且其中中一侧像像高山绝绝壁的形形状,当当用剔除除了客户户退货特特性值数数据作直直方图时时,往往往会出现现绝壁型型直方图图。此外外,亦可可能是操操作者的的工作习习惯,习习惯于偏偏标准下下限,于于是出现现左边绝绝壁的直直方图。偏态型直直方图某种原因因使下(上)限限受到限限制时,容易发发生“偏左型”(偏右型型)。平顶型直直方图与双峰型型类似,由于多多个总体体、多种种分布混混在一起起。直方图与与标准比比较对于正常常型直方方图,将将其分布布范围B=S,L(S为一批数数据中的的最小值值,L为一批数数据中的的最大值值)与标准范范围T=SL,Su,SL为标准下下界限,Su为标准上上界限)

20、进行比较较,就可可以看出出订货特特性值的的分布是是否在标标准范围围内,从从而可以以了解销销售过程程是否处处于所希希望的状状态。为为了方便便,可在在直方图图上标出出标准下下界限值值和标准准上界限限值。直方图在在标准范范围内的的情况当教辅供供应特性性值符合合规定标标准时,其对应应的直方方图,必必定在标标准范围围之内。符合规规定的直直方图大大致有下下面四种种类型:TB SL ( S )( L ) SuTB SL ( S ) ( L ) SuTB SL ( S ) ( L ) Su TB SL ( S ) ( L ) Su直方图在在标准范范围内的的情况直方图的的分布范范围B位于标准准范围T内,但有有余

21、量;直方图的的分布中中心与标标准中心心近似重重合,这这是理想想的直方方图。此此时,销销售处于于正常管管理状态态。TB SL ( S )( L ) Su直方图在在标准范范围内的的情况直方图的的分布范范围B位于标准准范围T内,数据据变化仍仍比较集集中,但但分布中中心偏移移标准中中心,并并且直方方图的一一侧已达达到标准准界限, 此时时状态稍稍有变化化,产品品就可能能超出标标准,出出现销量量下滑。因此,需要采采取措施施,使得得分布中中心与标标准中心心重合。TB SL ( S ) ( L ) SuTB SL ( S ) ( L ) Su 直方图在在标准范范围内的的情况直方图的的分布范范围B没有超出出标准

22、范范围T,但没有有余量。此时分分布中心心稍有偏偏移便会会出现跑跑单,所所以应及及时采取取措施,缩小订订货特性性值的分分布范围围。TB SL ( S ) ( L ) Su直方图在在标准范范围内的的情况客户订货货特性值值的分布布非常集集中,致致使直方方图的分分布范围围B与标准范范围T之间的余余量过大大。此时时,可对对客户订订货管理理等适当当放宽要要求,从从而降低低渠道库库存积压压TBSL( S)Su( L)直方图超超出标准准范围内内的情况况客户订货货特性值值的分布布中心向左左(或向右偏离标准准中心,致使直直方图分分布范围围B的下界限限(上界限)超出标准准范围T的下界限限(或上界限限),因而在在下界限限(或上界限限)出现客户户后期从从第三方方进货或或者由于于订数据据不退货货害怕库库存慎重重销售。TB( S)SL( L)Su直方图超超出标准准范围内内的情况况直方图的的分布范范围B超出标准准范围

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论