箱线图数据分布分析_第1页
箱线图数据分布分析_第2页
箱线图数据分布分析_第3页
箱线图数据分布分析_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、-. z.E*cel-箱线图数据分布分析标签:e*cel数据分析六西格玛箱线图数据分布2014-01-18 11:13 25396人阅读HYPERLINK l ments评论(0) 收藏HYPERLINK l report o 举报举报分类:E*cel14分析9声明:本文为博主原创文章,未经博主允许不得。目录()+本文摘自作者数据分析:数据驱动的管理、优化和运营:item.jd./11295690.html箱线图Bo*plot也称箱须图Bo*-whisker Plot,它是用一组数据中的最小值、第一四分位数、中位数、第三四分位数和最大值来反映数据分布的中心位置和散布围,可以粗略地看出数据是否具

2、有对称性。通过将多组数据的箱线图画在同一坐标上,则可以清晰地显示各组数据的分布差异,为发现问题、改良流程提供线索。1什么是四分位数箱线图需要用到统计学的四分位数Quartile的概念,所谓四分位数,就是把组中所有数据由小到大排列并分成四等份,处于三个分割点位置的数字就是四分位数。第一四分位数Q1,又称较小四分位数或下四分位数,等于该样本中所有数值由小到大排列后第25%的数字。第二四分位数Q2,又称中位数,等于该样本中所有数值由小到大排列后第50%的数字。第三四分位数Q3,又称较大四分位数或上四分位数,等于该样本中所有数值由小到大排列后第75%的数字。第三四分位数与第一四分位数的差距又称四分位间

3、距InterQuartile Range,IQR。计算四分位数首先要确定Q1、Q2、Q3的位置n表示数字的总个数:Q1的位置=n+1/4Q2的位置=n+1/2Q3的位置=3n+1/4对于数字个数为奇数的,其四分位数比拟容易确定。例如,数字5、47、48、15、42、41、7、39、45、40、35共有11项,由小到大排列的结果为5、7、15、35、39、40、41、42、45、47、48,计算结果如下:Q1的位置=11+1/4=3,该位置的数字是15。Q2的位置=11+1/2=6,该位置的数字是40。Q3的位置=311+1/4=9,该位置的数字是45。而对于数字个数为偶数的,其四分位数确定起来

4、稍微繁琐一点。例如,数字8、17、38、39、42、44共有6项,位置计算结果如下:Q1的位置=6+1/4=1.75Q2的位置=6+1/2=3.5Q3的位置=36+1/4=5.25这时的数字以数据连续为前提,由所确定位置的前后两个数字共同确定。例如,Q2的位置为3.5,则由第3个数字38和第4个数字39共同确定,计算方法是:38+39-383.5的小数局部,即38+10.5=38.5。该结果实际上是38和39的平均数。同理,Q1、Q3的计算结果如下:Q1 = 8+17-80.75=14.75Q3 = 42+44-420.25=42.5E*cel为计算四分位数提供了QUARTILE(array,

5、quart)函数,其中array参数用于指定要计算四分位数值的数组或数值型单元格区域,quart指定返回哪一个四分位值,可用值如下:0,返回最小值;1,返回第一个四分位数;2,返回第二个四分位数,即中位数;3,返回第三个四分位数;4,返回最大值。2箱线图的构造箱线图包括一个矩形箱体和上下两条竖线,箱体表示数据的集中围,上下两条竖线分别表示数据向上和向下的延伸围,构造如图9-51所示。图9-51箱线图的构造四分位间距框的顶部线条是第三四分位数的位置,即Q3,表示有75%的数据小于等于此值。底部线条是第一四分位数的位置,即Q1,表示有25%的数据小于此值。则整个四分位间距框所代表的是数据集中50%

6、即75%-25%的数据,四分位间距框的高度就是这些数据涉及的围,能够表现出数据的集中程度。Q2是数据中位数的位置。Whisker上限是延伸至距框顶部1.5倍框高围的最大数据点,Whisker下限是延伸至距框底部1.5倍框高围的最小数据点,超出Whisker上限或下限的数值将使用星号*表示。但是,在E*cel中绘制箱线图需要借助股价图来实现,因此无法展现异常值,Whisker上限将延伸至数据最大值的位置,Whisker下限将延伸至数据最小值的位置。3绘制箱线图图9-52中的A2:F8区域和H2:M8区域分别是华北和华南是*段时间客户订单收货天数的统计结果,C11:C15和J11:J15是利用QU

7、ARTILE函数计算的华北、华南收货天数的四分位数结果。图9-52收货天数的四分位数计算结果在E*cel中绘制箱线图需要借助股价图的开盘-盘高-盘底-收盘图来实现。根据E*cel绘图时放置数据系列的位置,开盘、盘高、盘底、收盘应分别对应Q1、Q0、Q2、Q4。下面是绘图步骤:准备图表数据。根据对应关系,在表格的B18:E18区域分别输入华北客户的Q1、Q0、Q2、Q4统计数字,将Q3输入到最后的F18单元格中,在A18中输入一个日期型数据注意,必须为日期型,如2013/1/1。然后在第19行中输入华南客户的数据,A19中的日期递增1天,最终结果如图9-53所示。图9-53准备图表数据插入图表。

8、选定A18:E19区域,在插入功能区的图表模块中单击其他图表,选择股价图局部的开盘-盘高-盘底-收盘图按钮,即可看到绘制的股价图,如图9-54所示。图9-54插入股价图添加Q3数据系列。由图9-54可以看出,四分位间距框的顶部线条使用的是Q4最大值位置,而是不是箱线图要求的Q3位置。右击绘图区,在弹出的快捷菜单中选择选择数据命令,翻开选择数据源对话框。单击添加按钮翻开编辑数据系列对话框,在系列名称折叠框中输入Q3,在系列值折叠框中选择F18:F19区域,单击确定按钮即可看到股价图变成了箱线图,如图9-55所示。四分位间距框的高度小了很多,单击顶部线条与Whisker上限交汇处,可以看到使用的是

9、Q3数据。图9-55 添加Q3数据系列显示中位数线。至此,四分位间距框虽然已经绘制正确了,但是还缺少中位数线,即Q2。选择图例中的系列3标签,然后单击鼠标右键,在弹出的快捷菜单中选择设置数据系列格式命令,翻开设置数据系列格式对话框。在数据标记选项中将标记类型设置为置的-形状,单击关闭按钮即可看到中位线显示了出来,如图9-56所示。图9-56显示中位数线美化图表。首先要修改分类轴横轴标签,由于插入股价图时的限制在A18和A19单元格中输入了日期型数据,但是在图表插入后,可以将其修改为其他数据类型的值,因此在A18和A19单元格分别输入华北、华南。其次是删除图例栏,对于箱线图而言这并不需要。最后,可以为图表添加

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论