管理统计第3章_第1页
管理统计第3章_第2页
管理统计第3章_第3页
管理统计第3章_第4页
管理统计第3章_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021-7-4 1 柯柯 华华 2021-7-4 2 本章教学目标:本章教学目标: 度量中心(集中)趋势的指标 度量离散程度(变异性)的指标 度量偏斜程度的指标 度量两种数值变量关系的指标 掌握利用 Office 软件计算各种统计指标 第第3 3章章 统计数据的描述度量统计数据的描述度量 2021-7-4 3 3.1 3.1 度量集中趋势的平均指标度量集中趋势的平均指标 平均指标是说明社会经济现象一般水平平均指标是说明社会经济现象一般水平 的统计指标,反映标志值分布的集中趋势的统计指标,反映标志值分布的集中趋势 平均指标按计算方式可分为数值平均数和平均指标按计算方式可分为数值平均数和 位置平

2、均数两大类位置平均数两大类 2021-7-4 4 是根据总体各单位所有标志值计算出的平均数。 包括算术平均数、几何平均数。 ( (一一) )算术平均数(算术平均数(Arithmetic Mean) 算术平均数的基本公式算术平均数的基本公式 总体单位总数 总体单位标志总量 算术平均数 一一. 数值平均数数值平均数 2021-7-4 5 (1)(1)简单算术平均数简单算术平均数 n i i x n x 1 1 算术平均数的计算算术平均数的计算 n 总体单位总数;xi 第 i 个单位的标志值。 xi 第 i 组的代表值(组中值或该组变量值); f i 第 i 组的频数。 i ii f fx x (2

3、) (2)加权算术平均数加权算术平均数 2021-7-4 6 单项数列单项数列 分组数列分组数列 i ii f fx x i x i f i x 2021-7-4 7 使用使用ExcelExcel函数求加权算术平均数函数求加权算术平均数 利用Excel“数学和三角函数”中的 SUMPRODUCT 函数可以方便地计算出分组数据的 加权算术平均数。 语法规则:语法规则: 格式:SUMPRODUCT(,) 功能:返回两个或多个区域中对应元素乘积之和。 例例:利用比特啤酒公司各销售点分组频数分布数 据,求各销售点的平均销售量。 2021-7-4 8 ( (二二) )几何平均数几何平均数( (Geome

4、tric Mean) ) 当统计资料是各时期的发展速度等前后期的两两 环比数据,要求每时期的平均发展速度时,就需要 使用几何平均数。 几何平均数是 n 个数连续乘积的 n 次方根。 1. 简单几何平均数简单几何平均数 n nG xxxx 21 2. 加权几何平均数加权几何平均数 f f n ff G n xxxx 21 21 f i 各比率出现的频数 2021-7-4 9 例例:某公司原料成本随时间增长的情况如下表 求原料成本的平均年增长率。 解一解一: 1992199319941995 成本200228239.4244.2 年增长率(%)1452 3 02. 105. 114. 1 G x

5、解二解二: 3 200/2 .244 G x 年平均增长率 = 1.0688 - 1 = 6.88% 0688. 1 0688. 1 2021-7-4 10 000,100$X000,50$X000,100$X 321 50% decrease 100% increase 25. 2 ) 1 ()5 .( X %0111)2()50(. 1)1 (1 ()5 .(1( 1)1 ()1 ()1( 2/12/1 2/1 /1 21 n n GRRRR 算术平均数算术平均数: 几何平均数几何平均数: 2021-7-4 11 使用使用ExcelExcel求几何平均数求几何平均数 可以使用Excel统计

6、函数中的GEOMEAN 函数返 回几何平均数 语法规则: 格式:GEOMEAN(,) 功能:返回所有参数中数据的几何平均数。 2021-7-4 12 位置平均数是根据总体标志值所处的特殊位置确定的一 类平均指标。包括中位数和众数两种。 ( (一一) )中位数中位数(Median) 将总体各单位标志值按由小到大的顺序排列后 处于中间位置的标志值称为中位数,记为Me 。 中位数是一种位置平均数,不受极端数据的影响。 当统计资料中含有异常的或极端的数据时,中位数比算 术平均数更具有代表性。 比如有 5 笔付款:9元,10元,10元,11元,60元 付款的均值为 20 元,显然这并不是一个很好的代 表

7、值,而中位数 Me = 10 元则更能代表平均每笔的付款 数。 二二. 位置平均数位置平均数 2021-7-4 13 使用使用ExcelExcel的统计函数返回未分组数据的中位数的统计函数返回未分组数据的中位数 可以使用 Excel 统计函数中的 MEDIAN 函数返回未分组 数据的中位数。 格式:格式:MEDIAN(,2,) ) 功能:功能:返回所有参数中数据的中位数。返回所有参数中数据的中位数。 0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 Median = 5Median = 5 2021-7-4 14 分组数据中位数的确定分组数据

8、中位数的确定 对于分组数据的统计资料,中位数要用插值法来估算。 (1)计算各组的累计频数; (2)确定中位数所在的组 是累计频数首次包含中位数位次f /2的组。 d f Sf LM m m e 1 2 1 其中:L 中位数所在组的下限; Sm-1 中位数所在组前一组的累计频数; fm 中位数所在组的频数; d 中位数所在组的组距。 2021-7-4 15 例例:计算下表数据的中位数 解解:f/2 = 27.5,中位数在“15-25”的组中, 分组 各组频数 累计频数 0-5 2 2 5-15 6 8 15-25 20 28 25-35 15 43 35-45 8 51 45 4 55 d f

9、Sf LM m m e 1 2 1 10 20 85 .27 15 75.24 2021-7-4 16 ( (二二) )众数众数(Mode) 是总体中出现次数最多的标志值,记为M 0。 众数明确反映了数据分布的集中趋势,也是一种 位置平均数,不受极端数据的影响。但并非所有数 据集合都有众数,也可能存在多个众数。 在某些情况下,众数是一个较好的代表值。 例如在服装行业中,生产商、批发商和零售商在 进行生产和存货决策时,更感兴趣的是最普遍的尺 寸而不是平均尺寸。 又如,当要了解大多数家庭的收入状况时,也要 用到众数。 2021-7-4 17 未分组数据众数的确定未分组数据众数的确定 在数据量很大的

10、时候,可以使用 Excel 统计函数 中的 MODE 函数返回众数。 格式:MODE(,) 功能:返回所有参数中数据的众数。 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Mode = 9 2021-7-4 18 分组数据众数的确定分组数据众数的确定 对于分组数据的统计资料,众数也要用插值法来 估算。 (1)确定众数所在的组 对于等距分组,众数组是频数最高的组; (2)使用以下插值公式计算 dLM 21 1 0 其中: L 众数组的下限 1 众数组与前一组的频数之差 2 众数组与后一组的频数之差 d 众数组的组距 1 2 众数 L d 2021-7-4 19 例例:计算

11、下表数据的众数 解:解:众数组是“15-25”的组,则 分组 各组频数 0-5 2 5-15 6 15-25 20 25-35 15 35-45 8 45 4 dLM 21 1 0 10 )1520()620( 620 15 37.22 2021-7-4 20 三三. .算术平均数和位置平均数间的关系算术平均数和位置平均数间的关系 1.频数分布呈完全对 称的单峰分布,算术平 均数、中位数和众数三 者相同 0 x f (Me,M0) X 0 x f MeXM0 0 x f MeXM0 2.频数分布为右偏态 时,众数小于中位数, 算术平均数大于中位数 3.频数分布为左偏态 时,众数大于中位数, 算

12、术平均数小于中位数 2021-7-4 21 补充习题补充习题 补充题:某地区私营企业注册资金分组资料如下, 求该地区私营企业注册资金的平均数、中位数和众平均数、中位数和众 数数。 注册资金 (万元) 50以下 50100 100150 150200 200250 250以上 企业数20354226155 2021-7-4 22 答案答案 注册资金(万元) 企业数 累计企业数组中值 50以下202025 50100355575 1001504297125 15020026123175 20025015138225 250以上5143275 (万元) 6 .123 i ii f fx x (万元)

13、 64.11950 42 555 .71 100 2/ 1 d f Sf LM m m e f/2=143/2=71.5,中位数所在“100150”的组, 众数组为“100150”的组, )( 22.11550 )2642()3542( 3542 100 21 1 0 万元 dLM 2021-7-4 23 四分位数四分位数(Quartile)(Quartile)( (概念要点概念要点) ) 1. 集中趋势的测度值之一集中趋势的测度值之一 2. 排序后处于排序后处于25%25%和和75%75%位置上的值位置上的值 2021-7-4 24 未分组数据四分位数的确定未分组数据四分位数的确定 p 规则

14、规则1 1 如果结果是整数,四分位数等于那个整 数位置的数据。 p 规则规则2 2 如果结果是半数(如2.5,3.5等),四 分位数等于相邻有序数据的平均数。 p 规则规则3 3 如果结果既不是整数又不是半数,结果 取最接近的整数,并选数据。 2021-7-4 25 数值型未分组数据的四分位数数值型未分组数据的四分位数 (7(7个数据的算例个数据的算例) ) 原始数据原始数据: : 23 21 30 32 28 25 26 排排 序序: : 21 23 25 26 28 30 32 位位 置置: : 1 2 3 4 5 6 7 2021-7-4 26 数值型未分组数据的四分位数数值型未分组数据

15、的四分位数 (6(6个数据的算例个数据的算例) ) 原始数据原始数据: : 23 21 30 28 25 26 排排 序序: : 21 23 25 26 28 30 位位 置置: : 1 2 3 4 5 6 2021-7-4 27 ExcelExcel中四分位数的计算过程中四分位数的计算过程 2021-7-4 28 原始数据原始数据: : 23 21 30 28 25 26 排排 序序: : 21 23 25 26 28 30 位位 置置: : 1 2 3 4 5 6 数值型未分组数据的四分位数数值型未分组数据的四分位数 (6(6个数据的算例个数据的算例) ) 2.25 2021-7-4 29

16、 数值型分组数据的四分位数数值型分组数据的四分位数 上四分位数上四分位数: U U U UU i f S N LQ 4 3 L L L LL i f S N LQ 4 下四分位数下四分位数: 2021-7-4 30 Q QL L位置位置50/450/412.512.5 QU位置位置350/437.5 表表 某车间某车间5050名工人日加工零件数分组表名工人日加工零件数分组表 按零件数分组按零件数分组频数(人)频数(人)累积频数累积频数 105105 110110 110110 115115 115115 120120 120120 125125 125125 130130 130130 135

17、135 135135 140140 3 3 5 5 8 8 1414 1010 6 6 4 4 3 3 8 8 1616 3030 4040 4646 5050 合计合计5050 )(81.1175 8 8 4 50 115个 L Q )(75.1285 10 30 4 503 125个 U Q 数值型分组数据的四分位数数值型分组数据的四分位数 2021-7-4 31 五数汇总和箱线图五数汇总和箱线图 Median (Q2) X maximum X minimum Q1Q3 Example: 25% 25% 25% 25% 12 30 45 57 70 2021-7-4 32 右偏右偏 Rig

18、ht-Skewed 左偏左偏 Left-Skewed Symmetric 1 Q 1 Q 1 Q 2 Q 2 Q 2 Q 3 Q 3 Q 3 Q 五数汇总和箱线图五数汇总和箱线图 2021-7-4 33 上次课简要回顾上次课简要回顾 n频数分布表及其他图表类型 n集中趋势的度量指标 n加权算术平均数 n中位数 n众数 n四分位数 n五数汇总 2021-7-4 34 xx 频数 要分析总体的分布规律,仅了解中心趋势指标是不 够的,还需要了解数据的离散程度或差异状况。几个总 体可以有相同的均值,但取值情况却可以相差很大。 变异指标就是用来表示数据离散程度特征的。变 异指标主要有:极差、平均差、标准

19、差、变异系数 和Z值。 3.2 3.2 度量离散程度的指标度量离散程度的指标 2021-7-4 35 【案例案例】道格拉斯公司应如何选择供应商道格拉斯公司应如何选择供应商 道森公司和克拉克公司是道格拉斯公司的两家供货 商。两家供货商都表示大约需要10个工作日交付定货。 下表是两家供应商定货交付时间的历史数据。今后道 格拉斯公司应选择哪家供应商供货? 道森公司:道森公司:克拉克公司:克拉克公司: 交货天数次数交货天数次数 9271 10682 11293 104 113 122 131 2021-7-4 36 一一. .极差极差(Range) 极差也称全距,是一组数据的最大值和最小 值之差,通常

20、记为R。显然,一组数据的差异越 大,其极差也越大。 极差是最简单的变异指标,它广泛应用于产 品质量管理中控制质量的差异,一旦发现超过 控制范围,就采取措施加以纠正,以保证产品 质量的稳定。 但极差有很大的局限性,它仅考虑了两个极 端的数据,没有利用其余数据的信息,因而是 一种比较粗糙的变异指标。 191715131197531 6 5 4 3 2 1 0 S Sa am mp pl le e S Sa am mp pl le e R Ra an ng ge e _ R=2.860 UCL=6.048 LCL=0 R R C Ch ha ar rt t o of f L Le en ng gt

21、th h k R R i 2021-7-4 38 D4 and D3 are from Table (n = 5) 894. 3 7 22. 4.27. 485. 3 k R R i 0)894.3)(0()R(DLCL 232.8)894.3)(114.2()R(DUCL 3 4 2021-7-4 40 UCL = 8.232 0 2 4 6 8 1234567 Day LCL = 0 R = 3.894 _ Conclusion: Variation is in control 2021-7-4 41 二、四分位差二、四分位差 1. 离散程度的测度值之一 2. 也称为内距或四分间距 3.

22、上四分位数与下四分位数之差 Q QD D = = Q QU U - - Q QL L 4. 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性 2021-7-4 42 二、四分位差二、四分位差 Median (Q2) X maximum X minimum Q1Q3 Example: 25% 25% 25% 25% 12 30 45 57 70 Interquartile range = 57 30 = 27 2021-7-4 43 三三.平均差平均差 平均差是各数据与其均值离差绝对值的算术平均 数,通常记为AD。 | 1 XX N DA i . 平均差越大,反映数据间的

23、差异越大。 但由于使用了绝对值,其数学性质很差,因而很 少使用。 2021-7-4 44 四四.方差方差(Variance)和标准差和标准差(Standard Deviation) 方差和标准差是应用得最为广泛的变异指标。标 准差是方差的算术平方根,也称均方差或根方差。 应注意总体方差、标准差与样本方差、标准差是 有区别的。 1.总体方差(Population Variance)和总体标准差 (Population Standard Deviation) 总体方差是各总体数据与其均值差平方的均值, 记为 2,总体标准差记为。 22 )( 1 XX N i 2 )( 1 XX N i 2021-

24、7-4 45 2.2.样本方差与样本标准差样本方差与样本标准差 样本方差记为 S 2,样本标准差记为 S,在推断统 计中,它们分别是总体方差和标准差的优良估计。 2 )( 1 1 XX n S i 其中:n 为样本容量,Xi 为样本观察值 为样本均值。 X 22 )( 1 1 XX n S i 2021-7-4 46 未分组数据方差和标准差的计算未分组数据方差和标准差的计算 方差和标准差的手工计算非常烦琐,只要求掌握以下两 种方法。 使用计算器的统计功能(SD或STAT功能) 使用Excel的统计函数 VARP(,) 功能:返回所有参数中数据的总体方差。 STDEVP(,) 功能:返回所有参数

25、中数据的总体标准差。 VAR(,) 功能:返回所有参数中数据的样本方差。 STDEV(,) 功能:返回所有参数中数据的样本标准差。 2021-7-4 47 分组数据的方差与标准差分组数据的方差与标准差 如果得到的是分组的频数分布数据,则方差与标 准差的公式如下: ,)( 1 22 ii i fXX f ii i fXX f 2 )( 1 ,)( 1 1 22 ii i fXX f S ii i fXX f S 2 )( 1 1 其中 Xi 是第 i 组的组中值或标志值。 2021-7-4 48 变异系数变异系数 () 100% S CV X 在对上海和南京两地居民生活质量调查发现,上 海居民平

26、均月收入1800元,标准差为180元;南京 居民平均月收入1200元,标准差为100元。问两地 居民收入差距哪个更大? 2021-7-4 49 Z Z值值 通常,Z值小于-3.0或大于+3.0时,认为数据中 含有极端值 XX Z S 2021-7-4 50 是非标志的平均数和标准差是非标志的平均数和标准差 在对社会经济现象进行分析时,经常要将总体的 所有单位按是否具有某种属性划分为两组,即“是” 与“非”的两组。 如将学生按性别分组,将产品按合格与否分组。 又如在民意调查中,将被调查者按是否支持某位 侯选人或是否赞成某项政策分为两组等等。 2021-7-4 51 (1)(1)比例的概念比例的概

27、念 比例是指具有某种性质或属性的单位数占总 体全部单位数的比重(也称成数),记为 P。 N1总体中具有某一属性的单位数; N 总体单位总数。 如产品中的次品率; 全部人口或某单位职工中男、女的比率; 某地区全部家庭中高(如月收入10000元)、中、低 (月收入1000元)收入家庭各占的比重等。 N N P 1 2021-7-4 52 (2)(2)比例的平均数比例的平均数 要计算比例的平均数,需要将是非标志的标志表现 进行量化处理。记 1代表具有某种属性的标志表现 0代表不具有该属性的标志表现 N1总体中具有该属性的单位数 N0总体中不具有该属性的单位数 N 总体单位总数 则由加权算术平均数的计算公式,比例的平均数为 i ii p f fx x N NN 01 01 N N1 P 可知,比例的平均数就是其本身比例的平均数就是其本身。 2021-7-4 53 (3)(3)比例的方差和标准差比例的方差和标准差 ,由分组数据方差的计算公式: 2 P 记比例的方差为 i ii P f fxx 2 2 )( N N P N N P 0 2 1 2 )1 ( )1)(1 (PPPP )1 ()1 ( 22 PPPP )1 (PP 成数的标准差: 当 P = 0.5时,成数的标准差达到最大值,即 5 . 05 . 05 . 0 P N NPNP 0 2 1 2 )0()1 ( )1 (PP P

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论