第四章 数据的概括性度量_第1页
第四章 数据的概括性度量_第2页
第四章 数据的概括性度量_第3页
第四章 数据的概括性度量_第4页
第四章 数据的概括性度量_第5页
已阅读5页,还剩139页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 数据的概括性度量 (统计指标) 本章内容 第一节 总量指标 第二节 相对指标 第三节 平均指标(集中趋势度量) 第四节 离散指标(离散程度度量) 2 补充 第一节 总量指标 一、总量指标的概念和作用 二、总量指标的种类 三、国民经济的主要总量指标 3 一、总量指标的概念和作用 1、定义 反映客观现象在一定时间、地点、条件下的总规模或总水平的统计指标。用 绝对数表示。 2、特点 总量指标的大小和总体范围的大小成正比; 总量指标通过相加得到; 只有有限总体才能计算总量指标。 3、总量指标的作用 是认识总体的起点; 是进行经营管理的依据; 是计算相对指标和平均指标的基础。 4 5 6 二、总

2、量指标的种类 7 按反映总体的内容分 按反映的时间状态分 按计量单位分 总体单位总量 总体标志总量 时期总量指标 时点总量指标 实物指标 价值指标 按反映总体的内容 总体单位总量 总体单位数的汇总 总体标志总量 总体各单位数量标志值的汇总 8 一个总量指标是总体标志总量还是总体单位总量不是固定不变的,而是 随着研究目的的不同而变化。 以职工人数为例说明: A、研究全国工业企业的基本情况 B、研究全国工业职工的基本情况 9 A、全国工业企业的基本情况 总体: 全国所有的工业企业 总体单位: 每一个工业企业 这时总体单位总数即为总体单位总量 说明总体单位的标志有许多,工业企业的 职工人数就是一个,

3、将各个企业的职工人 数相加,所得的职工人数之和即为标志总 量。 B、全国工业企业职工基本情况 总体: 所有的职工 总体单位:每一个职工 这时总体单位总量为所有的职工总数 说明总体单位的标志由许多,职工的工资 即为一个,将各个职工的工资额相加,所 得的工资总额即为总体标志总量 举例: 某地区40个工业企业,职工人数为8万人,工业总产值为4.5亿元,在研究工 业企业职工分布和劳动生产率时( ) A.40个企业既是标志总量又是单位总量 B.8万人既是标志总量又是单位总量 C.4.5亿元既是标志总量又是单位总量 D.每个企业的产值既是标志总量又是单位总量 10 目的1:研究工业企业职工分布(平均每个企

4、业有多少人) 总体:所有的工业企业 总体单位:每一个工业企业 单位总量:工业企业总数(40个企业) 标志总量:每一个企业人数的汇总( 8万人) 目的2:研究工业企业的劳动生产率(每一个工人提供的劳动价值为多少 ) 总体:所有的工人 总体单位:每一个工人。 单位总量:工人数的汇总( 8万人) 标志总量:每一个工人创造的产值总和( 4.5亿元) 11 按反映时间状况不同分: 时期指标:反映总体在某一段时期内活动过程的总量指标。 时点指标:反映总体在某一瞬间上状况的总量指标。 12 时期指标和时点指标的区别: 时期指标连续调查得到,时点指标一次性调查得到 时期指标相加有意义,时点指标相加无意义 时期

5、指标的大小受时期长短影响,时点指标的大小则和时间 的长短无关 3、按计量单位不同分 (1)实物指标 表明事物使用价值的指标,采用实物计量单位直接反映事物的自然属性和 特点。 自然单位:人、辆; 度量衡单位:千克、吨 双重单位:千瓦/台; 复合单位:吨公里 (2)价值指标 表明事物价值的总量指标,一般以货币为计量单位进行计量。 现行价; 不变价 13 三、我国国民经济的主要总量指标 总产值:生产资料转移价值加劳动者新创造的价值。 增加值:企业或部门在一定时期内从事生产经营活动所增加的价值。 增加值=总产值-中间投入 国内生产总值(GDP):即各个单位的增加值合计 国民生产总值(国民总收入,GNP

6、或GNI) : 国民总收入=国内生产总值+国外要素收入净额 14 第二节 相对指标 一、相对指标的概念和作用 二、相对指标的种类和计算方法 三、正确运用相对指标的原则 15 一、相对指标的概念和作用 概念 :相对指标是两个有联系的统计指标值对比的比率。 作用: 反映现象的相对水平,表明现象发展的过程和程度; 综合反映现象之间的比例关系或联系程度; 使不能直接对比的事物过渡到可以比较。 16 无名数无名数 有名数有名数 用倍数、系数、成数、等表示 用双重计量单位表示的复名数 相对指标的表现形式 成数应当用整数的形式来表述 3成、近7成 8.6成 分母分母 为为1 分母为分母为 1.00 分母分母

7、 为为10 分母分母 为为100 分母为分母为 1000 人/平方公里元/人 二、相对指标的种类和计算方法 计划完成程度相对指标 结构相对指标 比例相对指标 比较相对指标 强度相对指标 动态相对指标 18 计划完成程度相对指标 1.定义: 指在某一时期某一个指标实际的完成数与计 划完成数的对比关系。 2.计划完成相对数的一般公式 19 %100 计划数 实际完成数 计划完成相对数 3.计划完成相对数的计算 计划数是计划完成相对数的基数 基数可以是绝对数(总量指标)、相对数、也可以是平均数。 具体计算时,在形式上有一定的差异。 20 根据总量指标和平均指标计算 总量指标: 某厂计划完成工业增加值

8、200万元,实际完成220万元,则: 即:超额完成计划的10% )计划规定总量(平均数 )实际完成总量(平均数 21 %110%100 200 220 计划完成相对数 计划完成相对数 平均指标: 某厂产品,计划单位成本为200元,实际耗用180元, 则: 即:超额完成计划的10% %09%100 200 018 数单位成本计划完成相对 根据相对指标计算 例:某厂计划2010年劳动生产率要比上年提高4%,实际提高5%,则 计划规定的百分数 实际达到的百分数 22 %96.100%100 %4%100 %5%100 计划完成相对数 即:超额0.96%完成计划。 计划完成相对数 例:某企业计划产品单

9、位成本比上年降低5%,实际降低6%,则 23 %95.98%100 %5%100 %6%100 计划完成相对数 即:成本降低率比计划多完成1.05%。 4、计划完成程度相对数应注意的问题 分子、分母属于一个总体 分子、分母表现形式不同 分子:实际数时期结束时确定的 分母:计划数事先确定的 分子、分母不能颠倒 以百分数%表现形式 24 结构相对指标 定义 总体内某一部分数值与总体全部数值对比的比值,反映总体内部的构 成和类型特征。 25 %100 总体全部数值 总体部分数值 结构相对数 26 计算: 3、结构相对数应注意的问题 结构相对指标之和等于1或100%; 分子、分母同属于一个总体,但关系

10、不同。表现为总体的一部分同 总体的关系; 分子、分母是不能颠倒的; 用表示。 27 比例相对指标 定义 也称协调相对数,是将总体内某一部分数值与另一部分数值对比得 到的相对数,说明某一现象在同一时期内不同条件下的数量对比关系 。 计算: 在上例中某班男女生比例为3:1。 28 %100 总体中另一部分数值 总体中某部分数值 比例相对数 例:某地区三次产业的GDP(亿元)资料如下: 某地区三次产业的某地区三次产业的GDPGDP(亿元)资料如下:(亿元)资料如下: 三次产业三次产业 第一产业第一产业 第二产业第二产业 第三产业第三产业 合计合计 GDPGDP(亿元)(亿元) 300300 5005

11、00 200200 10001000 29 三次产业的比例关系:第一产业:第二产业:第三产业 300:500:2003:5:21.5:2.5:1 3、比例相对数应注意的问题 分子、分母同属于一个总体; 关系:部分与部分的关系; 分子、分母可以颠倒; 计量单位为百分数、小数或连比的形式如:m:n 或 m:n:l 30 比较相对指标 定义: 不同总体的同一指标值的对比关系;用于反映事物之间的差别程度。 31 %100 另一总体同类指标数值 某一总体某类指标数值 比较相对数 中国国土面积为960万平方公里,美国为937万平方公里,两者之比 为 %45.102%100 937 960 32 3、比较相

12、对数应注意的问题 分子、分母属于两个总体,时间上一致,指标相同; 分子、分母可以颠倒; 数值较小时用表示,数值较大时用倍数表示。 33 强度相对指标 1、定义:它是两个性质不同,但有联系的总量指标的对比,用以表明现象的强 度、密度和普遍程度。 人口密度密集程度 每千人拥有的汽车数发展普及程度 人均GDP发展的强度 用公式表示为: 34 %100 的总量指标数值另一有联系而性质不同 某一总量指标数值 强度相对数 举例 1998年末我国人口密度 2010年末我国人口密度 35 平方公里人 万平方公里 万人 /130 960 124810 133972 140/ 960 万人 人 平方公里 万平方公

13、里 2、注意的问题 分子、分母属于两个总体、且指标不相同; 有些强度相对数的分子、分母可以颠倒; 有具体的计量单位 有的用有名数表示,且为复合名数。 如:人口密度为:人平方公里,人均GDP为:元人 有的用无名称数表示 如:流通费率用表示 有平均的涵义,但不是平均数。(具体区别平均数中介绍。) 强度相对指标的正指标和逆指标 有些强度相对指标的分子、分母可以互换,由此产生正指标和逆指标。 36 流通费用率指标: 流通费用率费用额销售额13.5(或元百元) 表明:每百元销售额所负担的费用额为13.5元。该指标越小越 好,为逆指标。 流通费用率销售额 / 费用额1000(或元百元) 表明:每百元费用额

14、所创造的销售额是1000元。该指标越大 越好,为正指标。 商业网点密度指标: (正)商业网点数(个)人口数(千人) (负)人口数(千人)商业网点数(个) 37 动态相对指标 定义:将总体不同时期的同一类指标对比而 计算的比值。 38 %100 基期水平 报告期水平 动态相对数 报告期:是指所要研究的那个时期; 基期:是指用以对比基础的那个时期。 %117%100 基期水平 报告期水平 动态相对数 39 某市2010年1-3季度工业总产值同比增幅17% 例:某企业2002年工业总产值1000万元,2003年工业总产值1100万元,2004年工 业总产值1200万元。 2004年比2003年工业总

15、产值变动情况如何? 2004年比2002年工业总产值变动情况如何? 2003年比2002年工业总产值变动情况如何? 解: , 40 %110%100 1000 1100 )3( %120%100 1000 1200 )2( %09.109%100 1100 1200 ) 1 ( 即分别增长了9.09%、20和10。 2、注意问题 分子分母不能交换; 分子分母属不同时期(动态); 分子分母属于同一个总体; 计量单位为百分数或小数。 41 三、正确运用相对指标的原则 注意可比性 总量指标和相对指标结合起来使用(例子) 多种相对指标结合使用 42 43 不同时期 比 较 动 态 相对数 强 度 相

16、对数 不同现象 比较 不同总体 比较 比 较 相对数 同一总体中 部分与部分 比 较 部分与总体 比 较 实际与计划 比 较 比 例 相对数 结 构 相对数 计划完成 相对数 同一时期比较 同类现象比较 六种相对指标的对比 甲地区2010年计划GDP为120亿元,年平均人口为600万人,2010年 GDP第一、第二、第三产业情况如下表,又知甲地区2009年GDP为122亿 元,乙地区2010年的GDP为150亿元,试计算所有的相对指标。 项目 计划数 实际数 GDP 120 132 第一 10 12 第二 65 73 第三 45 47 44 经过第三章的整理和显示后,对数据分布的形状和特征有了

17、大致的了解。 为了更加准确的了解数据分布的特征和规律,需要找到反映数据分布特征的 各个代表值。 反映数据分布的特征值有三类: 一类是分布的集中趋势,反映各数据向平均值靠拢的程度。分为:数值平 均数和位置平均数。 一类是分布的离中趋势(离散状况),反映各数据远离平均值的程度。 一类是分布的偏态和峰态,反映数据分布形状。 45 数据分布的特征 第三节 集中趋势的度量 (平均指标) 一、分类数据:众数 二、顺序数据:中位数 三、数值型数据:平均数 四、 众数、中位数和平均数的比较 (位置平均数) (数值平均数) 集中趋势 (CENTRAL TENDENCY) 一组数据向其中心值靠拢的倾向和程度 测度

18、集中趋势就是寻找数据水平的代表值或中心值 不同类型的数据用不同的集中趋势测度值 低层次数据的测度值适用于高层次的测量数据,但高层次数据的测 度值并不适用于低层次的测量数据 48 一、众数(MODE) 一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和数值型数据 众数 (不惟一性) 无众数 原始数据: 10 5 9 12 6 8 一个众数 原始数据: 6 5 9 8 5 5 多于一个众数 原始数据: 25 28 28 36 42 42 (一)分类数据的众数 (例题分析) 饮料品牌饮料品牌频数频数比例比例

19、 百分比百分比 (%) 可口可乐可口可乐 加多宝凉茶加多宝凉茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露 15 11 9 6 9 0.30 0.22 0.18 0.12 0.18 30 22 18 12 18 合计合计501100 解:这里的变量为“饮料品 牌”,这是个分类变量,不 同类型的饮料就是变量值 所调查的50人中,购买可 口可乐的人数最多,为15人 ,占总被调查人数的30%, 因此众数为“可口可乐”这 一品牌,即 Mo可口可乐 (二)顺序数据的众数 (例题分析) 解:这里的数据为顺序数据 。变量为“回答类别” 甲城市中对住房表示不 满意的户数最多,为108户 ,因此众数为“不满意

20、”这 一类别,即 Mo不满意 回答类别回答类别 甲城市甲城市 户数户数 (户户)百分比百分比 (%) 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24 108 93 45 30 8 36 31 15 10 合计合计300100.0 价格(元) 销售量(公斤) 2.00 20 2.40 60 3.00 140 4.00 80 众数为:3.00元 53 众数是数列中出现次数最多的标志值 例如变量数列中的单项式数列 (三)单项式数列中的众数 (四)组距式数列中的众数 先确定众数所在的组,然后用公式计算。 公式分上限公式和下限公式。举例: 54 下限公式: 上限公式: d

21、 ffff ff L 1mm1mm 1mm 21 1 0 dLM d ffff ff U 1mm1mm 1mm 21 2 0 dUM 其中: L 为众数所在组的下限;U 为众数所在组的上限 fm 为众数所在组的频数; fm-1为众数所在组的前一组的频数 fm+1为众数所在组的后一组的频数 55 众数的确定 (组距数列) 【例B】某车间50名工人月产量的资料如下: 月产量(件)月产量(件) 200以下以下 200400 400600 600以上以上 合计合计 工人人数(人)工人人数(人) 3 7 32 8 50 向上累计次数向上累计次数 (人)(人) 3 10 42 50 计算该车间工人月产量的

22、众数。 X f dLM o 21 1 件502200 2425 25 400 o M 众数的原理及应用 VAR 00001 174.0 173.0 172.0 171.0 170.0 169.0 168.0 167.0 166.0 165.0 164.0 163.0 162.0 161.0 160.0 159.0 158.0 157.0 156.0 155.0 154.0 153.0 152.0 14 12 10 8 6 4 2 0 Std. Dev = 4.86 Mean = 163.3 N = 83.00 83名女生身高原始数据名女生身高原始数据 VAR 00001 173.0170.01

23、67.0164.0161.0158.0155.0152.0 30 20 10 0 Std. Dev = 4.86 Mean = 163.3 N = 83.00 83名女生身高组距数列名女生身高组距数列 o M 当数据分布存在明显的集中趋势,且有显著的极端值时,适合使用众数; 当数据分布的集中趋势不明显或存在两个以上分布中心时,不适合使用众数(前者 无众数,后者为双众数或多众数,也等于没有众数)。 众数的原理及应用 二、中位数(MEDIAN) 排序后处于中间位置上的值 不受极端值的影响 主要用于顺序数据,也可用数值型数据,但不能用于分类数据 中位数 (位置和数值的确定) 位置确定 数值确定 (一

24、)顺序数据的中位数 (例题分析) 解:中位数的位置为 (300+1)/2150.5 从累计频数看,中位数在“ 一般”这一组别中 中位数为 Me=一般 回答类别回答类别 甲城市甲城市 户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24 108 93 45 30 24 132 225 270 300 合计合计300 (二)数值型数据的中位数 (9个数据的算例) 【例】 9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 108

25、0 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 中位数 1080 数值型数据的中位数 (10个数据的算例) 【例】:10个家庭的人均月收入数据 排 序: 660 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9 10 (三)单项式数列 先将变量值排序,并将次数进行累计,以确定中 位数的位置。 中位数的位置可用近似公式确定: 举例: 64 2 f 【例8】某企业某日工人的日产量资料如下: 日产量(件)日产量(件) 10 11 12 13 14 合计合计 工人人数(人)工人人数(

26、人) 70 100 380 150 100 800 向上累计次数向上累计次数 (人)(人) 70 170 550 700 800 X f 计算该企业该日全部工人日产量的中位数。 中位数的位次:中位数的位次: 5.400 2 1800 e M 中位数的确定 (单值数列) 下限公式: 上限公式: 66 e e e e M M M Me d f S f LM 1 2 e e e e M M M Me d f S f UM 1 2 (四)组距式数列 A、先将次数进行累计 B、确定中位数所在的组:用 确定 C、计算中位数的近似值 2 f 中位数的确定 (组距式数列) 【例9】某车间50名工人月产量的资料

27、如下: 月产量(件)月产量(件) 200以下以下 200400 400600 600以上以上 合计合计 工人人数(人)工人人数(人) 3 7 32 8 50 向上累计次数向上累计次数 (人)(人) 3 10 42 50 计算该车间工人月产量的中位数。 X f d f S f LM m m e 1 2 件75.493400600 32 10 2 50 400 e M 四分位数 (QUARTILE) 排序后处于25%和75%位置上的值 不受极端值的影响 计算公式 顺序数据的四分位数 (例题分析) 解:QL位置= (300)/4 =75 QU位置 =(3300)/4 =225 从累计频数看, QL在

28、“不 满意”这一组别中; QU在 “一般”这一组别中 四分位数为 QL = 不满意 QU = 一般 回答类别回答类别 甲城市甲城市 户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24 108 93 45 30 24 132 225 270 300 合计合计300 数值型数据的四分位数 (9个数据的算例) 【例】:9个家庭的人均月收入数据(4种方法计算) 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 20

29、00 位 置: 1 2 3 4 5 6 7 8 9 三、平均数(MEAN) 也称为均值 集中趋势的最常用测度值 一组数据的均衡点所在 体现了数据的必然性特征 易受极端值的影响 有简单平均数和加权平均数之分 根据总体数据计算的,称为平均数,记为;根据样本数 据计算的,称为样本平均数,记为x (一)算术平均数 1.简单算术平均数 2.加权算术平均数 72 1、简单算术平均数 (SIMPLE MEAN) 设一组数据为:x1 ,x2 , ,xn (总体数据xN) 样本平均数 总体平均数 2、加权算术平均数 (WEIGHTED MEAN) 设各组的组中值为:M1 ,M2 , ,Mk 相应的频数为: f1

30、 , f2 , ,fk 样本加权平均 总体加权平均 加权平均数 (例题分析) 按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)Mi fi 140150 150160 160170 170180 180190 190200 200210 210220 220230 230240 145 155 165 175 185 195 205 215 225 235 4 9 16 27 20 17 10 8 4 5 580 1395 2640 4725 3700 3315 2050 1720 900 1175 合计合计12022200 算术平均数和强度相对数的区别: 分子分母的关系不同; 算术

31、平均数是在一个总体内标志总量和单位总量的比例关系。分子、分母有一 一对应的关系。 强度相对数的分子和分母是两个不同总体的的总量指标,不存在各个标志值和 各单位之间的一一对应关系。 平均数分子分母不能交换位置,而有的强度相对数分子分母可以交换位置。 76 x f xf 20 1 20 22 4 88 24 6 144 26 8 208 28 12 336 30 10 300 32 7 224 34 2 68 合计 50 1388 元)(76.2750/1388 f xf x 77 计算器使用演示: 用统计功能的计算器计算: 2ndF,ON, 20,M+,22,4,M+,24,6,M+, 26,8

32、,M+,28,12,M+,30,10,M+,3 2,7,M+, 34, 2,M+,xM 结果为27.76 (二)几何平均数 (GEOMETRIC MEAN) n 个变量值乘积的 n 次方根 适用于对比率数据的平均 主要用于计算平均增长率 计算公式为 5. 可看作是平均数的一种变形 简单几何平均数 对于未分组的原始数据,或分组后各变量值出现的次数均相等 。 例:2006-2010年我国工业品的产量分别是上 年的107.6%、102.5%、100.6%、102.7%、 102.2%,计算这5年的平均发展速度。 12 . n nGX XX 79 80 %1 .103031. 1 022. 1027.

33、 1006. 1025. 1076. 1 . 5 21 n n G XXXX 按计算器:1.076,1.025, ,1.006, ,1.027, ,1.022,=,2ndF, x y , 5,= 出现结果:1.0309 即103.1% 【例】一位投资者购持有一种股票,在2007、2008、2009和2010年收益 率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益 率 。 81 几何平均: 【例】某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为 95、92、90、85、80,求整个流水生产线产品的平均合格率。 分析: 设最初投产100A个单位 ,则

34、 第一道工序的合格品为100A0.95; 第二道工序的合格品为(100A0.95)0.92; 第五道工序的合格品为 (100A0.950.920.900.85)0.80; 因该流水线的最终合格品即为第五道工序的合格品, 故该流水线总的合格 品应为 100A0.950.920.900.850.80; 则该流水线产品总的合格率为: 80. 085. 090. 092. 095. 0 100A 80. 085. 090. 092. 00.95100A 总产品 总合格品 即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用 条件,故需采用几何平均法计算。 因该流水线的最终合格品即为第五道

35、工序的合格品, 故该流水线总的合格 品应为 100A0.950.920.900.850.80; 则该流水线产品总的合格率为: 80. 085. 090. 092. 095. 0 100A 80. 085. 090. 092. 00.95100A 总产品 总合格品 即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用 条件,故需采用几何平均法计算。 5 5 0.950.920.900.850.80 0.534988.24 G 解: 思考 若上题中不是由五道连续作业的工序组成的流水生产线,而是五个独立作业 的车间,且各车间的合格率同前,又假定各车间的产量相等均为100件,求 该企业的

36、平均合格率。 几何平均数的计算方法 因各车间彼此独立作业,所以有 第一车间的合格品为:1000.95; 第二车间的合格品为:1000.92; 第五车间的合格品为:1000.80。 则该企业全部合格品应为各车间合格品的总和,即 总合格品=1000.95+1000.80 几何平均数的计算方法 分析: 不再符合几何平均数的适用条件,需按照求解比值的平均数的方法计算。 又因为 4.88 500 442 100100 10080.010095.0 f Xf X f m X 产品 合格品 合格率 应采用加权算术平均数公式计算,即 加权几何平均数 对于分组且各组变量值出现的次数(权数)不 相等。 88 12

37、 12 . n f n fff G xxx 例:某地区25年的年经济增长速度分别是:1年3%,4年5%,8年8%,10年 10%,2年15%, 求该地区经济的平均年增长速度。 89 1.03,(,1.05,yx,4,),(,1.08,yx,8,), ,(,1.1,yx,10,),(,1.15,yx,2,), =,2ndF, x y , 25,= 出现结果:1.086 即平均增长速度为8.6% %6 .108086. 1 15. 1 2 1 . 1 10 08. 1 8 05. 1 4 03. 1 . 2 2 1 1 25 f x f n n x f x f XG 使用几何平均法应注意问题 第一

38、、变量值要是相对数,且不能为负值或零。 第二、这些相对数的连乘积要等于总速度或总比率。 总结: 几何平均法是计算平均速度或平均比率最适用的一种 方法,凡变量值的连乘积等于总速度或总比率,求其 平均速度和平均比率时,均可用几何平均法。 90 (三)调和平均数 又称倒数平均数,是各单位标志值倒数的算术 平均数的倒数。 分为简单和加权调和平均数。 91 1、简单调和平均数 N i i X N H 1 1 92 2、加权调和平均数 X m m H 例1:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤。 现早、中、晚各买1斤,求平均价格。 例2:某种蔬菜价格早上为0.5元/斤、

39、中午为0.4元/斤、晚上为0.25元/斤。 现早、中、晚各买1元,求平均价格。 93 在例1中,用简单算术平均数 元38. 0 3 25. 04 . 05 . 0 n x x 94 在例2中先求早、中、晚购买的斤数。 早 1/0.5=2(斤) 中 1/0.4=2.5(斤)、 晚 1/0.25=4(斤) 95 元35. 0 5 . 8 3 25. 0 1 4 . 0 1 5 . 0 1 111 Hx 将例2用公式表示为: X n H 1 这就是简单调和平均数的公式。 例3:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为0.25元/斤 。现早、中、晚各买2元、3元、4元,求平均价格。

40、96 元33. 0 5 .27 9 25. 0 4 4 . 0 3 5 . 0 2 432 H X 求解比值的平均数的方法 由于比值(平均数或相对数)不能直接相加,求解比值的平均数时,需将 其还原为构成比值的分子、分母原值总计进行对比 设比值设比值 i i i f m X 则有:则有:mi X m ffXm i i iiii ,2, 1, m X m f Xf f m X 1 求解比值的平均数的方法 己知 ,采用基 本平均数公式 fm、 己知 ,采用加 权算术平均数公式 fX、 己知 ,采用加 权调和平均数公式 mX、 i i i f m X 【例】某季度某工业公司18个工业企业产值计划完成情

41、况如下: 计算该公司该季度的平均计划完成程度。 求解比值的平均数的方法 【例】某季度某工业公司18个工业企业产值计划完成情况如下: 计算该公司该季度的平均计划完成程度。 求解比值的平均数的方法 f m X 计划产值 实际产值 程度 计划完成 分析:分析: X f 应采用加权算术平均数公式计算 12.105 24900 26175 4400800 440015. 180085. 0 f Xf X 【例】某季度某工业公司18个工业企业产值计划完成情况如下(按计划完成程度分 组): 计算该公司该季度的平均计划完成程度。 求解比值的平均数的方法 【例】某季度某工业公司18个工业企业产值计划完成情况如下

42、(按计划完成程度分 组): 计算该公司该季度的平均计划完成程度。 求解比值的平均数的方法 f m X 计划产值 实际产值 程度 计划完成 分析:分析: f m 应采用平均数的基本公式计算 12.105 24900 26175 f m X 众数、中位数和平均数的关系 众数、中位数、平均数的关系特应 众数 不受极端值影响 具有不惟一性 数据分布偏斜程度较大且有明显峰值时应用 中位数 不受极端值影响 数据分布偏斜程度较大时应用 平均数 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用 第四节 离散程度的度量 (离散指标) 一、分类数据:异众比率 二、顺序数据:四分位差 三、数值型数据:

43、方差和标准差 四、相对离散程度:离散系数 离中趋势 数据分布的另一个重要特征 反映各变量值远离其中心值的程度(离散程度) 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值 106 一、异众比率 (VARIATION RATIO) 1.对分类数据离散程度的测度 2.非众数组的频数占总频数的比例 3.计算公式为 4. 用于衡量众数的代表性 异众比率 (例题分析) 饮料品牌饮料品牌频数频数比例比例 百分比百分比 (%) 可口可乐可口可乐 加多宝凉茶加多宝凉茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露 15 11 9 6 9 0.30 0.22 0.18 0.12

44、0.18 30 22 18 12 18 合计合计501100 二、四分位差 (QUARTILE DEVIATION) 对顺序数据离散程度的测度 也称为内距或四分间距 上四分位数与下四分位数之差 Qd = QU QL 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性 四分位差 (例题分析) 解:设非常不满意为1,不满 意为2, 一般为3, 满意为 4, 非常满意为5 。 已知 QL = 不满意 = 2 QU = 一般 = 3 四分位差为 Qd = QU - QL = 3 2 = 1 回答类别回答类别 甲城市甲城市 户数户数 (户户)累计频数累计频数 非常不满意非常不满意

45、不满意不满意 一般一般 满意满意 非常满意非常满意 24 108 93 45 30 24 132 225 270 300 合计合计300 三、数值型数据:方差和标准差 (一)极差(RANGE) 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布 计算公式为 R = max(xi) - min(xi) (二)平均差 (MEAN DEVIATION) 各变量值与其平均数离差绝对值的平均数 能全面反映一组数据的离散程度 数学性质较差,实际中应用较少 计算公式为 未分组数据 组距分组数据 平均差 (例题分析) 按销售量分组按销售量分组组中值组中值(Mi)频数频数(f

46、i) 140150 150 160 160 170 170 180 180 190 190 200 200 210 210 220 220 230 230 240 145 155 165 175 185 195 205 215 225 235 4 9 16 27 20 17 10 8 4 5 40 30 20 10 0 10 20 30 40 50 160 270 320 270 0 170 200 240 160 250 合计合计1202040 fxxxx 平均差 (例题分析) 含义:每一天的销售量平均数相比, 平均相差17台 (三)方差和标准差 (VARIANCE AND STANDARD

47、 DEVIATION) 数据离散程度的最常用测度值 反映了各变量值与均值的平均差异 根据总体数据计算的,称为总体方差(标准差),记为 2();根据样本数据计算的,称为样本方差(标准差) ,记为s2(s) 样本方差和标准差 (SAMPLE VARIANCE AND STANDARD DEVIATION) 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式标准差的计算公式 注意:注意: 样本方差用自样本方差用自 由度由度n-1去除去除! 自由度 (DEGREE OF FREEDOM) 自由度是指数据个数与附加给独立的观测值的约束或限 制的个数之差 从字面涵义来看,自由度是指一组数据

48、中可以自由取值 的个数 当样本数据的个数为n时,若样本平均数确定后,则附 加给n个观测值的约束个数就是1个,因此只有n-1个数 据可以自由取值,其中必有一个数据不能自由取值 按着这一逻辑,如果对n个观测值附加的约束个数为k 个,自由度则为n-k 自由度 (DEGREE OF FREEDOM) 样本有3个数值,即x1=2,x2=4,x3=9,则 x = 5。 当 x = 5 确定后,x1,x2和x3有两个数据可以自由取 值,另一个则不能自由取值,比如x1=6,x2=7,那么x3 则必然取2,而不能取其他值 为什么样本方差的自由度为什么是n-1呢?因为在计算离 差平方和时,必须先求出样本均值x ,

49、而x则是附件 给离差平方和的一个约束,因此,计算离差平方和时只 有n-1个独立的观测值,而不是n个 样本方差用自由度去除,其原因可从多方面解释,从实 际应用角度看,在抽样估计中,当用样本方差s2去估计 总体方差2时,它是2的无偏估计量 样本标准差 (例题分析) 按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi) 140150 150 160 160 170 170 180 180 190 190 200 200 210 210 220 220 230 230 240 145 155 165 175 185 195 205 215 225 235 4 9 16 27 20 17 10

50、8 4 5 40 30 20 10 0 10 20 30 40 50 160 270 320 270 0 170 200 240 160 250 合计合计12055400 2 )(xM i ii fxM 2 )( 样本标准差 (例题分析) 含义:每一天的销售量与平均数相比, 平均相差21.58台 总体方差和标准差 (POPULATION VARIANCE AND STANDARD DEVIATION) 未分组数据 组距分组数据 未分组数据 组距分组数据 方差的计算公式标准差的计算公式 计算器的使用 开机:ON,2ndF,ON 进入到统计功能后,用计算平均数的方法输数据 所有的数据输完后,按 2

51、ndF 键, 再按RM 健,即为标准差 123 注意:所有的数据输完后,如果直接 按xM 健,即为平均数。 四、相对离散程度:离散系数 离散系数 (COEFFICIENT OF VARIATION) 标准差与其相应的均值之比 对数据相对离散程度的测度 消除了数据水平高低和计量单位的影响 用于对不同组别数据离散程度的比较 计算公式为 例一:两组动物体重(单位:kg) 甲: , , 乙:, 试比较平均数的代表性。 平均数为: 126 3() x x n 甲kg 210 x x n 乙(kg) 127 2 222 ) (23)(33)(34) 0.816 3 xx n 甲 ( kg 2 222 ) (200210)(210210)(220210) 8.16 3 xx n 乙 ( kg .210 xx乙 乙甲甲 因为,所以kg的代表性好于kg的代表性。 数列性质不同(水平高低不等或者计量单位不同),不能直 接用标准差(或平均差)来比较平均数的代表。 这种情况下,要比较平均数的代表性 的大小(即数列的离散程度),必须用 相对离散程度指标 离散系数。 128 上述结论不一定正确! 对于例一 129 %

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论