统计42平均与变异指标.ppt_第1页
统计42平均与变异指标.ppt_第2页
统计42平均与变异指标.ppt_第3页
统计42平均与变异指标.ppt_第4页
统计42平均与变异指标.ppt_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/5/19,扬州大学管理学院,1,概念:反映社会经济现象总体各单位某一数量标志在一定时间、地点条件下所达到的一般水平。,特点: 平均指标将总体内各单位的差异抽象化了。 平 均指标是一个代表值,代表总体综合数量 特征的一 般水平。,一、平均指标的意义,第三节平均指标,2019/5/19,扬州大学管理学院,2,作用:,1、反映总体各单位变量分布的集中趋势 或集中程度; 2、比较同类现象在不同单位的发展水平, 用来说明生产水平、经济效益或工作质量的 差距; 3、分析现象之间的依存关系。 应用平均指标的基本要求是:只能对同质 总体计算平均指标。,2019/5/19,扬州大学管理学院,3,二、平均指标的种类及其计算 种类:,按反映的时间状况不同,按平均指标计 算方法不同,位置平均数,算术平均数 调和平均数 几何平均数,数值平均数,众数 中位数,静态平均指标(本节讲述),动态平均指标(下章讲述),2019/5/19,扬州大学管理学院,4,(一)算 术 平 均 数 (Arithmetic Mean),算术平均数,1、算术平均数的基本公式,用此公式计算算术平均数,必须注意分子与分母 之间存在的内在经济联系。即分子是分母所具有的标 志值。注意强度相对指标和平均指标的区别: 某企业职工月平均工资1200元/人月(平均指标); 某城市的月人均收入为570元/人月(强度相对数).,如:,2019/5/19,扬州大学管理学院,5,区别主要表现在以下两点: ()指标的含义不同。强度相对指标说明某一现象在另一现象中发展的强度、密度或普遍程度;而平均指标说明的是现象发展的一般水平。 ()计算方法不同。强度相对指标分子与分母的联系,只表现为一种经济关系,而平均指标是在一个同质总体内标志总量和单位总量的比例关系。分子与分母是内在的一一对应的联系,即分子是分母(总体单位)所具有的标志,对比结果是对总体各单位标志值的平均。,2019/5/19,扬州大学管理学院,6,2、算术平均数 的计算形式,(1)简单算术平均数:,例如:已知5名工人的工资为:600元、780元、1050元、 1100元、900元。根据资料计算五名工人的平均工资:,解:设工人的工资为 “ ”, i= 1、2、3、4、5,则工人的 平均工资为:,(适用于未分组资料),2019/5/19,扬州大学管理学院,7,切尾均值,72,99,90,97,93,81,82,75,3,去掉一个最高分,3号参赛选手的最终得分是86.33分。”,2019/5/19,扬州大学管理学院,8,(2)加权算术平均数: 适用于分组资料。,计算公式:,公式中:“X” 代表各组变量值 “f” 代表各组变量值出现的次数或频数 “”为合计符号,根据分组资料计算算术平均数,平均数的大小不仅受到各组变量值大小的影响,而且受到各个变量值出现次数多少的影响,因此需用下式计算其平均数:,2019/5/19,扬州大学管理学院,9,因为各组变量值出现次数的多少对平均 数的形成产生权衡轻重的作用,所以将“f”称 为权数。权数即可以表现为“次数”的形式, 也可以表现为“比重”的形式。,用“比重”权数计算算术平均数的公式为:,计算公式:, ,2019/5/19,扬州大学管理学院,10,A、根据单项式数列计算算术平均数,例:某企业工人按日产量分组资料如下:,要求:根据资料计算工人的平均日产量。,2019/5/19,扬州大学管理学院,11,A、根据单项式数列计算算术平均数,解:按第一个公式计算,按第二个公式计算:,扬州大学管理学院,12,B、根据组距数列计算算术平均数,要求:根据资料计算全部职工的平均工资。,例:某企业职工按工资分组资料如下:,2019/5/19,扬州大学管理学院,13,解:计算过程如下:,平均工资:,根据组距数列计算算术平均数,2019/5/19,扬州大学管理学院,14,两个班组工人生产资料如下:根据资料分别计算两个班组工人的平均日产量。,C、权数在平均数形成中起的作用,2019/5/19,扬州大学管理学院,15,计算得到:,一班工人平均日产量,二班工人平均日产量,2019/5/19,扬州大学管理学院,16,D、权数的选择,当分组的标志为相对数或平均数时,经常会 遇到选择哪一个条件为权数的问题。如下例:,要求:计算全部企业的平均计划完成程度。,2019/5/19,扬州大学管理学院,17,D、权数的选择,选择权数的原则:,1、变量与权数的乘积必须有实际经济意义。,2、依据相对数或平均数本身的计算方法来选择权数。,根据原则本题应选计划产值为权数,计算如下:,平均计划完成程度:,2019/5/19,扬州大学管理学院,18,(3)简单算术平均数与加权算术平均数的关系,权数起作用必须有两个条件:,一是:各组标志值必须有差异。如果各组标志值没有差异 标志值成为常数,也就不存在权数了。,二是:各组的次数或比重必须有差异。如果各组次数或比 重没有差异,意味着各组权数相等,权数成为常数,则不 能起到权衡轻重的作用,这时加权算术平均数就等于简单 算术平均数。,用公式表示二者的关系:,当:,2019/5/19,扬州大学管理学院,19,(4)算术平均数的数学性质: 1、算术平均数与变量值个数的乘积等于各个变量值的总和。 2、各个变量值与算术平均数的离差的总和为零。 3、各个变量值与算术平均数的离差的平方之和为最小。,2019/5/19,扬州大学管理学院,20,4、两个独立的同性质变量代数和的平均数等于各变量平均数的代数和;其乘积的平均数等于各变量平均数的乘积。 5、各个变量值加或减一个任意数A,则算术平均数也增加或减少该数A 6、各个变量值乘或除以一个任意数A,则算术平均数也乘或除以该数A,2019/5/19,扬州大学管理学院,21,利用平均数的性质作简化运算,2019/5/19,扬州大学管理学院,22,优点: 容易理解, 便于计算 灵敏度高 稳定性好 缺点: 易受极端值影响 在偏斜分布和U形分布中,不具代表性,5、算术平均数的特点,2019/5/19,扬州大学管理学院,23,调 和 平 均 数 的 计 算 方 法,(1)简单调和平均数,(2)加权调和平均数,(二)调和平均数(Harmonic Mean ),调和平均数是各个标志值倒数的算术平均数的倒数,所以又称倒数平均数。,加权调和平均数作为加权算术平均数的变形使用,仍 然依据算术平均数的基本公式计算。,2019/5/19,扬州大学管理学院,24,调和平均数举例,2.50 元/kg,2.00元/kg,1.00元/kg,我各买1元的吃,2019/5/19,扬州大学管理学院,25,苹果价格及购买情况表,求平均价格,2019/5/19,扬州大学管理学院,26,体会含义并进行比较,某种水产品早中晚价格各不相同,分别为3元/kg 、2元/kg和1元/kg (1)消费者早中晚各买一公斤时; (2)消费者早中晚各买一元时; 请计算两种情况下,消费者购买这种水产品的平均价格(元/kg),加权算术平均,加权调和平均,2019/5/19,扬州大学管理学院,27,调和平均数举例,苹果价格及购买情况表,购买数量,2019/5/19,扬州大学管理学院,28,某工业局下属各企业按产值计划完成程度分组资料如下, 根据资料计算该工业局产值平均计划完成程度:,平均计划完成程度,= 101.52%,例 题,m,说明:该工业局实际比计划多完成6万元,超额1.52% 完成产值计划任务。,计划产值,2019/5/19,扬州大学管理学院,29,某车间各班组工人劳动生产率和实际产量资料如下:,例 题,要求:计算五个班组工人的平均劳动生产率。,x,m,解:平均劳动生产率为:,(总工时),2019/5/19,扬州大学管理学院,30, 当m=xf时: 加权调和平均数公式就变成加权算术平均数公式,结论是:调和平均与算术平均的计算只是由于资料不同而出现的差异,其经济含义完全一致.,注意,2019/5/19,扬州大学管理学院,31,优点: 灵敏度高 在某种不能计算算术平均数的条件 下,可以用调和平均数代替 。 缺点: 不易理解 易受极端值影响 有“0”值时不能计算,调和平均数的特点,2019/5/19,扬州大学管理学院,32,几何平均数:是另一种计算平均标志值的平均数。 也可区分为简单几何平均数和加权几何平均数。 简单几何平均数就是n个变量值(Xi)连乘积的n 次方根。,(三) 几何平均数(Geometric Mean),为了计算方便,通常利用对数进行计算:,Log =(LogX1+LogX2+LogX3 +LogXn)/ n =(LogXi)/ n,2019/5/19,扬州大学管理学院,33,例如:某企业生产一产品,要经过三个连续作业的车间,各车间的产品合格率如下表所示:试计算各车间产品的平均合格率。,XG =Xi = 95%95.8% 93% = 94.58%,n,3,2019/5/19,扬州大学管理学院,34,Log XG =(LogXi)/ n = 5.9276/3 = 1.9758,还可以按对数方法计算如下:,所以,车间产品合格率为94.58%,加权几何平均数:,XG =X1X2X3 Xn = Xi,f,f,f3,f1,f2,fn,fi,同样可以用对数计算: f1LogX1+f2LogX2+f3LogX3+ +fnLogXn fiLogXi,f1+f2+f3+ +fn fi,=,LogXG =,2019/5/19,扬州大学管理学院,35,几何平均数的特点,优点: 灵敏度高 受极端值的影响相对较小 对于等比或近似等比的数列几何平均 数比算术平均数更具代表性。 缺点: 不易理解 有“0”值时不能计算,2019/5/19,扬州大学管理学院,36,数值平均数之间的关系:XXGXH 以两个变量来证明: (ab) = a 2ab + b 0 a + b 2ab + 4ab 4ab (a+b) 4ab (a+b) 2 ab (a+b)/ 2 ab, 分别令 a=X1,b=X2 , 即得 XXG, 代入 a=1/X1,b=1/X2,即可得 XGXH,2019/5/19,扬州大学管理学院,37,(四) 众 数 (Mode),众数是现象总体中出现次数最多的标志值。,它反映了现象的一种集中趋势,众 数 的 确 定 方 法,(1)由未分组数列及单项数列确定众数,数列中出现次数最多的变量值就是众数。 例如:十个同学的英语成绩:55 63 65 70 78 78 78 82 87 91。则众数为78分。 也有可能没有众数或有多个众数的情况。,2019/5/19,扬州大学管理学院,38,某鞋厂某种鞋市场需求调查情况,众数MO 24 结论:根据定义确定单项式数列的众数,单项式数列确定众数,2019/5/19,扬州大学管理学院,39,(2)由组距数列确定众数,步骤: 找出众数所在的组,即次数出现最多的一组的分组区间。即众数组可以直接观察确定。 根据下列的公式计算众数,2019/5/19,扬州大学管理学院,40,计算公式,其中:MO为众数,U、L分别为众数组上、下限,fm、fm-1、fm+1分别为众数组次数、众数组前一组次数及众数组后一组次数;d为组距,2019/5/19,扬州大学管理学院,41,某班成绩分布表,组距数列确定众数,(分),(分),2019/5/19,扬州大学管理学院,42,众数是一种位置平均数,不受各项变量值的影响,用它作为平均水平的代表值有不足之处,但当数列中出现异常变量值时,它不受极端值的影响,比平均数的代表性好。一般只适用于分布的次数较多且具有明显的集中趋势的总体。 众数不一定存在 无众数 存在时也不一定是唯一的 只有一个众数的分布 单峰分布 有两个众数的分布 双峰分布,结论,2019/5/19,扬州大学管理学院,43,Mo,Mo,Mo,Mo,2019/5/19,扬州大学管理学院,44,将总体中各单位的标志值按大小顺序排列,处于数列中点位置的标志值就是中位数。,中 位 数 的 计 算 方 法,(1)根据未分组资 料计算中位数,步骤:将资料按大小顺序排列,计算中位数的位次:,确定中位数,(五) 中 位 数(Median),例:五(六)位同学的统计学成绩为 53 68 78 (82) 85 93,则中位数为 78,资料为奇数位时中位数即为中间位置的变量值;为偶数时中位数即为中间两个变量值的平均数 80。,2019/5/19,扬州大学管理学院,45,根据定义:中位数所在位置(1+125)/2=63 中位数为 2 套,例:某省所有工业企业生产流水线拥有情况:,(2)根 据 单 项 数列计算中位数,步骤:计算数列的中间位置点:,计算累计次数找出中位数所在的组,确定中位数,2019/5/19,扬州大学管理学院,46,(3)根据组距数列计算中位数,步骤: 计算数列的中间位置点:,计算累计次数,找出中位数所 在的分组,用公式计算中位数,2019/5/19,扬州大学管理学院,47,式中: L 表示中位数组的下限 U 表示中位数组的上限 fm 表示中位数所在组的次数 Sm-1 表示中位数所在组以前各组的向上累计次数 Sm+1 表示中位数所在组以后各组的向下累计次数 f 表示总次数 d 表示中位数所在组的组距。,下限公式,上限公式,2019/5/19,扬州大学管理学院,48,例:某班成绩分布表,注意:单位为(分),2019/5/19,扬州大学管理学院,49,位置平均数与算术平均数的关系,(对称分布),正(右)偏态分布,负(左)偏态分布,2019/5/19,扬州大学管理学院,50,三种平均数的差别大小与偏斜程度的大小 呈正比例。这是由于各自受极端值的影响 不同。算术平均数受其影响最大;中位数 只受其位置影响,不受其数值大小影响; 众数都不受其影响。所以算术平均数或大 于众数,或小于众数,中位数总位于两者 之间。如上图。需要指出的是,有时中位 数实际的数字并不在其他两者之间。,2019/5/19,扬州大学管理学院,51,在偏斜适度(轻微)时,可用英国统计学家卡尔皮尔逊(Karl Pearson)提出的以下经验公式:算术平均数到众数的距离约等于算术平均数到中位数距离的三倍。,2019/5/19,扬州大学管理学院,52,应用平均指标计算和分析社会经济现象应注意以下原则: 必须注意现象总体的同质性。消除不同质的“虚假平均数”。 要用组平均数来说明总平均数 有些情况下,只计算总平均数不足以反映问题,要对总体内部进行分组,通过组平均数来补充。如下例: 要用分配数列来补充说明总平均数,2019/5/19,扬州大学管理学院,53,通过上例可以看出:从总平均数看甲村的总单产530公斤/亩,乙村440公斤/亩,结论是甲村的粮食亩产比乙村高。但从组平均数看,不论是山地还是平地亩产量,都是乙村好于甲村。,2019/5/19,扬州大学管理学院,54,第四节 标志变异指标,一、标志变异指标的意义 1、概念:变异指标又称标志变动度,综合反映总 体各个单位标志值差异的程度。 2、作用:标志变异指标在统计分析研究中的作用 主要有如下几方面: (1)变异指标反映总体各单位标志值分布的离 中趋势。总体各单位的标志值围绕平均指标上下 波动。所以平均指标反映总体各单位标志值的集 中趋势。而变异指标则表明总体各单位标志值的 分散程度,对于变动中心来说,也就是反映标志 值的离中趋势。,2019/5/19,扬州大学管理学院,55,(2)变异指标可以说明平均指标的代表程度。 平均指标作为总体各单位标志值一般水平的代 表,其代表性的高低,随着标志值的差异程度 不同而有很大区别。 (3)变异指标说明现象变动的均衡性或稳定性。现象活动过程的稳定性和均衡性,可以从 每一时期的工作和整个时期中的平均工作量的 关系上反映,如果每一时期的工作量与平均工 作量大体相等,则现象活动过程、是均衡的、 稳定的。,2019/5/19,扬州大学管理学院,56,二、变异指标的种类及计算方法,(一)全距Range :最大变量值与最小变量值 之差,它说明标志值的变动范围.用R表示,优点:计算简便、易懂、意义明确 缺点:受极端值影响较大;不能全面反映各单 位标志值的变异情况,全距,平均差,标准差,变异系数,第一组 5 5 6 4 5 平均值=5 比较集中 第二组 2 3 9 7 4 平均值=5 比较分散 第一组 R= 64 = 2,第二组 R= 92 = 7,2019/5/19,扬州大学管理学院,57,(适用于未分组资料) (适用于分组资料),3、计算方法,2、特点:,根据总体单位所有标志值来计算差异程度,以算术平均数为计算的标准,对离差取绝对值,简单平均差公式:,加权平均差公式:,(二)平 均 差Average Deviation,1、涵义:,是总体各单位标志值对算术平均数的 离差绝对值的算术平均数。,优点: 1分析意义完整; 2反映各标志值差异。 缺点:不便于数学处理,2019/5/19,扬州大学管理学院,58,甲乙两个班组工人日产量资料如下:,甲班工人日产量(件): 25 28 30 35 42 乙班工人日产量(件): 18 24 32 38 48 要求:比较两个班组工人平均日产量的代表性。,解:1、计算平均日产量,= 32(件),32(件),甲班:,= 5.2 (件),乙班:,A.D.= 8.8 (件),例 题,2、平 均 差,甲班工人日产量的平均差小于乙班, 甲班工人平均日产量的代表性大于乙班。,2019/5/19,扬州大学管理学院,59,(三)标 准 差Standard Deviation,1、涵义:,2、计算方法:方差(Variance)的正根,简单标准差公式,加权标准差公式,(适用于未分组资料),(适用于分组资料),是总体中各单位标志值对算术平均 数离差平方的算术平均数的平方根,计算标准差的简化式,或,2019/5/19,扬州大学管理学院,60,例 单项式资料(单位:元),(元),2019/5/19,扬州大学管理学院,61,例题:,根据资料计算工人的平均日产量和标准差:,工人平均日产量:,= 74.4 (件),工人日产量标准差:,= 11 (件),日产量 (x) 工人数(f) 55 10 65 24 75 36 85 22 95 8 合计 100,550,1560,2700,1870,760,-19,-9,1,11,21,3610,1944,36,2662,3528,11780,30250,101400,202500,158950,72200,565300,7440,按简化式计算:,= 11(件),2019/5/19,扬州大学管理学院,62,例: 组距式资料(单位:元),2019/5/19,扬州大学管理学院,63,3、是非(交替)标志的标准差: 将总体单位划分为具有某种性质的单位和不具有某种性质的两部分,它们合并构成一个总体。能通过“是、非;有、无”的区分将总体单位划分为两部分的标志标志,称为是非(交替)标志。它在总体单位间交替出现,非此即彼。主要反映总体单位之间的性质属性上的差别。 统计上是通过(1,0)变量值的处理将其数量化。即用“1”代表具有某种性质的标志值, “0”代表不具有某种性质的标志值。,2019/5/19,扬州大学管理学院,64,将总体中或数列中具有某种标志表现或某种性质的单位数N1占全部单位数N的比重(称为成数)用p表示,将不具有某种标志表现或某种性质的单位数N0占全部单位数N的比重用q表示: N1 + N0=N p + q = 1,2019/5/19,扬州大学管理学院,65,是非标志的平均数,是非标志平均数计算表,2019/5/19,扬州大学管理学院,66,是非标志的平均数就等于总体中或数列中具有某种性质的成数。因此,成数是一种特殊的平均数。,2019/5/19,扬州大学管理学院,67,是非标志的标准差,是非标志标准差计算表,2019/5/19,扬州大学管理学院,68,所以是非标志标准差为:,2019/5/19,扬州大学管理学院,69,是非标志的方差、标准差有极值:当 时取得最大值,方差最大值为0.25(或 25%),标准差最大值为0.5(或50%), 就是说,此时是非标志的变异程度最大。,2019/5/19,扬州大学管理学院,70,比较下列的资料:甲地的职工平均工资 和标准差 2000元, 420元。 乙地的职工平均工资和标准差为 1200元, 276元。 比较两地平均工资的代表性及其均衡性。 不能由于乙地的标准差小于甲地,就得出乙 地平均工资代表性大于甲地的结论。这时要 用到离散系数来计算分析。,2019/5/19,扬州大学管理学院,71,(四) 变 异(离散)系 数 Coefficient of Variance,标准差系数 V,=,1、涵义:用相对数形式反映各个变量值与其平均数 的离差程度,其数值表现为系数或百分数。主要用于 不同平均水平及不同性质的现象对比平均数代表性及其均衡性时,不能直接用全距、平均差、标准差来进行对比。 2、计算方法:消除不同平均水平的影响。求全距、平均差、标准差与算术平均数的比值。离散系数包括:全距系数、平均差系数 、标准差系数。使用最多的是标准差系数。,2019/5/19,扬州大学管理学院,72,例题:,已知甲乙两个班组工人日产量资料如下:,要求:比较一下哪个班组工人的平均日 产量的代表性高?,2019/5/19,扬州大学管理学院,73,解题过程如下:,30,70,108,80,52,340,88,168,98,90,32,476,150,490,972,800,676,3088,704,2016,1372,1350,512,5954,2019/5/19,扬州大学管理学院,74,甲班:,= 8.5(件),乙班:,= 11.9(件),甲班: = 2.22(件),乙班: = 2.69(件),1、计算工人平均日产量:,2、计算日产量的标准差:,3、计算变异系数:,甲班:,乙班:,乙班变异系数小于甲班 乙班工人的平均日产量代表性高。,2019/5/19,扬州大学管理学院,75,例:两种不同水稻品种,分别在5个田块上试种,其产量如下: 甲品种 乙品种 田块面积 总产量 田块面积 总产量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论