




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 综 合 指 标,统计学原理,问题 1、在有关大学生学习成绩影响因素调查中,假如搜集到了2000名学生上学期期末各科考试成绩,以及周学习时长 如何考察每位学生成绩的一般水平?多少男生和女生? 要比较女生、男生成绩的高低,应如何进行比较? 如果已经根据年级进行了分组,然后对每个年级又进行了周学习时长分组,那么每年级学生学习成绩如何比较?如何比较每个年级各组学生成绩和学习时长均匀性? 如何比较学生的学习效率?,统计学原理,总量指标 相对指标 平均指标 变异指标,统计学原理,综合指标法概述,采用统计指标概括和分析统计总体数量特征和数量关系的方法。 指标法是一种描述性统计分析方法,是统计整理的结
2、果,也是进一步进行统计分析如统计推断的基础。,通过指标,将总体内各单位的某些特征综合,以描述出总体特征。这些特征一般可以用总量指标、相对指标、平均指标,并辅之以变异指标进行描述。,第一节 总 量 指 标,概述 计算原则 计量单位介绍,统计学原理,概 述,概念,反映社会经济现象一定时间、地点、条件下的总规模、总水平的统计指标。 表现为绝对数、有名数。,反映国情、国力和企事业单位人、财、物的状况; 是国民经济宏观管理和企业经济核算的基础性指标,是实行目标管理的工具; 是计算相对指标和平均指标的基础,是基础指标。,作用,统计学原理,种类,统计学原理,总量指标的计算主要是理论和实际问题。 同类总体和现
3、象 统计口径一致 计量单位一致,总量指标计算原则,计量单位,实物单位:自然单位、度量衡单位、 双重或多重 单位、复合单位 价值单位:也称为货币单位 劳动单位:如工时、工日等。,第二节 相 对 指 标,概述 常用相对指标的计算,统计学原理,概念,两个有联系指标对比的比值,反映事物的数量特征和数量关系。 可以是绝对数之比,也可以是相对数或平均数之比。,作用 表明现象之间的比例关系; 找到不可比事物之间的比较基础; 便于记忆和保密,概 述,相对指标的表现形式,有名数:具有计量单位。如元/人,元/公斤等; 无名数:无计量单位,表示为系数、倍数、成数、百分 数、千分数等;,统计学原理,常用相对指标类型,
4、根据对比指标的联系性质不同,一般常用的相对指标分为几类: 计划完成相对指标; 结构相对指标; 比例相对指标; 比较相对指标; 强度相对指标; 动态相对指标,统计学原理,计划完成相对数:用来检查、监督计划执行情况的相对指标。一般用百分数表示。,相对指标的计算,基本公式:,运用中分为四种情况:,计划是以总量指标形式下达。 计划以相对指标形式下达 计划执行进度检查 长期计划检查,统计学原理,例:某企业计划2008年第一季度实现产值为100万元,实际实现产值80万元,总成本计划降低4万元,实际降低了5万元。,该企业差20%完成计划产值计划,欠产20万元;超额25%完成成本降低计划,超额降低成本1万元。
5、,计划以总量指标形式下达:采用基本公式,统计学原理,计划数以相对指标形式下达 对基本公式进行变换,形成两种公式:,倾向于较大(多、高),表述为“计划提高、计划增长“等,倾向于较小(少、低),表述为“计划降低、计划减少”等,统计学原理,例:某企业计划本年度利润增长20,实际增长50;产品单位成本减少10,实际减少7。,该企业利润比计划多完成25%,而单位成本差3.33%未完成计划。,统计学原理,计划执行进度(计划期未结束),长期计划的检查(计划期已结束),出于不同的目的,有两种计算方式:,水平法,累计法,统计学原理,以总量指标和以相对指标下达计划的特点,以总量指标下达计划时 计划完成程度大于10
6、0%表示超额完成计划,小于100%表示未完成计划,而且可以计算超额或未完成计划的相对程度和绝对程度。,以相对指标形式下达计划时 表述为“计划提高、计划增长”的计划完成程度,大于100%表示超额完成计划,小于100%表示未完成计划。 表述为“计划降低、计划减少”的计划完成程度,小于100%表示超额完成计划,大于100%表示未完成计划。 这种形式的计划完成程度,一般只说明超额或未完成计划的相对程度,而不计算绝对程度。,两种形式下达计划的本质一样。,统计学原理,结构相对指标:总体内部组成状况,一般用百分数形式表示,运用十分广泛,如合格率、及格率、恩格尔系数、就业率、失业率等都是结构指标。,比例相对指
7、标:总体内部的比例关系,一般用X:Y或者X:Y:Z多个部分数值连比的形式百分数形式表示,如性别比例、三次产业比例、轻重工业比例等。,统计学原理,动态相对指标:同一指标不同时间上的动态比较,即速度。,多采用相对指标或平均指标进行静态比较,以消除总体范围不同的影响,找到可比的基础。实践中,比较标准(即分母)一般存在两种情况: 比较标准是一般对象,此时分子分母可互换; 比较标准是一种基准或者典型时,分子分母不可互换。 常用GB水平、先进水平或者平均水平为比较基数。,比较相对指标(类比相对数):不同空间的静态对比关系,统计学原理,强度相对指标:现象的强度、密度、普遍程度,有时,强度相对指标的分子分母可
8、以互换,形成: 正指标:一般地倾向于大些更好; 逆指标:一般地倾向于小些更好。,例如,国土面积与总人口数是有联系的两个总量指标,两个指标对比形成强度相对指标:,强度相对指标常用两种方法表示: 复名数。如人均GDP、百人手机拥有量、人均住房面积等 无名数。多用百分数、千分数或系数表示,如出生率、死亡率、资产收益率、外贸依存度等,第三节 平 均 指 标(average/mean),统计学原理,概 述,概念 将同质总体内各单位某数量标志的差异抽象化,用以反映总体在具体条件下的一般水平。 平均指标反映同类现象的一般水平,是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。,例如,某位
9、同学的平均成绩;某班统计学期末平均成绩;某年粮食的平均亩产。,特点 数量差异抽象化:反映总体一般水平、普遍水平; 具体条件下同类现象计算; 反映总体单位变量值的集中趋势:代表值。,统计学原理,数据集中区,变量x,作用 用于同类现象不同空间的对比; 用于同一指标不同时间的对比; 作为数量标准或参考; 分析现象之间的依存关系和数量估算。,统计学原理,种类,统计学原理,算术平均( Arithmetic average/mean ),算术平均指标与强度相对指标的区别 算术平均数分子分母总体范围一致,两者存在从属关系;而强度相对指标不存在标志值与各单位的对应问题; 强度相对指标分子分母可互换,算术平均数
10、则不可。,算术平均是计算平均指标最基本的方式,可以说调和平均、几何平均等都是在算术平均基础上演化而来的。基本公式如下:,统计学原理,简单算术平均:应用于未分组的绝对数形式资料,数学符号规定:,统计学原理,例 张三期末考试成绩微积分 55分,毛概63分,英语51分,体育69分,宏观经济学65分,数理统计45分,求张三的平均成绩。,张三期末平均成绩为58分。这个成绩是张三同学这个学期学习业绩的代表值或一般水平。,统计学原理,加权算术平均(weighted average):应用于分组的绝对数资料,或者平均指标和相对指标资料,权(weight)表示重要性、影响力高低。根据表现形式 分为两种:,权数f
11、(绝对权):次数、频数等绝对数形式; 权重(相对权):比重、频率等相对数形式。,对于组距数列,应该用组中值作为变量值。, 加权算术的一般形式为(K为分组数):,分子为总体标志总量,其中每一个分项就是组标志总量,分母则为总体单位总量。,统计学原理,绝对数形式数据的平均值,分子为总体标志总量,其中每一个分项就是组标志总量,分母则为总体单位总量。,相对数、平均数形式数据的平均值,统计学原理,例 某班统计学期末考试成绩如下表,计算此班统计学平均成绩。,统计学原理,例 一年级新生期末成绩(各科成绩的平均值)分布如下表,计算此年级的平均成绩。,统计学原理,例 某公司在四个城市销售产品,某月统计4个城市销售
12、总额分别为50、52、46、60(万元),毛利率分别为56%、63%、70%和54%,计算此公司此月平均销售毛利率。,由于毛利率是通过毛利除以销售额计算得出的,平均毛利率应该是通过四个城市毛利总和除以四个城市的销售总额求出,因此相当于以各个城市销售额为权,对各个城市的销售毛利率进行加权算术平均求得。,统计学原理,算术平均的特点,优点:应用广泛,是平均数计算的基础,适合于代数运算; 缺点:1)易受极端值影响,代表性降低,并且受极大值影 响大于受极小值影响。 2)对于开口组,组中值未必准确,使平均数代表性 不可靠。,前面的权都是根据分组或数据本身得到的。实践中,有些数据并没有分组,数据本身也没有体
13、现出显著的重要性高低,这时常常用主观赋权方式或者其他赋权方式给数据赋予不同的重要性。,统计学原理,例 张三期末考试成绩微积分 55分,毛概63分,英语51分,体育69分,宏观经济学65分,数理统计45分。人们常常认为各科的重要性不同,如何求张三的平均成绩? 有人认为微积分、英语重要性最高,赋予权数5;数理统计、宏观经济学其次,赋予权数3;体育、毛概最低,赋予权数1。这样就要采用加权算术平均的方式计算张三同学的平均成绩。,也可以采用权重形式赋权。显然不同的赋权,计算的平均数肯定是有差异的。,统计学原理,算术平均的数学性质,1)算术平均数与总体单位数的乘积等于总体各单位标志值 的总和。,2)每个变
14、量之都加或减任意数值A,则平均数也要增加或 减少A。,3)每个变量之都乘以或除以任意数值A,则平均数也乘以 或除以A。,4)变量值与算术平均值的离差和等于0。,5)变量值与算术平均值的离差平方和等于最小值。,统计学原理,简单调和平均数,加权调和平均数,调和平均(harmonic mean), 经济统计中,一般要求计算过程有实际的经济含义。因此简单调和平均很少使用,加权调和平均则常作为加权算术平均的变形,计算相对指标或者平均指标的平均值。,调和平均的特点,如果数列中存在等于0的标志值,则无法计算; 计算结果会受到极端值的影响,受极小值的影响大于受极大值的影响;但受影响程度小于算术平均。,统计学原
15、理,例 某公司在四个城市销售产品,某月统计4个城市毛利额分别为50、52、46、60(万元),毛利率分别为56%、63%、70%和54%,计算此公司此月平均销售毛利率。,由于毛利率是通过毛利除以销售额计算得出的,平均毛利率应该是通过四个城市毛利总和除以四个城市的销售总额求出,因此相当于以各个城市毛利为权数,对各个城市的销售毛利率进行加权调和平均求得。,统计学原理,算术平均与调和平均的联系与区别,计算相对指标和平均指标的平均值时,由于掌握的资料不同,有时候采用加权算术平均方便,有时候采用调和平均方便。如果掌握了全部资料,则采用两种方法计算的结果完全相同。,统计学原理,算术平均:,调和平均:,例
16、某种商品三个地区的销售价格不同,假设取得有关三个地区的所有资料,即销售额、销售量和销售价格,据此计算此种商品平均销售价格。,统计学原理,几何平均(geometric mean ),适用于变量的连乘积等于总比率或总速度的变量数列。,简单几何平均数:(未分组资料),加权几何平均数:(分组资料),几何平均数的特点,几何平均数的应用范围比较窄。 数列中存在0值或负值,无法计算; 受极端值的影响较算术平均数和调和平均小,较稳健; 适用于反映总体标志总量是各标志值的连乘积的现象。,统计学原理,例 某人购买了价值10万元的某公司股票进行长期投资,第一年到第5年的年收益率分别为-4%、5%、5%、8%、7%,
17、计算该投资者这5年投资年平均收益率。,收益率是收益(增量)相对于本金的相对变动程度,是一种速度指标,一般采用几何平均方法计算其平均值。计算时,需要将这种增量相对变动程度转化为总体变动程度。,统计学原理,众数,众数是总体中出现次数最多的标志值。出现两个以上次数最多的标志值,称为复众数。,存在条件:只能用于分组资料中,总体中单位数较多,各标志的分配有明显的集中趋势。,计算方法:对于单项数列可直接观察出众数,组距数列需要采用插值法计算出众数。,观察:众数组 运用插值法推算众数的近似值,上限公式:,下限公式:, 两个公式等同,建议采用下限公式。,统计学原理,众数的特点,不受极端值和开口组的影响,增强了
18、代表性; 分布数列没有明显的集中趋势以及对于异距数列时,不容易确定众数。,例 单项式数列的众数。,可直接观察出众数为4分,统计学原理,人数最多为第三组,所以众数组为 7080,例 组距数列计算众数:,统计学原理,中位数,总体中各标志值排序后,处于中间位置的标志值。,计算方式(未分组资料、单项数列和组距数列),未分组资料,排序,计算中位数所在位置,确定中位数,n为奇数:中间位置对应的标志值。,n为偶数:两个中间位置对应标志值的简单算术平均值。,统计学原理,单项数列,计算中位数所在位置:,计算向上累计次数或向下累计次数(推荐向上累计),累计次数刚刚大于中位数位置的组对应的标志值就是中位数。,组距数
19、列,前面三步与单项数列的一样,只不过找到是中位数所在组,然后需要用插值法计算中位数近似值:,下限公式(向上累计),上限公式(向下累计),统计学原理,中位数特点,不受极端值和开口组影响,具有稳健性; 与中位数的离差绝对值之和最小; 可运用于不具有数字特点或不能用数字测定的现象。,例 未分组资料计算中位数,统计学原理,例 单项数列计算中位数,向上累计,5,9,15,22,26,28,统计学原理,中位数组为 7080,例 组距数列计算中位数:,统计学原理,各种平均数之间的关系,计算平均数之间的关系,只有在所有的变量值都相等时,等号才能成立。,如果采用三种计算方法计算同一资料的平均值,存在:,统计学原
20、理,位置平均数与算术平均数的关系,对称分布,右偏分布,左偏分布,当偏斜不大时:,第四节 标志变异指标,概述 极差 四分为差 平均差 标准差 变异(离散)系数,统计学原理,概 述,说明总体各单位标志值差异程度的指标,又称标志变异度、离散程度或离中程度。,衡量平均指标代表性的依据(一般来说),作用:,标志变异指标越大,平均数代表性越小; 标志变异指标越小,平均数代表性越大。,衡量现象稳定性、协调性和均衡性的程度。,种类:,全距、四分位差、平均差、标准差和离散系数。,统计学原理,标志变异度的计算,特点:,又称“全距”,它是总体各单位标志的最大值和最小值之差,用以说明所有标志值变动范围的大小,常用R表
21、示。,计算方便,易理解。常用于检查产品质量的稳定性和进行质量控制; 只考虑数列两端数值差异,不反映中间数值的差异情况,故不能全面反映总体各单位标志的差异程度;,极差(range),统计学原理,四分位差(Inter-quartile deviation ),将一个变量数列分为四等分,形成三个分割点(Q1,Q2,Q3),这三个分割点的数值就称为四分位数。其中处于1/4位置上的数值Q1为下四分位数,处于3/4位置上的数值Q3为上四位数,Q2则为中位数; 四分位差就是第三个四分位数Q3与第一个四分位数Q1之差(以Q.D.表示),即,统计学原理, Q.D.的计算方法:,未分组资料:,其中:,Q1位置=(
22、n+1)/4 ; Q3位置=3(n+1)/4 (n为变量值的项数),分组资料:,(1)确定Q1,Q3的位置;,(2)根据累计次数找出Q1,Q3所在组;,(3)根据公式求近似值:,统计学原理,240 720 1770 2370 2460 2850 2970 3000,向上累计,3000 2760 2280 1230 630 360 150 30,例 某乡农民家庭人均纯收入的分组资料如下:,累计次数(f),向下累计,农民家庭数(户),合 计,1000-1200 1200-1400 1400-1600 1600-1800 1800-2000 2000-2200 2200-2400 2400-2600
23、,年人均纯收入(元),3000,240 480 1050 600 270 210 120 30,试计算:,(1)极差;,(2)四分位差;,统计学原理,(1)确定Q1,Q3的位置,Q1位置=3000/4=750,Q3位置=2250,(2)确定Q1,Q3所在组,Q1所在组为1400-1600组,Q3所在组为1600-1800组,(3)求值, Q.D.=1760-1405.71=354.29,计算结果表明,有一半农民家庭的年人均纯收入分布在1405.711760元之间,且它们之间的最大差异为354.29元。,统计学原理,平均差,各单位标志值与平均数的离差(deviation)绝对值的平均数,以A.D
24、.表示。,特点 根据全部变量值计算, 较前两个指标的代表性更大; 采用绝对值消除离差,不适合于代数方法的演算,故其应用受到限制;,未分组资料,分组资料,统计学原理,标准差 ( Standard deviation ),标准差是各单位标志值与算术平均数的离差平方和的算术平均数的开放,又称“均方差”,以表示。标准差的平方即为方差(Variance),用2表示。,未分组资料,分组资料,简捷公式,统计学原理, 特点 采用离差平方的方法消除正负离差,在数学处理上比平均差更为合理和优越。,分组资料标准差另外一种形式, 标准差与平均差的关系,对于同一资料,平均差一般小于标准差。,相对数或平均数缺乏分母资料时
25、的计算公式。可以通过上一公式来理解。,统计学原理,例 某班学生统计学考试成绩分组资料如下:,475.62,953.1 1819.34 73.68 1201.48 1650.74,x f,110 845 1650 1530 475,4610,6050 54925 123750 130050 45125,359900,43.66 153.79 40.26 147.06 90.85,5698.34,简捷计算:,统计学原理,离散系数(Coefficient of dispersion,或称 为变异系数,Coefficient of Variance),离散系数也称为标志变动系数,用以反映各单位标志值的
26、离散程度;离散系数可消除不同计量单位或不同水平数列之间的差异程度;, 离散系数的形式:,最常用的标准差系数:,统计学原理,离散系数的应用,而离散系数则能用来比较因标志值大小、计量单位不同等引起的不可比现象之间的平均指标代表水平的高低。,与标志变异度指标一样,离散系数越大表示现象的离散程度越大,则现象的均衡星或协调性或平均指标的代表性越小。,全距、四分位差、平均差以及标准差都具有与标志值一样的计量单位,都是绝对指标,不仅受到离散程度的影响,还受到标志值大小的影响。,统计学原理,例 甲、乙两地农户年人均纯收入资料如下:,试比较两地农户年人均收入代表性的大小。, v甲 v乙 ,故甲地农户年人均收入代
27、表性更大。,统计学原理,第五节 分布的偏度与峰度,分布的偏态测度 矩偏度系数 皮尔逊偏度系数 分布的尖锐度测度 峰度,统计学原理,当k=1时,就是算术平均数,即1阶原点矩就是算术平均数。,矩偏度系数(Coefficient of Skewness),矩也称为动差。以零为中心矩称为原点k阶矩,基本形式为:,两组资料虽然平均数与标准差皆相同,却可能由于各自不同的偏斜情况,使得次数分配的形状不相同。,统计学原理,当k=0时,零阶中心矩,当k=1时,一阶中心矩,当k=2时,二阶中心矩,也即方差。,如果将原点移至算术平均数得位置,可以得到以平均数为中心的k阶中心矩:,统计学原理,矩偏度是以变量的三阶中心
28、动差除以标准差三次方,来衡量分布不对称程度,或偏斜程度的指标。即三阶中心动差以为标准单位的系数。公式如下:,当频数分布为正态时,变量值得频数以平均数左右完全对称,三阶动差等于0,偏度也为0; 当0时,为正偏斜(即右偏,分布曲线右尾端较厚) 当0时,为负偏斜(即左偏,分布曲线左尾端较厚)。,统计学原理,样本的矩偏度系数计算公式:,统计学原理,皮尔逊偏度系数(Pearson ),Pearson偏态系数以平均值与中位数或众数之差与标准差之比来衡量偏斜的程度,用SK表示偏斜系数。这是根据众数、中位数与均值各自的性质,通过比较众数或中位数与均值来衡量偏斜度的。其计算公式为:,偏态系数小于0,因为平均数在
29、众数之左,是一种左偏的分布,又称为负偏。 偏态系数大于0,因为均值在众数之右,是一种右偏的分布,又称为正偏。,统计学原理,峰度指标是以正态分布的峰度为比较标准(正态分布的峰度=0),来比较不同频数分布的尖峭程度。 当峰度0时,表示频数分布比正态分布更集中,分布呈尖峰状态,平均数代表性更高; 当0时,表示频数分布比正态分布更分散,分布呈平坦峰,平均数代表性较低。,峰度( Kurtosis ),峰度是以变量的四阶中心动差除以标准差的四次方,并将结果再减去3,用来衡量频数分布的集中程度,也是衡量分布曲线尖峭程度的指标。公式为:,统计学原理,样本的峰度系数计算公式:,统计学原理,例 随着信息化时代的到
30、来,越来越多的人选择在家办公,下面的样本资料是在家办公的人的年龄:,1、根据样本资料离散系数; 2、确定样本资料的偏度系数和峰度系数;,统计学原理,因此,样本数据均值为39.25岁,称右偏,比峰度较正态分布平坦。,统计学原理,第六节 相对位置测度和奇异点,相对位置标准化 极端值奇异点,统计学原理,数据的标准化,均值、方差、标准差等都是使用十分广泛的统计描述方法。通过均值和标准差可以了解每个数据的在数据集中相对位置。,不同的数据集具有不同的分布,因为不可直接比较。要比较不同数据的分布形态,必须使不同的数据集具有同等的参照平台。一般将标准差作为一种“计量单位”,用来测度变量值相对平均指标的距离。 标准化的作用在于确定数据在数据集中的相对位置,如果不同数据集中的两个数据的标准化值相同,则说明这两个数据在各自的数据集中的位置相对而言是相同的。,统计学原理,统计学原理,契比雪夫定理(the law of Chebishev),契比雪夫定理可以用来解释在均值的某个标准差附近,观察值发生的可能性。契比雪夫
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 退役军人优抚政策课件
- 退休老师送教科普知识培训课件
- 2025年氰化物中毒解毒药项目申请报告模板
- 课题中期汇报:护理研究进展
- 水电解质平衡
- 汽车销售服务质量保证措施
- 矿山开采扬尘治理管控措施
- 小学校本教研教学技能培训计划
- 燃气经验许可管理办法
- 物资配送计划管理办法
- GB/T 32124-2024磷石膏的处理处置规范
- 12G614-1砌块标准图集(附条文及目录)
- 华为HCSA-Presales-IT售前认证备考试题及答案
- 2025届浙江省新英语高三第一学期期末教学质量检测试题含解析
- 初一开学第一课主题班会课件
- 中等职业学校《单片机原理与应用》课程标准
- DL∕T 976-2017 带电作业工具、装置和设备预防性试验规程
- 学校食堂食品安全主体责任风险管控清单(日管控)
- 盐酸罂粟碱在腰背痛治疗中的应用
- 智能网联汽车:第6章 智能网联汽车先进驾驶辅助技术
- SYT5405-2019酸化用缓蚀剂性能试验方法及评价指标
评论
0/150
提交评论