[优秀统计PPT统原PP第四章综合指标(下)_第1页
[优秀统计PPT统原PP第四章综合指标(下)_第2页
[优秀统计PPT统原PP第四章综合指标(下)_第3页
[优秀统计PPT统原PP第四章综合指标(下)_第4页
[优秀统计PPT统原PP第四章综合指标(下)_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四节第四节 标志变异指标标志变异指标、标志变异指标的概念和作用、标志变异指标的概念和作用(一一)概念概念 测定总体中各单位标志值变异程度,即总体离散趋势的测定总体中各单位标志值变异程度,即总体离散趋势的 统计指标叫做标志变异指标,也称统计指标叫做标志变异指标,也称标志变动度标志变动度。 集中趋势集中趋势 差差 异异 抽抽 象象 化化 一般水平一般水平 平均指标平均指标 离散趋势离散趋势 差异具体测定差异具体测定 变异程度变异程度 变异指标变异指标(二二)作用作用 1、表明平均数的代表性。、表明平均数的代表性。变异程度大,代表性就小;变异程度大,代表性就小; 变异程度小,代表性就大。变异程度小

2、,代表性就大。 2、表明现象的均衡性。、表明现象的均衡性。变异大,均衡性差,风险大。变异大,均衡性差,风险大。 3、用于抽样推断、相关分析、统计预测。、用于抽样推断、相关分析、统计预测。(三三)常用指标常用指标 极差、平均差、标准差以及离散系数等。极差、平均差、标准差以及离散系数等。一、极差一、极差极差也称全距,是总体分布中最大标志值与最小极差也称全距,是总体分布中最大标志值与最小标志值之差。标志值之差。r=xmax-xmin 表明标志值变动范围。极差大,范围大,表明标志值变动范围。极差大,范围大,标志分散。标志分散。 只考虑两极,不反映中间,易受极端数值只考虑两极,不反映中间,易受极端数值影

3、响。影响。 若为组距式分组数列,若为组距式分组数列,(1则极差为最高组的组中则极差为最高组的组中值减去最低组的组中值。公式为:值减去最低组的组中值。公式为:r=最高组的最高组的组中值组中值-最低组的组中值最低组的组中值; 2公式为:公式为:r=末组上限末组上限-首组下限首组下限)四分位差四分位差 四分位差是四分位差是一批数据中的第三四分位数与第一批数据中的第三四分位数与第一四分位数之一四分位数之差的二分之一差的二分之一,即即(m3-m1)/2.其其意义是去掉数列中四分之一最小的部分和四意义是去掉数列中四分之一最小的部分和四分之一最大的部分分之一最大的部分,再再根据中间根据中间50%部分部分来来

4、测测定四分之一定四分之一的的距离距离为多少为多少. 若用一批数据中的第三四分位数与第一四分若用一批数据中的第三四分位数与第一四分位数位数之差之差,就称为四分就称为四分位距位距,用于用于测定中间测定中间50%部分的距离部分的距离为多少为多少,含义与四分位差类似含义与四分位差类似.四分位差举例四分位差举例 假设有数组:假设有数组:0,10,20,30,40,50,60,70,80,90,100,110. 元素共元素共12个,由小到个,由小到大排列。大排列。 则第一四分位为第三位和第四位的中位数,则第一四分位为第三位和第四位的中位数,即:即:q1=(20+30)/2=25; 同理,第三四分位为第九位

5、和第十位的中位同理,第三四分位为第九位和第十位的中位数,即:数,即:q3=(80+90)/2=85。 四分位差四分位差q=q3-q1/2=(85-25)/2=30 如果上面的数组表示如果上面的数组表示12个学生的成绩,个学生的成绩,q表示表示学生得分的分散情形,若学生得分的分散情形,若q值越大值越大,表示学生,表示学生得分越参差不齐。得分越参差不齐。 二、平均差二、平均差 总体各单位标志值与其算术平均数离差的绝对值的算术总体各单位标志值与其算术平均数离差的绝对值的算术平均。平均。 未分组资料平均差,简单平均差未分组资料平均差,简单平均差 分组资料平均差,加权平均差分组资料平均差,加权平均差 全

6、面考虑,综合反映;平均差大,离散大。全面考虑,综合反映;平均差大,离散大。 计算不便,反映不突出。计算不便,反映不突出。nxxdaffxxda例:例:200名工人按日产量分组资料如下,计算工人日产量的平均差。名工人按日产量分组资料如下,计算工人日产量的平均差。按日产量按日产量分组分组(件件) 组中值组中值(件件) 工人数工人数(人人)f xf f2030304040505060 25354555 10709030 250245040501650 -17-7十十3十十13 177313 170490270390 合计合计 -2008400-1320 xx xx xx件)(422008400fxf

7、x件)(6 . 62001320ffxxda四、标准差和方差四、标准差和方差标准差是总体标准差是总体各各单位标志值与其算术平均数离差平方的算术平均数单位标志值与其算术平均数离差平方的算术平均数的平方根,亦称均方差。标准差的平方即为方差。的平方根,亦称均方差。标准差的平方即为方差。根据根据未分组未分组资料计算,要采用简单标准差和方差。资料计算,要采用简单标准差和方差。 标准差标准差方差方差 根据根据分组分组资料计算,要采用加权标准差和方差。资料计算,要采用加权标准差和方差。 nxx2nxx22ffxx2ffxx22简单标准差公式简单标准差公式加权标准差公式加权标准差公式(适用于未分组资料)(适用

8、于未分组资料)(适用于分组资料)(适用于分组资料)计算标准差的简化式计算标准差的简化式 22xx 22nxnx22fxfffx或或nxx2ffxx2例例: 解:解: (公斤) (公斤) 日产量日产量(公斤公斤)工人数工人数f(人人)组中值组中值x(公斤公斤) f(1)(2)(3)(4)=(3)-42(5)=(4)2(6)=(5)(2)20303040405050-601070903025354555-17-7313289499169289034308105070合计合计200-122002xx 2xx xx422008400fxfx8 . 7200122002ffxx五、离散系数五、离散系数总

9、体分布的标志变异程度不仅取决于标志值的差异状态,还受到总体分布的标志变异程度不仅取决于标志值的差异状态,还受到总总体平均数体平均数的影响。若对两个总体分布进行变异性比较,当它们的的影响。若对两个总体分布进行变异性比较,当它们的平均数不等、平均数不等、计量单位不同计量单位不同时,则应消除平均数不同和计量单位时,则应消除平均数不同和计量单位不可比的影响。不可比的影响。例:例: 6 7 8 9 10 =8 r=4 ad=1.2 =1.4142 106 107 108 109 110 =108 r=4 ad=1.2 =1.4142 离散系数离散系数 是指是指消除平均数影响后消除平均数影响后(8or10

10、8, 8or800)的标志变异指的标志变异指标,其形式为标,其形式为相对数相对数,也称为标志变异相对数指标。,也称为标志变异相对数指标。 平均差系数平均差系数 标准差系数标准差系数 %100 xdavda%100 xvxx%1582 . 1dav%1 . 11082 . 1dav%6 .1184142. 1v%31. 11084142. 1v即:变即:变 异异 系系 数数是全距、平均差、标准差是全距、平均差、标准差与算术平与算术平均数均数的比值。的比值。计算方法:计算方法:标准差系数标准差系数 v= x变异系数包括:全距系数、平均差系数变异系数包括:全距系数、平均差系数 、标准差系数、标准差系

11、数 使用最多的是标准差系数。使用最多的是标准差系数。用相对数形式反映各个变量值与其平均数用相对数形式反映各个变量值与其平均数的离差程度,其数值表现为系数或百分数。的离差程度,其数值表现为系数或百分数。作用作用离散系数用于对离散系数用于对不同组别数据不同组别数据的离散程的离散程度进行比较,离散系数大,说明该组数据的度进行比较,离散系数大,说明该组数据的离散程度大;离散系数小,说明该组数据的离散程度大;离散系数小,说明该组数据的离散程度小。离散程度小。第五节第五节 成数106 成数及其性质成数及其性质 是非标志是非标志(交替标志交替标志):只有两种标志表现。:只有两种标志表现。 成数成数具有某种标

12、志的单位数在总体单位数中所占的比重。具有某种标志的单位数在总体单位数中所占的比重。总体单位数为总体单位数为n,具有某种标志的单位用,具有某种标志的单位用1表示,单位数为表示,单位数为n1,成数为成数为 不具有某种标志的单位用不具有某种标志的单位用0表示,单位数为表示,单位数为n0,成数为,成数为成数的平均数就是成数本身成数的平均数就是成数本身。成数的标准差为成数的标准差为pq的几何平均数的几何平均数。nnp1nnq0标志表现标志表现xf比重比重是是1n1非非0n0合计合计n1nnp1nnq0pnnnnfxfxp010101pqnnnpnpffxxp0102122)0 ()1 ()(第六节第六节

13、 综合指标的应用综合指标的应用 一、一、算术平均数、调和平均数、几何平均数之关系 设有设有 1、2、3、4、5xxxgh3554321nxx19. 251413121151xnxh6 . 21205432155gx 调和平均数几何平均数算术平均数平方平均数 二元的易证,多元的就有点麻烦了,下面给二元的证明 算术和几何:因(a - b)2 = 0,即(a + b)2 - 4ab = 0,故a + b = = 几何与调和:利用上式,有2 / (1/a + 1/b) = 2ab/(a+b) = ) 算术与平方:因 - (a + b)/22 = (a - b)2 / 4 = 0,故 = (a + b)

14、/2. ab4ab2ab2ab2ab2/ )(22ba 2/ )(22ba 二、二、位置平均数与算术平均数之关系位置平均数与算术平均数之关系(定性定量定性定量) 中位数、众数和算术平均数都反映现象数量分布的集中趋势;中位数、众数和算术平均数都反映现象数量分布的集中趋势; 它们的关系既反映它们的关系既反映总体数量分布的特征总体数量分布的特征,又可,又可相互之间的估算相互之间的估算。1、运用中位数、众数和算术平均数的数量关系判别总体分布特征运用中位数、众数和算术平均数的数量关系判别总体分布特征 次数分布完全对称,即呈次数分布完全对称,即呈对称分布对称分布曲线时,算术平均数曲线时,算术平均数 和中位

15、数、众数三者完全相等。和中位数、众数三者完全相等。oemmx 次数分布为次数分布为右右(正正)偏态偏态时,算术平均数大于中位数且大于众数。时,算术平均数大于中位数且大于众数。(算术平均数紧跟分布)(算术平均数紧跟分布) 次数分布为次数分布为左左(负负)偏态偏态时,算术平均数小于中位数且小于众数。时,算术平均数小于中位数且小于众数。oemmxoemmx2.利用位置平均数与算术平均数的关系进行推算利用位置平均数与算术平均数的关系进行推算 porson公式公式 在分布偏斜程度不大的情况下,不论右偏或左偏态在分布偏斜程度不大的情况下,不论右偏或左偏态 总有中位数居中间,众数与中位数的距离约为算术总有中

16、位数居中间,众数与中位数的距离约为算术 平均数与中位数的距离的平均数与中位数的距离的2倍,即:倍,即:由此可以得到三个推算公式:由此可以得到三个推算公式:)(2eoemxmmxmmeo2332xmmoe23oemmx例例14:根据某城市住户家庭月收入的抽样调查资料计算:根据某城市住户家庭月收入的抽样调查资料计算得到众数为得到众数为1040元,中位数为元,中位数为1128.57元,问算术平均数元,问算术平均数约为多少?其分布呈何形态?约为多少?其分布呈何形态?解:解: 1172.86(元)(元) me1128.57(元)(元) m01040(元)(元) 说明该城市住户家庭月收入分布呈右说明该城市

17、住户家庭月收入分布呈右(正正)偏态分布。也说偏态分布。也说明收入分配中算术平均数偏向高端,多数居民收入低于明收入分配中算术平均数偏向高端,多数居民收入低于算术平均数。(右算术平均数。(右(正正)偏态分布拨高了算术平均数,关键偏态分布拨高了算术平均数,关键看中位数为中间位置)看中位数为中间位置)元)(86.11722104057.1128323oemmxoemmxx三、综合指标结合应用三、综合指标结合应用(一一)总量指标总量指标 是社会经济统计的基础指标,计算和应用总量指标必须确定指标是社会经济统计的基础指标,计算和应用总量指标必须确定指标 的科学涵义、包括的范围、计算方法和计量单位。的科学涵义

18、、包括的范围、计算方法和计量单位。(二二)相对指标相对指标 是两个有联系的指标对比的比值,反映现象的数量特征、数量关是两个有联系的指标对比的比值,反映现象的数量特征、数量关 系和变动程度。常用指标有结构相对数、比较相对数、比例相对系和变动程度。常用指标有结构相对数、比较相对数、比例相对 数、动态相对数、强度相对数和计划完成程度相对数等。运用相数、动态相对数、强度相对数和计划完成程度相对数等。运用相 对指标时,必须注意统计的可比性,即用以对比的指标在涵义以对指标时,必须注意统计的可比性,即用以对比的指标在涵义以 及包括范围、计算方法、计量单位、时间跨度等方面要保持一致及包括范围、计算方法、计量单

19、位、时间跨度等方面要保持一致; 此外也要注意相对指标与总量指标相此外也要注意相对指标与总量指标相结合应用。结合应用。(三三)平均指标平均指标 是反映总体一般水平的代表值和描述数据分布集中趋势的重要特是反映总体一般水平的代表值和描述数据分布集中趋势的重要特 征值。常用指标有算术平均数、调和平均数、几何平均数、众数征值。常用指标有算术平均数、调和平均数、几何平均数、众数 中位数等。要注意将平均指标与离散指标结合起来分析。中位数等。要注意将平均指标与离散指标结合起来分析。(四四)变异指标变异指标 反映分布的离散趋势,是与平均指标相匹配的重要特征值。常用反映分布的离散趋势,是与平均指标相匹配的重要特征

20、值。常用 指标有全距、平均差、标准差(或方差指标有全距、平均差、标准差(或方差)等。但要对平均水平相差等。但要对平均水平相差 较大、计量单位不同的变量的离散程度进行比较,还需计算离散较大、计量单位不同的变量的离散程度进行比较,还需计算离散 系数。系数。 四、四、偏度与峰度(峭度)偏度与峰度(峭度) 1、偏度(偏度(skew):):是描述统计是描述统计数据分布偏斜程度的量。用数据分布偏斜程度的量。用偏度系数偏度系数或偏态或偏态系数来刻划。(样本系数来刻划。(样本s与与n-1;总;总体为体为n与与) 3131) 1()(snxxvnii)(313)(nsxxnii 0, 0, 右,正偏态分布右,正偏态分布 左,负偏态分布左,负偏态分布 1v0mx 1v0mx =0, 对称,正态分布 2、峰度(峰度(kurt):是反映数据:是反映数据的次数分布较正态分布曲线是更尖还的次数分布较正态

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论