统计学4综合指标TJ_第1页
统计学4综合指标TJ_第2页
统计学4综合指标TJ_第3页
统计学4综合指标TJ_第4页
统计学4综合指标TJ_第5页
已阅读5页,还剩117页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学

第四章综合指标与数据分布特征一、总量指标(绝对数指标)二、相对数指标(相对数)三、平均数指标(平均数)四、标志变异指标五、分布的偏度与峰度主要内容本章重点1、时期指标和时点指标的区别2、各种相对指标的判断3、算术平均数的计算4、调和平均数的计算5、标准差和标准差系数的应用一、概念总量指标是反映社会经济现象总规模、总水平的综合指标。§1总量指标例如:2005年我国财政收入30510亿元,财政支出33510亿元,财政赤字3000亿元。总量指标表现形式是绝对数,也可表现为绝对差数。二、作用(1)反映国情、国力和企事业单位人、财、物的状况;(2)是国民经济宏观管理和企业经济核算的基础性指标,是实行目标管理的工具;(3)是计算相对指标和平均指标的基础。三、总量指标的种类1、按反映现象总体内容的不同总体单位总量总体标志总量2、按反映时间状况的不同时期指标时点指标区别:是否连续登记取得数值、是否可累加、是否与时间长短有关单位名称企业数(个)职工数(人)固定资产增加额(万元)工业增加值(元)纺织局化工局机械局300250450800050007000

100020002000200500300合计10002000050001000例:通过下表:1、区分总体单位总量与总体标志总量;2、区分时期指标与时点指标。四、总量指标的计量单位计量单位自然单位:头、辆、人双重单位:台/千瓦复合单位:吨公里实物单位货币单位劳动量单位:工时、工日度量衡单位:米、公斤实物指标价值指标劳动指标§2相对指标一、相对指标的概念、表现形式第三章综合指标1、概念:相对指标是两个相互联系的现象数量的比率,用以反映现象的发展程度、结构、强度、普遍程度。例:2005年我国对外贸易进口总额增长率为16.1%,出口总额增长率为25.7%2、作用1)能具体表明社会经济现象之间的比例关系2)使一些不能直接对比的现象有了共同对比的基础;3)是经济管理和考核评价企业经济活动状态的重要指标。

3、表现形式:无名数、有名数企业8月份劳动生产率(万元)7月份劳动生产率(万元)8月比7月发展速度(%)甲21.94103.09+600元乙0.560.52107.69+400元从上表中看来,好象甲厂比乙厂劳动生产率高(∵600>400);而将其换算成相对指标,实际发展速度是乙厂快于甲厂。由此可看出相对指标可以弥补总量指标的不足。例二、相对指标的种类及计算方法(一)结构相对指标1、结构相对指标是反映总体内部构成特征或类型的统计指标。3、指标特点:各组或各部分占总体的比重之和,必须为1或100%2004年人口主要构成情况(单位:万人)指

标年末数比重(%)全国总人口129988

100.0

其中:城镇54283

41.8

乡村75705

58.2

其中:男性66976

51.5

女性63012

48.5

其中:0-14岁27947

21.5

15-64岁92184

70.9

65岁及以上9857

7.6

指标单位20012002200320042005城镇居民人均可支配收入元686077038472942210493农村居民人均纯收入元23662476262229363255城镇居民家庭恩格尔系数%38.237.737.137.736.7农村居民家庭恩格尔系数%47.746.245.647.245.51998100.020.941.033.77.338.11999100.019.240.933.37.639.92000100.017.841.433.28.240.82001100.016.741.633.08.641.72002100.016.042.033.09.042.0年

份国内生产

总值

第一产业第二产业

第三产业工业建筑业重庆重庆市国内生产总值构成(%)(二)比例相对指标1、比例相对指标是反映总体内各个局部、各个分组之间量的比例关系的统计指标。3、一般用百分比表示,也可用几比几的形式表示。

指标19531964198219902000总人口(万人)5943569458100818113368126583男3079935652519445849565355女2863633806488745487361228性别比(以女性为100)107.56105.46106.30106.60106.74

五次全国人口普查人口基本情况

2004年重庆GDP抽象化为100,第一产业、第二产业、第三产业的比例为:15.9︰44.3︰39.8。(三)比较相对指标1、说明某一同类现象在同一时间内不同单位发展的不平衡程度。3、一般用百分数或倍数表示。城市人均可支配收入

2003年2004年人均消费支出

2003年2004年北京(元)13882.615637.811123.812200.4重庆(元)8093.79221.07118.17973.1两者之比(倍)1.7151.6961.5631.53绝对差额(元)5788.96416.84005.74227.31997年中美小学、中学、高等院校师生比

小学中学高等院校美国18.314.215.6中国24.216.89.8二者之比(倍或%)0.756(倍)(75.6%)0.845(倍)(84.5%)1.592(倍)(159.2%)

例:某年有甲、乙两企业同时生产一种性能相同的产品,甲企业工人劳动生产率为19,307元,乙企业为27,994元。说明甲企业劳动生产率比乙企业低31%。(四)动态相对指标1、反映同类现象在不同时间上变动程度的相对指标。1、是用来表明某一现象在另一现象中发展的强度、密度或普遍程度的相对指标。例如人口密度、每万人拥有医院病床数、人均绿地面积等(五)强度相对指标3、分子分母可以互换,故有正指标与逆指标之分。4、强度相对数常带有“人均”字样,但不是平均数(含义不同)。例:某城市人口100万人,有零售商业机构5000个,则:(六)计划完成程度相对指标1、以绝对数形式计算计划完成程度相对指标

⑴检查短期计划情况基本公式:计划完成程度(%)=实际完成数计划任务数某企业生产某种产品产量计划完成情况如下:单位(吨)b、检查累计至二月份的产量计划完成程度情况。月份计划产量实际产量

一二三180018001800122517202665合计

54005610a、检查各月产量计划完成情况。计划完成程度(%)

68.0695.56148.06

103.89(计算结果见上表)⑵检查长期计划情况a、累计法:按n年完成任务的总和下达计划任务b、水平法:按计划期末应达到的水平下达计划任务例:

根据表中的资料,采用累计法或水平法,完成如下两项要求:(1)若五年计划规定,最后一年应达到45万吨,试计算计划完成相对指标及提前多长时间完成计划任务?(2)若五年计划中规定,五年内产量应达到178万吨,试计算计划完成相对指标及提前多长时间完成计划任务?2、以相对数形式计算计划完成程度相对指标实际完成程度(%)计划完成程度(%)=——————————

计划规定的完成程度(%)第四章综合指标例3-2-3:假定某企业按计划规定,劳动生产率应在基期的水平上提高3%,实际执行结果提高了4%,问提高劳动生产率计划任务的完成程度是多少?第四章综合指标解:即:超额0.97%完成提高劳动生产率的计划任务。解:例:假定某企业按计划规定,产品单位成本应在上一年的水平上降低4%,实际降低了3%,问降低产品成本的计划任务的完成程度是多少?第三章综合指标即:差1.04%没有完成成本降低计划任务。例:某企业2005年产品销售量计划为上年的108%,2004-2005年动态相对指标为114%,试确定2005年产品销售计划完成程度。3、以平均数形式计算计划完成程度相对指标实际平均水平计划完成程度(%)=————————

计划平均水平以平均数形式下达的计划检查方法与绝对数计划检查方法大致相同,但长期计划检查不适合采用累计法。六种相对数指标的比较不同时期比较动态相对数强度相对数不同现象比较不同总体比较比较相对数同一总体中部分与部分比较部分与总体比较实际与计划比较比例相对数结构相对数计划完成相对数同一时期比较同类现象比较三、正确运用相对指标的原则(1)正确选择对比的基数;(2)必须注意对比的两个指标的可比性;(3)相对指标要与总量指标相结合;(4)多种相对指标的结合运用。§3平均指标一、平均指标的概念、特点、种类平均指标又称平均数,它是将一个同质总体各单位之间量的差异抽象化,用一个指标来代表总体各单位的一般水平,是对总体分布集中趋势或中心位置的度量。特点

-数量抽象性

-集中趋势代表性种类:数值平均数位置平均数算术平均数调和平均数几何平均数众数中位数二、算术平均数(一)基本公式例:平均工资=工资总额/职工人数平均成本=总成本/产量

算术平均数与强度相对数的区别平均数(1)、平均数是在同质总体内进行计算的。(2)、平均数的分子与分母是一一对应关系。分母是分子(标志值)的承担者。(3)、平均数是反映一般水平或集中趋势的。强度相对数:(1)、强度相对数是由两个不同质但有联系的总体的指标数值对比求得。(2)、强度相对数的分子与分母不存在一一对应关系。(3)、强度相对数是反映两个有联系的总体之间的数量联系。1、简单算术平均数:适合于未分组资料6名学生的考试成绩分别为(分):79、82、87、60、95、91,他们的平均成绩是多少?2、加权算术平均数:适合分组资料工人日产量(件)工人人数(人)工人人数比重(%)

101112131470150380150100

8.7512.5047.501872512.50合

计800100.00错误原因:不符合基本公式,不是5个工人,而是800个工人;工人人总产量不是60件,而是9710件。正确的计算:

常犯的错误:(件)例3-3-1:某企业工人日产量分组资料如下:试计算平均日产量日产量(件)工人人数(人)(x)(f)

1510

1620173018501940解:例3-3-2:某企业职工按工资分组资料如下:工资(元)职工人数(人)

xf400—50050500—60070600—700120700—80060要求:根据资料计算全部职工的平均工资。第三章综合指标解:计算过程如下:工资(元)组中值

x职工人数f400—500500—600600—700700—800450550650750

507012060合计—300平均工资:xf22500385007800045000184000(二)影响加权算术平均数的因素影响加权算术平均数的因素有二:各组变量值(X)和各组权数所占比重通过公式变形也可得到上述结论:例3-3-1也可求解为:(三)权数的选择对绝对数求平均数时,频数一般都是权数。但对相对数求平均数时,频数不一定是权数。例3-3-3:某企业25个班组按工人劳动生产率分组资料如下:求:这25个班组的平均劳动生产率劳动生产率(件/人)生产班组数工人数50-601015060-70710070-8057080-9023090以上116解:平均劳动生产率==65.77(件/人)(四)算术平均数的数学性质1、各变量值与其均值的离差之和等于零,即=02、各变量值与其均值的离差平方和最小,即=min

优点:①容易理解,便于计算

②灵敏度高

③稳定性好

④=min

=0缺点:①易受极值影响

②在偏斜分布和U形分布中,不具有代表性例:某售货小组有5名营业员,10月6日一天的销售额分别为520元,600元,480元,750元和500元,求该日平均销售额。

如果其中一个销售人员昨天销售520元,10月7号他一下子销售了5000元,其他人销售额不变,那10月7号平均销售额是多少?这个数据代表性还好不好?

二、调和平均数(一)基本公式1、例3-3-4:张三在甲、乙、丙三处各买了1元的小白菜,价格分别为1、1.1、1.2(元/斤)。求张三购买小白菜的平均价格。解:平均价格====1.094元/斤得,简单调和平均数2、例3-3-5:张三在甲、乙、丙三处各买了1、2、3元的小白菜,价格分别为1、1.1、1.2(元/斤)。求张三购买小白菜的平均价格。解:平均价格====1.128元/斤得,加权调和平均数(二)调和平均数和算术平均数的判断

1、例3-3-6:某校大二年级10个班的英语四级过级情况如下:过级率(%)班数(个)40以下240-60260-80580-1001总过关人数213014036要求:⑴舍弃总过关人数资料,求平均过级率;

⑵舍弃总人数资料,求平均过级率。总人数706020040解:平均过级率=⑴=61.35%⑵=61.35%某公司下属18个企业,计划完成相对数如下:产值计划完成程度(%)组中值(%)企业数(个)实际产值计划80-9085268080090-10095323752500100-110105101806017200110-120115350604400合计——182617524900产值产值计划完成程度(%)组中值(%)x

企业数(个)计划产值(万元)f80—90

85280090—100

9532500100—1101051017200110—12011534400合计——1824900实际产值(万元)xf680237518060506026175某公司下属18个企业,计划完成相对数如下:产值计划完成程度(%)组中值(%)企业数(个)实际产值计划产值

80-9085268080090-10095323752500

100-110105101806017200

110-120115350604400合计——182617524900

平均计划完成为105.12%2、结论:已知x的文字公式中的母项(f)资料时,用加权算术平均数已知x的文字公式中的子项(m)资料时,用加权调和平均数当m=xf时,调和平均数是算术平均数的变形例3-3-7:10家企业的销售利润率分组资料如下:销售利润率(%)企业数(个)总销售利润(万元)

12以下250012-164150016-203800

20以上1100试求这10家企业的平均销售利润率(14.07%)优点:①灵敏度高③有“0”值时不能计算②易受极值影响缺点:①不易理解②在某种不能计算的条件下,可以代替算术平均数进行计算三、几何平均数(一)概念它是N个单位的变量值的连乘积的N次方根。凡是变量值的连乘积等于总比率或总速度时,都可使用几何平均数(二)计算公式1、资料未分组时,用简单几何平均数:例3-3-8:某厂生产某种零件经过四个车间,各车间合格率依次为95%、92%、90%、94%。求平均合格率。平均合格率==92.73%2、资料分组时,用加权几何平均数:

某金融机构以复利方式计息。近12年来的年利率有4年为3%、2年为5%、2年为8%、3年为10%、1年为15%。则12年的平均年利率?平均年利率=106.82%-1=6.82几何平均数的特点:

1、如数列中有标志值为0或负值,则无法计算3、几何平均数主要应用于计算比率或速度的平均(变量值的连乘积等于总比率或总速度。)2、受极值的影响常用的数值平均数的一般数量关系:H(调和平数)≤G(几何平均数)≤A(算术平均数)由于三种平均数之间存在着上述不等式关系,因而在计算平均数时应根据社会经济现象的性质和统计研究的目的选择适当的计算方法。四、众数(Mo)1、众数是一组数据中出现次数最多的变量值。它是一个位置代表值,不受极端值)(极大值、极小值)的影响。求众数不需要对数据进行排序。把例一中45换成500,众数是否改变?例一:31,32,31,28,29,31,45,40,42,31,28众数=31例二:8,9,6,7,8,5,9,8,9众数=8,9例三:8,6,5,7,9,10,4,12众数=不存在M0M0M0M0M0若有两个次数相等的众数,则称复众数。①只有总体单位数比较多,而且又有明显的集中趋势时才存在众数。下三图无众数:②在单位数很少,或单位数虽多但无明显集中趋势时,

计算众数是没有意义的。由单项式数列确定众数:只需找出出现次数最多的标志值。如:每日平均砌砖墙量(M3)工人人数(人)xf0.8200.930(Mo)1.0801.1151.25合计

1502、对未分组资料和单项式数列,直接找出即可。3、对组距式数列,先找出众数组,再按公式计算:M0=XL+其中,XL表众数组的下限、d表众数组的组距

△1表众数组与其前一组的次数之差

△2

表众数组与其后一组的次数之差。例3-3-9:某市某年职工家庭收支的抽样资料如下,求家庭月收入的众数。某市职工家庭抽样调查收入表月收入(元)户数1000-2000502000-30002503000-40003204000-50009505000-60002006000以上180解:众数组为第四组M0=XL+=4000+=4456元4、利用以上公式计算众数时,假定数据分布具有明显的集中趋势同时假定众数组的频数在该组内是均匀分布的。5、众数的特点:是一种位置平均数;无明显集中趋势时,计算众数没有意义。五、中位数(Me)把最大值10换成100,中位数是多少?(不受极值影响)中位数=

7先排序:4,5,6,7,7,8,8,9,10例一:8,6,5,7,9,7,8,4,10求中位数1、中位数是指一组数据按大小排列后,处于正中间位置上的变量值。中位数也不受极值的影响。例如:人口的年龄分布往往近似J型:婴儿数最多,随着年龄的增大,人数逐渐下降,到了百岁左右,所剩的人数就很少了。如果计算年龄的算术平均数,老年人口数虽然较少,但其年龄数值很高,这样一来,计算的平均年龄就会偏向老年一方。因此,各国的人口统计资料中,平均年龄的计算一般采用中位数。中国几次人口普查年龄结构的变化(单位:%)

普查年份0---1415---6065岁及以上老少比196440.7055.703.608.8198233.4561.664.8914.6199027.6166.895.5019.9200022.8970.156.9630.4

1982年1990年2000年年龄中位数22.925.330.8

按照国际上划分人口类型的标准,O--14岁少年儿童比重在30%以下、65岁以上老年人口比重在7%以上、年龄中位数超过30岁、老少比在30%以上时,为老年型结构。按此标准,可以看出,1964年我国人口类型属典型的年轻型。经过近20年时间,到1982年,人口类型已经从年轻型步入了成年型。第五次人口普查,中国的人口年龄结构已进入老年型社会。而且从年轻年型到老年型的转变仅用了30年的时间,而西方发达国家完成这一转变大约用50--100年的时间,我国人口年龄结构转型过程之快为世界罕见。例二:11,8,6,5,7,9,7,8,4,10求中位数2、中位数的确定:①资料未分组时,直接找出即可。N为奇数时N为偶数时中位数是?先排序:4,5,6,7,7,8,8,9,10,11②资料分组时,先确定中位数所在的组(第所在的组),再通过以下公式计算中位数的近似值。Me=式中,XL为中位数所在组的下限,fm为中位数所在组的频数,d为中位数所在组的组距,Sm-1为中位数所在组以前各组的累计频数例3-3-10:某乡3000户家庭的月收入如下,试求月收入的中位数。月收入(元)户数400以下300400-500510500-6001020600-700480700-800450800以上240向上累计次数3008101830231027603000解:=1500,第三组为中位数组XL=500,Sm-1=810,fm=1020,d=100Me==567.65元3、利用以上公式时,需假定中位数所在组的频数在该组内是均匀分布的。中位数的特征:2、各变量值与中位数的离差绝对值之和最小。1、是一种位置平均数,不受极端值的影响,具有稳健性。六、、M0、Me的关系1、求出以下3例年龄的算术平均数、众数、中位数年龄(岁)人数10-201020-302030-4010例3-3-11例3-3-13年龄(岁)人数10-20620-301030-402040-504年龄(岁)人数10-20620-302030-401040-504例3-3-12解:据公式,得以上三例的答案分别为:例3-3-11:=M0=Me=25例3-3-12:=30.5M0=33.85Me=32<Me<M0

例3-3-13:=29.2M0=26.45Me=28>Me>M0

2、上述结果用图示如下:=M0=Me(对称)<Me<M0(左偏)>Me>M0(右偏)(一)

众数、中位数和均值的关系

1、判别总体分布特征。在完全对称的正态分布中,

=Me=Mo

次数分布为右偏态时,>Me>Mo

次数分布为左偏态时,<Me<Mo2、利用位置平均数与算术平均数的关系进行推算。3(—Me)=(—Mo)

Mo=3Me—2(二)众数、中位数和均值的特点和应用场合。例:已知某地职工年消费支出的算术平均数为2000元,中位数为1900元。则众数应为:七、正确应用平均指标的原则

(三)、用分配数列补充说明平均数。(二)、用组平均数补充说明总平均数。(一)、平均指标只能应用于同质总体某生产小组基期有工人15人,报告期人数增加到30人,两时期各技术等级的工人数和工资总额如下:级别基期报告期工人数(人)比重(%)工资总额(元)平均工资(元)工人数(人)比重(%)工资总额(元)平均工资(元)二级工

213.31000

5001653.39600600四级工

853.37200

9001033.3100001000七级工

533.475001500

413.468001700合计15100.015700104730100.026400880某工业部门100个企业年度利润计划完成程度资料如下:按计划完成程度分组(%)企业数

85-89.9

2

90-94.9

8

95-99.9

10100-104.9

40105-109.9

30110-114.9

10合计100经计算,100个企业年度平均利润计划完成程度为103.35%。

§4标志变动度

一、标志变动度的意义和作用(一)概念:是反映同质总体各单位标志值的差异程度的,即数列的离散趋势。(二)作用:1、衡量平均指标的代表性;2、反映社会经济活动的均衡程度;3、是统计分析的一个基本指标。二、全距(极差)R

全距=最大值—最小值全距的意义明确,计算简单。但它只考虑极值的大小,而不考虑其他变量值的分布情况,因而,用全距来测定数列的离散程度就不全面。例3-4-1有甲、乙两组数据,试比较哪组均值平均数的代表性大甲:40608084乙:63656670

解:由x=∑xn,有=66=66R甲=84-40=44R乙=70-63=77<44所以,乙组平均数的代表性大三、平均差(A.D)1、简单平均差A.D=如例3-4-1中A.D甲==16A.D乙==2因为2<16,所以,乙组平均数的代表性大2、加权平均差A.D=四、四分位差(Q.D)1、它指第三个四分位数与第一个四分位数之差。2、第三个四分位数是处于中位数和最大值中间的数第二个四分位数是中位数第一个四分位数是处于中位数和最小值中间的数3、如1、2、2、3、3、3、5、6、6数列中第三个四分位数为5,第二个四分位数为3,第一个四分位数为2。则四分位差等于3。五、方差和标准差方差是各变量值与其均值离差平方的平均数。方差的平方根叫标准差,也叫均方差。(一)计算公式1、资料未分组时,用简单标准差或方差用例3-4-1中的数据,得==17.55==2.55即,仍然是乙组的均值的代表性强2、资料分组时,用加权标准差=例3-4-2:已知某厂200个工人按日产量分组如下:试求其标准差。日产量(件)工人数(人)20-301030-407040-509050-6030解:=42(件)=

====7.81(件)(二)标准差的数学性质1、证明:2、如y=a+bx,则=b证明:y=a+bx则=a+b 所以,六、离散系数

一群牛的平均体重是180公斤,标准差是18公斤;一群羊的平均体重是15公斤,标准差是3公斤,能不能说羊的平均体重的代表性高些?为什么?两组数据:第一组:5,10,20,25,30第二组:100000,100005,99995,100020,100040第一组数据极差=25第二组数据极差=45第一组数据平均差=8.4第二组数据平均差=14.4第一组数据方差=107.5标准差=10.36822第二组数据方差=332.5标准差=18.23458如一组体重数据:极差=0.017平均差=0.0048方差=0.000045标准差=0.00667165(公斤),75,60,62,58极差=17平均差=4.8方差=44.5标准差=6.670832而如果将这些人的体重改成用吨计算,则数据变成:0.065(吨),0.075,0.06,0.062,0.0581、利用R、等比较两数列离散程度或平均数代表性大小的条件①两数列的平均数相等②两数列的计量单位相同如果不满足上述条件,则应该用离散系数来判断。有全距系数、平均差系数、标准差系数。但一般指标准差系数。2、具体计算V=

ó第一组:5,10,20,25,30离散系数=0.576第二组:100000,100005,99995,100020,100040离散系数=0.00018232392体重的例子:65(公斤),75,60,62,58离散系数=0.104231750.065(吨),0.075,0.06,0.062,0.058离散系数=0.104234375例3-4-3:某县工行和农行三个储蓄所1月份的储蓄额如下,试判断哪一个银行的储蓄所之间的储蓄额更均衡。工行:13、18、14农行:50、51、91(单位:万元)解:由

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论