统计分析的综合指标_第1页
统计分析的综合指标_第2页
统计分析的综合指标_第3页
统计分析的综合指标_第4页
统计分析的综合指标_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计分析的综合指标第1页,课件共110页,创作于2023年2月第一节总量指标一、总量指标的意义总量指标也称绝对指标或绝对数。即将总体单位数或总体单位标志值相加。说明现象的总规模、总水平指标数值大小受总体范围的制约总量指标的意义:1.是表现现象总体数量特征的基本指标2.是计算其他指标的基础第2页,课件共110页,创作于2023年2月二、总量指标的种类(一)按反映总体内容不同分为总体单位总量和总体标志总量例.某业企业职工人数1,000人,工资总额1980,000元。

“职工人数”为总体单位总量,“工资总额”为总体标志总量。(二)按反映的时间状态,分为时期指标和时点指标时期指标表明现象总体在一段时期内发展过程的结果。

时点指标表明现象总体在某一时刻的数量状况。第3页,课件共110页,创作于2023年2月1.时期指标的特点各时期指标数值具有可加性。指标数值大小与包含的时期长短有直接关系。指标数值是连续登记、累计的结果。2.时点指标的特点各时点指标数值不具有可加性。指标数值大小与其时间间隔长短无直接关系指标数值是间断计数的。第4页,课件共110页,创作于2023年2月(三)按计量单位分为实物指标与价值指标、劳动量指标。

总量指标的计算方法有直接计量法、间接推算法

关键:准确界定指标所属范围。第5页,课件共110页,创作于2023年2月第二节相对指标一、相对指标的意义

两个有联系的指标对比求得的比值或商数。也称相对数。例:某企业当年完成利润总额110万元,同时计划数为100万元,上年实际完成数为90万元。计算得到相对指标:计划完成程度=110%,发展速度=122.2%,增长率=22.2%相对指标的优点:1.反映现象之间的联系程度、发展程度及经济效益等。2.便于比较和分析事物。第6页,课件共110页,创作于2023年2月二、相对指标的计算单位1.无名数。如系数、倍数、百分数、千分数等。2.名数。如商品流转速度指标用“次”或“天”表示,同时采用分子分母指标的单位的,如人口密度指标以“人/平方公里”表示,劳动力装备程度指标用“瓦/人”表示。百分点相当于百分数的单位,一个百分点就指l%。百分点常用于两个百分数相减的场合。例:1999年上海GDP的增长率为10.2%;2000年为10.8%,增幅比上年加快0.6个百分点(10.8%-10.2%)第7页,课件共110页,创作于2023年2月三、相对指标的种类及计算方法

(一)计划完成程度相对指标第8页,课件共110页,创作于2023年2月检查和监督计划完成情况的相对指标,基本公式:

[例4-1]某公司2000年计划销售额为2.5亿元,实际销售2.8亿元,则该公司当年销售额计划完成112%(=2.8/2.5)。超额完成计划12%。

1、总量指标计划的完成程度。计算同基本公式。检查长期计划有两种不同方法:水平法和累计法。以五年计划为例说明。第9页,课件共110页,创作于2023年2月(1)水平法计划执行情况分析:5年计划完成%=最末年的实际水平/最末年的计划水平提前完成5年计划的时间只要连续一年完成计划规定的最末一年的水平,就算完成了计划,所余的时间即为提前完成5年计划的时间。[例4-2]某企业1996一2000年第九个五年计划规定到2000年某种产品年产量达到4500万台,实际完成了4800万台,计划完成程度为:计划完成相对指标=4800/4500=106.7%说明这种产品超额6.7%完成五年计划。第10页,课件共110页,创作于2023年2月(2)累计法计划执行情况分析5年计划完成%=5年实际累计数/5年计划累计数提前完成5年计划的时间从期初开始,只要实际累计完成数达到计划规定的累计数,即完成了5年计划,所余时间既为提前完成时间。[例4-3]某地区第十个五年计划规定基本建设投资总额为520亿元,五年内累计完成530亿元,计划完成程度相对指标为:计划完成相对指标=530/520=101.9%即超额完成计划1.9%。第11页,课件共110页,创作于2023年2月2、相对指标的计划完成程度计划完成%=(1+实际提高率)/(1+计划提高率)计划完成%=(1-实际减低率)/(1-计划降低率)[例4–4]某企业计划要求产品单位成本下降5%,实际单位成本下降了8%,则计划完成程度指标为:单位成本降低计划完成%=(1-8%)/(1-5%)=96.84%计算结果表明,单位成本计划完成程度小于100%,说明实际成本比计划成本有所降低,超额完成了成本降低计划。3、平均指标的计划完成程度计算同基本公式。

第12页,课件共110页,创作于2023年2月(二)结构相对数指标第13页,课件共110页,创作于2023年2月

结构相对数指标是将总体按某一标志分组,然后将各组指标数值与总体指标数值对比求得的结果。一般用百分数表示。公式:[例]某地区2006年工业总产值为100亿元,其中重工业53.4亿元,则重工业结构相对指标=53.4/100=53.4%。一总体各组的结构相对数指标数值之和等于100%。第14页,课件共110页,创作于2023年2月结构相对数指标的意义:1.分析总体内部构成状况,说明事物性质和特征;2.不同时间的结构相对数进行对比分析,说明现象的变化过程和规律;3.说明各组在总体的地位和作用。第15页,课件共110页,创作于2023年2月2005年1%人口抽样调查发现,我国60岁及以上人口的比重为11.03%。其中,65岁及以上老年人口占总人口的比重为7.69%。0岁~4岁年龄段人口占总人口的比重为5.34%,5岁~9岁年龄段人口占总人口的比重为6.24%,10岁~14岁年龄段人口占总人口的比重为7.97%,显然,我国已经进入老龄化社会。

第16页,课件共110页,创作于2023年2月(三)比例相对数指标第17页,课件共110页,创作于2023年2月

比例相对数指标是同一总体内不同组成部分的指标数值对比的结果,表明总体内部比例关系。公式:可用一比几或几比几形式表示一般来说,分子分母可以交换。某些特定指标不可以交换。

[例]人口性别比指标:第18页,课件共110页,创作于2023年2月人口出生性别比正常值一般在103到107之间。但我国人口的出生性别比,自20世纪80年代中期以来却迅速攀升。1995年,0岁~4岁人口性别比:118.382000年,0岁~4岁人口性别比:120.172003年,0岁~4岁人口性别比:121.222005年,0岁~4岁人口性别比:122.66第19页,课件共110页,创作于2023年2月(四)比较相对数指标第20页,课件共110页,创作于2023年2月比较相对数指标是指同一时间不同空间的某项指标对比结果。公式:可用倍数、系数表示。分子分母可以交换。[例]甲、乙两公司2000年商品销售额分别为:

5.4亿元和3.6亿元则甲公司商品销售额为乙公司的1.5倍(5.4/3.6)。

第21页,课件共110页,创作于2023年2月用总量指标进行计算对比,往往受到总体规模和条件的影响,结果不能准确反映现象的本质差异。一般采用相对指标或平均指标计算。上例中,如用各公司人均年销售额进行对比:甲公司:21.6万元/人,乙公司:23.2万元/人则比较相对数指标=21.6/23.2=0.93=93%甲公司人均年销售额为乙公司的93%。说明虽然甲公司总销售额比乙公司多,但劳动效率却低于乙公司。第22页,课件共110页,创作于2023年2月2006年,美国的GDP占全球GDP的比重为35.6%左右。排名全球第一,中国第四。美国132216.85亿美元,中国26971.64亿美元,美国的GDP约为中国的5倍(4.9)。参见2006年世界GDP排名。

第23页,课件共110页,创作于2023年2月(五)强度相对数指标。两个性质不同而有联系的总量指标对比的结果。反映现象的强度、密度和普遍程度。公式:单位一般以名数和复名数表示,如商品流转次数用“次”表示,地区一定时期人均粮食产量为“公斤/人”.也可采用百分数、千分数等表示,如资金利税率、人口死亡率。第24页,课件共110页,创作于2023年2月有些强度相对数指标的分子和分母可以互换,形成正指标和逆指标两种计算方法。

例:反映卫生事业对居民服务保证程度的指标:正指标的数值大小与现象的发展程度或密度成正比,一般指标数值越大越好。将分子分母互换:逆指标的数值大小与现象的发展程度或密度成反比

一般指标数值越小越好。第25页,课件共110页,创作于2023年2月(六)动态相对数指标第26页,课件共110页,创作于2023年2月动态相对数指标是指某一指标在不同时间上的数值对比。一般用百分数表示。公式:基期是作为比较标准的基础时期。报告期是用来与基期对比的时期,也称比较期或计算期。此指标也称发展速度。增长速度=发展速度-1。第27页,课件共110页,创作于2023年2月甲公司2006年的平均物业管理费是6元/m2。2004年的平均物业管理费是4元/m2,甲公司2006年的报价相对于2004年报价的1.5倍。甲公司2006年的产值是2400万元,2005年的产值是2000万元,则该公司的产值发展速度为120%,即产值增长了20%(增长速度)。可以计算同比增长速度(与上年同期相比)。两个增长速度相减是增长的百分点。第28页,课件共110页,创作于2023年2月三、计算和运用相对指标应注意的问题1.分子分母指标必须具有可比性。2.要把相对指标与绝对指标结合运用。设有甲、乙两企业的产值资料如下(单位:万元):增长1%的绝对值=基期水平/100上例,甲每增长1%的绝对值=1000元,乙=10000元3.相对指标相互结合运用。一种相对指标只能说明某方面情况,如果各种相对指标结合起来研究,就可全面地说明情况。企业基期报告期发展速度甲1015150乙100150150第29页,课件共110页,创作于2023年2月第三节平均指标

数值平均数和位置平均数第30页,课件共110页,创作于2023年2月数值平均数

(概念要点)1.集中趋势的测度值之一2.最常用的测度值3.一组数据的均衡点所在4.易受极端值的影响5.用于数值型数据,不能用于定类数据和定序数据第31页,课件共110页,创作于2023年2月

算术平均数算术平均数是总体单位某一数量标志值之和除以总体单位总量(即总体单位数)。其计算公式为:例如,某企业2006年12月职工平均人数为500人,其工资总额为1000000元,则该企业职工月平均工资为2000元。第32页,课件共110页,创作于2023年2月算术平均数可分为简单算术平均数和加权算术平均数。简单算术平均数:若总体资料未进行分组,则先计算总体标志总量,再用总体单位数去除,计算的结果为简单算术平均数。其计算公式为:式中,表示算术平均数;x表示各单位的标志值;n表示总体单位数;∑x表示总和。例如,某生产小组有6人,某天生产的产品零件数分别为12件,14件,13件,12件,16件,11件,则平均每人日生产零件数为:78/6=13(件)第33页,课件共110页,创作于2023年2月加权算术平均数:若总体资料已经分组,编成分配数列,这时将各组标志值乘以相应的次数,然后加总求和,再除以总次数(总体单位数),所得结果为加权算术平均数。其计算公式为:式中,表示加权算术平均数;x表示各组标志值;f表示各组标志值出现的次数(也称为权数);∑xf表示总体标志总量;∑f表示总体单位数。若分组资料为单项数列,则可直接按公式计算加权算术平均数;若分组资料是组距数列,则先计算组中值,用组中值代替各组标志值的一般水平,再计算加权算术平均数。第34页,课件共110页,创作于2023年2月加权算术平均数

(算例)表4-1某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计—506160.0【例】根据表3-5中的数据,计算50名工人日加工零件数的均值第35页,课件共110页,创作于2023年2月算术平均数的数学性质1)各标志值与算术平均数的离差之和等于零。即

未分组资料:∑(x-)=0

分组资料:∑(x-)f=02)各标志值与算术平均数的离差平方和等于最小值。即

未分组资料:∑(x-)2=最小值分组资料:∑(x-)2f=最小值

这两个性质是进行趋势预测、回归预测、建立数学模型的重要数学理论依据,在以后的章节中还会碰到。第36页,课件共110页,创作于2023年2月加权算术平均数

(权数对均值的影响)

甲乙两组各有10名学生,他们的考试成绩及其分布数据如下甲组:考试成绩(X): 020100

人数分布(F):118

乙组:考试成绩(X): 020100

人数分布(F):811X甲0×1+20×1+100×8n10i=1Xi82(分)X乙0×8+20×1+100×1n10i=1Xi12(分)第37页,课件共110页,创作于2023年2月

调和平均数调和平均数是总体各单位标志值倒数的算术平均数的倒数,也称倒数平均数。调和平均数按其计算方法不同,可分为简单调和平均数和加权调和平均数。(1)简单调和平均数(2)加权调和平均数

m表示调和平均数的权数。第38页,课件共110页,创作于2023年2月调和平均数的特点:

调和平均数也容易受极端数值的影响,而且受极小值的影响大于受极大值的影响。调和平均数的应用范围较小,当变量值中有一项为0时,无法计算调和平均数。调和平均数的运用:

在社会经济领域中,调和平均数经常作为算术平均数的变形使用。主要适用于质量指标求平均。

如果知道该质量指标的分子资料,则用加权调和平均数公式计算该指标的平均数;如果知道该质量指标的分母资料,则用加权算术平均数公式计算该指标的平均数。第39页,课件共110页,创作于2023年2月

练一练:已知某商品在三个集市贸易市场上的平均价格及销售量资料如下,求该商品在市场上的总平均价格(提示:总平均价格=销售总额÷总销售量,已知分母总销售量,应用加权算术平均数)解:市场平均价格(元/千克)销售量(千克)甲2.0030000乙2.5020000丙2.4025000合计-----75000第40页,课件共110页,创作于2023年2月

练一练:已知某商品在三个集市贸易市场上的平均价格及销售量资料如下,求该商品在市场上的总平均价格(提示:总平均价格=销售总额÷总销售量,已知分子销售总额,应用加权调和平均数)解:市场平均价格(元/千克)销售额(元)甲2.0060000乙2.5050000丙2.4060000合计-----170000第41页,课件共110页,创作于2023年2月3.几何平均数

几何平均数是n个比率乘积的n次方根,即把若干个变量连乘,得其乘积再开n次方根。社会经济统计中,几何平均数适用于计算平均比率和平均速度。几何平均数按计算方法不同分为简单几何平均数和加权几何平均数。(1)简单几何平均数

式中,表示几何平均数;x表示变量值;n表示变量值个数;∏为连乘符号(2)加权几何平均数第42页,课件共110页,创作于2023年2月

社会经济现象用几何平均法计算平均数应满足两个条件:(1)若干个比率或速度的乘积等于总比率或总速度。(2)相乘的各比率或速度不得为负值。第43页,课件共110页,创作于2023年2月几何平均数

【例】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。平均收益率=103.84%-1=3.84%第44页,课件共110页,创作于2023年2月位置平均数

众数集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数主要用于定类数据,也可用于定序数据和数值型数据第45页,课件共110页,创作于2023年2月众数

(众数的不唯一性)无众数

原始数据:10591268一个众数

原始数据:659855多于一个众数

原始数据:25

2828

36

4242第46页,课件共110页,创作于2023年2月定类数据的众数表3-1某城市居民关注广告类型的频数分布

广告类型人数(人)比例频率(%)

商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100【例】根据表3-1中的数据,计算众数解:这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即

Mo=商品广告第47页,课件共110页,创作于2023年2月定序数据的众数【例】根据表3-2中的数据,计算众数解:这里的数据为定序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即

Mo=不满意表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)

非常不满意

不满意

一般

满意

非常满意24108934530836311510合计300100.0第48页,课件共110页,创作于2023年2月数值型分组数据的众数1.众数的值与相邻两组频数的分布有关4.该公式假定众数组的频数在众数组内均匀分布2.相邻两组的频数相等时,众数组的组中值即为众数Mo3.相邻两组的频数不相等时,众数采用下列近似公式计算MoMo第49页,课件共110页,创作于2023年2月数值型分组数据的众数表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】根据表3-5中的数据,计算50名工人日加工零件数的众数第50页,课件共110页,创作于2023年2月

练一练:某校计算机专业毕业学生实习月工资统计如下,求众数解:首先确定众数组,人数最多者为25人,对应组为1100-1400,则该组为总数所在组。根据下限公式:根据上限公式:月工资(元)学生数(人)月工资(元)学生数(人)500以下11400-170014500-80091700-20007800-1100182000以上41100-140025第51页,课件共110页,创作于2023年2月中位数和分位数第52页,课件共110页,创作于2023年2月中位数集中趋势的测度值之一排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于定序数据,也可用数值型数据,但不能用于定类数据各变量值与中位数的离差绝对值之和最小,即第53页,课件共110页,创作于2023年2月中位数

(位置的确定)未分组数据:组距分组数据:第54页,课件共110页,创作于2023年2月未分组数据的中位数

(计算公式)第55页,课件共110页,创作于2023年2月定序数据的中位数【例】根据第三章表3-2中的数据,计算甲城市家庭对住房满意状况评价的中位数解:中位数的位置为:

300/2=150从累计频数看,中位数的在“一般”这一组别中。因此

Me=一般表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—第56页,课件共110页,创作于2023年2月数值型未分组数据的中位数

(5个数据的算例)原始数据:

2422212620排序:

2021222426位置:

12

3

45中位数

22第57页,课件共110页,创作于2023年2月数值型未分组数据的中位数

(6个数据的算例)原始数据:

105 91268排序:

56891012位置:

123

4

56位置N+126+123.5中位数8+928.5第58页,课件共110页,创作于2023年2月根据位置公式确定中位数所在的组采用下列近似公式计算3.

该公式假定中位数组的频数在该组内均匀分布数值型分组数据的中位数

(要点及计算公式)第59页,课件共110页,创作于2023年2月数值型分组数据的中位数

(算例)表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】根据表3-5中的数据,计算50名工人日加工零件数的中位数第60页,课件共110页,创作于2023年2月四分位数

(概念要点)1. 集中趋势的测度值之一2. 排序后处于25%和75%位置上的值3.不受极端值的影响4.主要用于定序数据,也可用于数值型数据,但不能用于定类数据QLQMQU25%25%25%25%第61页,课件共110页,创作于2023年2月下四分位数(QL)位置=N+14上四分位数(QU)位置=3(N+1)4四分位数

(位置的确定)未分组数据:组距分组数据:下四分位数(QL)位置

=N4上四分位数(QL)位置

=3N4第62页,课件共110页,创作于2023年2月定序数据的四分位数

(算例)【例】根据表3-2中的数据,计算甲城市家庭对住房满意状况评价的四分位数解:下四分位数(QL)的位置为:

QL位置=(300)/4=75

上四分位数(QL)的位置为:

QU位置=(3×300)/4=225从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中。因此

QL

=不满意

QU

=一般表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—第63页,课件共110页,创作于2023年2月数值型未分组数据的四分位数

(7个数据的算例)原始数据:

2321 3032 282526排序:

2123

2526283032位置:

123 4567

N+1QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=30第64页,课件共110页,创作于2023年2月数值型未分组数据的四分位数

(6个数据的算例)原始数据:

232130282526排序:212325262830位置:1 234 56QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)

=28.5第65页,课件共110页,创作于2023年2月数值型分组数据的四分位数

(计算公式)上四分位数

下四分位数:

第66页,课件共110页,创作于2023年2月数值型分组数据的四分位数

(计算示例)QL位置=50/4=12.5QU位置=3×50/4=37.5表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例】根据表3-5中的数据,计算50名工人日加工零件数的四分位数第67页,课件共110页,创作于2023年2月众数、中位数和数值平均数的比较第68页,课件共110页,创作于2023年2月众数、中位数和数值平均数的关系对称分布

数值平均数=中位数=众数左偏分布数值平均数

中位数

众数右偏分布众数

中位数

数值平均数第69页,课件共110页,创作于2023年2月

三、各种平均数之间的关系1.在对称正态分布时有:Mo=Me=2.在非对称正态分布时,三者之间有差异。当变量的次数分布左偏时,有Mo>Me>;当变量的次数分布右偏时,有Mo<Me<。英国统计学家卡尔.皮尔逊根据其经验认为:当正态分布适度偏态时,三者之间还存在如下的近似关系:第70页,课件共110页,创作于2023年2月第71页,课件共110页,创作于2023年2月平均指数及其所适用的数据类型表4-4平均指数及其所适用的数据类型数据类型定类数据定序数据定距数据定比数据适用的指标类型※众数※中位数数值平均数数值平均数—四分位数众数调和平均数—众数中位数几何平均数——四分位数

中位数———四分位数———众数第72页,课件共110页,创作于2023年2月第四节离散程度的测度一、定类数据:异众比率(不要求)二、定序数据:四分位差三、定距和定比数据:极差、平均差、方差及标准差四、相对离散程度:离散系数第73页,课件共110页,创作于2023年2月离中趋势数据分布的另一个重要特征离中趋势的各测度值是对数据离散程度所作的描述反映各变量值远离其中心值的程度,因此也称为离中趋势从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值第74页,课件共110页,创作于2023年2月定序数据:四分位差

(概念要点)1. 离散程度的测度值之一2. 也称为内距或四分间距3. 上四分位数与下四分位数之差

QD=QU-QL4. 反映了中间50%数据的离散程度5.不受极端值的影响6.用于衡量中位数的代表性第75页,课件共110页,创作于2023年2月四分位差

(定序数据的算例)【例】根据表3-2中的数据,计算甲城市家庭对住房满意状况评价的四分位差解:设非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5已知QL=不满意=2,

QU=

一般=

3四分位差:

QD=QU=

QL

=3–2

=1表3-2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意

一般

满意

非常满意2410893453024132225270300合计300—第76页,课件共110页,创作于2023年2月数值型数据:

极差、平均差、方差和标准差第77页,课件共110页,创作于2023年2月极差(或全距)

(概念要点及计算公式)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布7891078910未分组数据

R

=max(Xi)-min(Xi).=组距分组数据

R

最高组上限-最低组下限5.计算公式为第78页,课件共110页,创作于2023年2月例.两组工人的工资数据(单位;元)如下:甲:900100011001200128014802000乙:1200125014001500156017001750

工资的全距,甲组为1100元,乙组为550元,说明甲组工人工资水平差别比乙组工人工资水平差别大。第79页,课件共110页,创作于2023年2月

1991-2004年上证指数的全距第80页,课件共110页,创作于2023年2月极差(全距)的优缺点优点:计算简单。缺点:但提供的信息不全面。不能全面反映标志值的离散程度。如果极端数值相差较大,而中间数值分布比较均匀时,全距便不能确切反映其离散程度。第81页,课件共110页,创作于2023年2月平均差

(概念要点及计算公式)1.离散程度的测度值之一2.各变量值与其均值离差绝对值的平均数3.能全面反映一组数据的离散程度4.数学性质较差,实际中应用较少5.计算公式为未分组数据组距分组数据第82页,课件共110页,创作于2023年2月平均差

(计算过程及结果)表4-5某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)|Xi-X||Xi-X|Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合计—50—312【例】根据表3-5中的数据,计算工人日加工零件数的平均差第83页,课件共110页,创作于2023年2月方差和标准差1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012X=8.3第84页,课件共110页,创作于2023年2月总体方差和标准差

(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式第85页,课件共110页,创作于2023年2月总体标准差

(计算过程及结果)表4-6某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计—50—3100.5【例】根据表3-5中的数据,计算工人日加工零件数的标准差第86页,课件共110页,创作于2023年2月样本方差和标准差

(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!第87页,课件共110页,创作于2023年2月样本方差

自由度(degreeoffreedom)1.一组数据中可以自由取值的数据的个数2.当样本数据的个数为n时,若样本均值x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x

=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值4.样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量第88页,课件共110页,创作于2023年2月样本方差

(算例)原始数据:

10 591368第89页,课件共110页,创作于2023年2月样本标准差样本标准差原始数据:

10591368第90页,课件共110页,创作于2023年2月方差

(简化计算公式)样本方差总体方差第91页,课件共110页,创作于2023年2月方差

(数学性质)各变量值对均值的方差小于对任意值的方差设X0为不等于X的任意数,D2为对X0的方差,则第92页,课件共110页,创作于2023年2月相对离散程度:离散系数第93页,课件共110页,创作于2023年2月(六)离散系数在比较两个数列的平均数代表性大小时,如果它们的平均水平不同或计量单位不同,就不能用前述的标志变异指标直接比较它们的差异程度,而应该用标志变异指标的相对指标即离散系数进行比较。1.平均差系数2.标准差系数第94页,课件共110页,创作于2023年2月1. 标准差与其相应的均值之比2. 消除了数据水平高低和计量单位的影响3. 测度了数据的相对离散程度4. 用于对不同组别数据离散程度的比较第95页,课件共110页,创作于2023年2月离散系数

(实例和计算过程)表4-7某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)X1销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表4.7。试比较产品销售额与销售利润的离散程度第96页,课件共110页,创作于2023年2月离散系数

(计算结果)X1=536.25(万元)S1=309.19(万元)V1=536.25309.19=0.577S2=23.09(万元)V2=32.521523.09=0.710X2=32.5215(万元)结论:

计算结果表明,V1<V2,说明产品销售额的离散程度小于销售利润的离散程度第97页,课件共110页,创作于2023年2月数据类型与离散程度测度值表4-8数据类型和所适用的离散程度测度值数据类型定类数据定序数据定距数据或定比数据适用的测度值※四分位差※方差或标准差※离散系数(比较

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论