第四章统计数据描述.电子教案教学课件_第1页
第四章统计数据描述.电子教案教学课件_第2页
第四章统计数据描述.电子教案教学课件_第3页
第四章统计数据描述.电子教案教学课件_第4页
第四章统计数据描述.电子教案教学课件_第5页
已阅读5页,还剩59页未读 继续免费阅读

付费下载

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章

统计数据描述

了解总量指标和相对指标的意义,作用和种类,掌握其计算方法和运用原则,并能正确地计算和应用

.

了解平均指标的意义和作用,掌握各种平均指标计算方法和特点及应用原则,能够灵活,准确地运用平均数。

了解标志变异指标的意义和作用,掌握各种标志变异指标的性质和计算方法并能恰当地运用。

学习目的第四章统计数据描述

第一节总量指标与相对指标第二节集中趋势第三节离中趋势第四节偏态与峰度第五节课程实验问题的提出

【哪名运动员的发挥更稳定】奥运会女子10米气手枪比赛中,每个运动员首先进行每组10枪共4组的预赛,然后根据预赛总成绩确定进入决赛的8名运动员。决赛时8名运动员再进行10枪射击,再将预赛成绩加上决赛成绩确定最后的名次。在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表:最后的比赛结果是,中国运动员郭文珺凭借决赛的稳定发挥,以总成绩492.3环夺得金牌,预赛排在第1名的俄罗斯运动员纳塔利娅·帕杰林娜以总成绩489.1

环获得银牌,预赛排在第4名的格鲁吉亚运动员妮诺·萨卢克瓦泽以总成绩487.4环的成绩获得铜牌,而预赛排在第3名的蒙古运动员卓格巴德拉赫·蒙赫珠勒仅以479.6环的成绩名列第8名。由此可见,在射击比赛中,运动员能否取得好的成绩,发挥的稳定性至关重要。那么,怎样评价一名运动员的发挥是否稳定呢?

第一节总量指标与相对指标一、总量指标的概念和种类(一)总量指标的概念

总量指标是表明社会经济现象在一定的时间、地点、条件下的规模或水平的统计指标。例如,一个国家或地区在一定时点上的人口数、土地面积数、生产设备数、物资库存数等等;在一定时期内的工农业总产值、主要产品产量、工资总额、国民收入等等。其中,土地面积、人口数等,标志着一个国家或地区的规模大小;工农业总产值,主要产品产量标志着一个国家或地区生产水平的高低。(二)总量指标的分类

按其反映的时间状况

时期指标

时点指标

按其反映的内容不同

个体单位总量

(反映现象在一段时间内活动过程的成果)(反映现象在某一时刻(瞬间)的状况)总体单位总量

(反映总体中单位数的总量指标)(反映总体中某一数量标志总量指标)时期指标和时点指标各有不同的特点

第一、时期指标的数值可以连续计数,它的每个数值都说明现象在这一时期内发生的总量

第二、时期指标的各期数值直接相加可以说明较长时期内现象发生的总量,而时点指标的数值直接相加除在有关指标的计算过程中需要运用外,没有实际意义。

第三、同一总体时期指标的数值大小与时间的长短具有直接关系,如一个季度的销售额必然大于一个月的销售额;而时点指标的数值大小与时点间的间隔长短没有直接联系。

(三)总量指标的计量单位

根据统计研究目的和反映现象的不同性质,总量指标的计量单位一般有实物量单位、价值量单位两种形式。是根据事物的属性和特点而采用的计量单位。实物量单位:是用货币量计量总量的一种计量单位。

价值量单位:

是按照被研究现象的自然状况来度量其数量的一种计量单位。

是按照统一的度量衡标准对现象实物量进行度量的一种计量单位。

是根据某些事物的物理化学性质专门规定的计量单位。

是两个(或多个)单位结合使用时的计量单位。

是把那些品种、规格、性能或化学成份含量不同的同类产品,按一定的折合标准,折算为标准规格或标准含量的产品。

自然计量单位:标准实物单位:复合单位:专用单位:度量衡单位:实物量单位价值量单位是用货币量计量总量的一种计量单位。例如,把各种产品的生产量乘以其相应的价格,即得到现象的价值量。价值量单位综合能力强,它可以把不能直接相加的经济现象的数量变得可以相加,用以综合说明各种不同的经济现象的总规模、总水平。价值量指标所使用的价格有两种,即现行价格和不变价格。按现行价格计算的价值量指标可以反映国民经济实际发展的状况,并可研究生产,分配、消费、积累等国民经济重大比例关系。对检查计划、制定政策,进行微观管理具有重要作用。按不变价格计算的价值量指标则可以消除各个时期价格变动的影响,既便于横向、纵向对比,又能反映总体实物量的变化。相对指标是两个相互联系的指标数值的比率。它是用来说明现象间所固有的数量对比关系的综合指标。例如,产品合格率、生产设备利用率等等。相对指标一般是无名数。通常用系数、倍数、成数、百分数、千分数表示。但也有一种相对指标表示为有名数,它是在进行对比的两个数值带有不同单位时产生的,因此它表现为复名数,例如人口密度就是用“人/平方公里”来表示的。

二、相对指标的概念及其计算方法(一)相对指标的概念与名数(二)相对指标的计算方法相对指标是两个有联系的数值之比,以反映相关事物之间的数量关系。由于研究目的和分析角度不同,因此它们之间的联系便不同,形成了各种相对指标。在统计中,一般将其归为以下几种,即计划完成情况相对指标,结构相对指标,比例相对指标,比较相对指标,强度相对指标,动态相对指标,现分别介绍如下:1.计划完成相对指标计划完成相对指标是用来检查、监督计划执行情况的基本指标之一,常以百分数表示,又称为计划完成百分比。其计算公式为:

计划完成相对数=

超额(或为完成)的绝对值=实际完成数-计划任务数例如:某商店某月计划销售额为400万元,实际完成444元,则计划完成情况相对指标为:

计划完成相对数===111%

超额的总量指标=实际完成数-计划任务数=444-400=44万元计算结果说明该商店某月超额完成销售额计划11%,超额44万元。400444计划任务数不仅可以用总量指标表示,而且可以用相对指标和平均指标表示。当计划指标为相对指标时,其计算公式为:计划完成相对数=

(3.3)这种方法适用于考核各种现象的增长率、降低率的计划完成情况。例如:某企业某种产品单位成本计划规定比上期降低7%,实际单位成本比上期降低8.5%,则其计划完成程度为:这个数值表明实际成本比计划任务降低了1.61%。应当指出,例中下达的计划数是以比上期增长或减少百分之几的形式出现的。但是在计算计划完成相对指标中,不能以实际降低率除以计划降低率,而应当包括原有基数在内。==98.39%计划完成相对数=2.结构相对指标结构相对指标是运用分组法,将总体内部区分为不同性质的若干部分,以部分数值与总体数值对比求得的比重或比率,以反映总体内部的组成状况的计算方法。其公式为:结构相对数=例3-1某地区城镇居民家庭平均每天消费支出如下:100.003408合计46.9716.815.224.714.669.068.843.731600.68572.88177.96160.44158.88308.88301.20127.08食品类衣着类设备用品及服务医疗保健交通和通讯娱乐文教服务居住杂项商品和服务消费结构消费性支出某地区城镇居民家庭平均每人消费支出及其结构从表中的消费结构可以看出,恩格尔系数比前些年有所下降,居民消费支出不仅仅局限于食物支出,在娱乐服务、居住等方面都已占有了一定的比重。3.比例相对指标比例相对指标是总体中的一部分数值与总体中的另一部分数值相比,反映总体内各组成部分之间的数量关系。因此它所表明的是结构性比例。比例相对指标的计算公式为:

比例相对指标=比例相对指标除可以用百分数表示外,还可以用比例数表示。比例相对指标有单项比和多项连比两种形式,用以反映总体中两个单项之间或多项之间的数量对比关系。如生产的料、工、费、的比例,就是多项连比。表现形式为1:m:n。比例相对指标可用于研究国民经济中一些重要的比例关系,例如积累与消费的比例,农、轻、重的比例关系等等。4.比较相对指标比较相对指标是由不同空间的同类指标对比而确定的相对指标,用来说明某种现象在同一时期内各单位发展的差异程度。

比较相对指标=比较相对指标可用于不同国家、地区、单位间的横向比较,也可以用于先进和落后的比较,还可和标准水平或平均水平比较。5、强度相对指标强度相对指标是同一时期两个有联系的不同总体的数值之比,说明某一现象在一定情况下的强度、密度或普及程度。

强度相对指标=

强度相对指标的表现形式一般为复合单位。但也有些强度相对指标用百分数或千分数表示的。强度相对指标,一般有正指标和逆指标(反指标)两种,指标数值越大说明现象的强度、密度或普及程度越高的,称之为正指标;相反,指标数值越大说明现象的强度、密度或普及程度越低的,称之为逆指标。

6.动态相对指标动态相对指标是同一现象不同时期指标数值对比关系的相对指标,说明现象的发展速度和增长速度,一般用百分数和倍数表示。其公式为:

动态相对指标=

指数也是一种动态相对指标,如股价指数等。发展速度也是一种动态相对指标,通常把用来作为比较标准的时期称为基期,把和基期对比的时期称为报告期。

如两个相比的数值中分子很大分母很小时,计算结果可用倍数表示。反之,如分子很小时,也可用千分数表示。三、应用相对指标的原则

可比性原则在使用相对指标时,要注意相对指标分子、分母之间的可比性,即分子、分母所包含的内容、范围、价格和计算方法以及结构方面是否可比。总量指标与相对指标结合运用原则在反映社会经济现象中,只用总量指标不易看清事物的差别程度,只用相对指标又看不出这种差别的绝对水平。因此,在许多情况下,利用相对指标进行统计分析时,必须将相对指标和总量指标结合运用,才能得到对现象的完整认识。第二节集中趋势的测定

一、集中趋势的涵义(一)总体分布的特征总量指标与相对指标只是为认识总体,进行分析提供基础数据,还需要利用次数分布来直观、形象地认识与分析现象的数量规律性。然而,在有些情况下,人们并不满足于这种直观的认识,而是将次数分布概括为三、四个数量特征值,并用一定的测定指标将其描述出来。一般来说,将这几个数量特征称之为集中趋势、离中趋势、分布形态(偏态和峰度)。集中趋势离中趋势

分布趋势集中趋势是次数分布的第一个也是最为重要的数量特征,它能够揭示总体中众多个观察值所围绕与集中的中心,是总体中的共性特征的反映。离中趋势是指次数分布中各个观察值的分散程度或与中心位置的离中程度,它从另一个侧面来说明总体的次数分布特征,进而描述总体的数量规律性。集中趋势与离中趋势是认识总体现象数量特征的两个方面,然而在实际研究时仍要考虑总体次数分布的形态。这是因为分布形态不同,集中趋势与离中趋势所反映的含义不同,集中趋势与离中趋势所发生的作用不同,算术平均数的代表性也不同。(二)集中趋势的涵义

集中趋势是指一组数据向某一点集中的情况。测定集中趋势也就是寻找数据一般水平的代表值。常用的测定集中趋势的特征量有数值平均数和位置平均数两大类。数值平均数即统计数列中任何一项数据的变动,都将在一定程度上影响到平均数结果,也就是根据所有变量值来计算的,如算术平均数。位置平均数,通常不是对数列中的所有各项数据进行计算的结果,而是根据总体中处于特殊位置上的个别单位或部分单位的标志值来确定的代表值,因此,某些数据的变动,不一定会影响到位置平均数的水平,如中位数、众数。尽管如此,位置平均数对整个总体仍具有非常直观的代表性。二、常用的几种平均数概念 计算公式 特点 优点:①容易理,便于计算

②灵敏度高

③稳定性好

和缺点:①易受极值影响

②在偏斜分布和U形分布中,不具有代表性1.算术平均数()标志总量与总体单位总数的比值 简单:加权:(4.9)(4.10)例4-2:现有某公司各地区销售额如表4—3所示,试计算该公司各地区平均销售额。330500474—合计

35750195000675002275067502750143260541331

25075012501750225027500~500500~10001000~15001500~20002000~25002500~3000xƒ地区数ƒ组中值x销售额(万元)x由于表4—3中是组距式的分组资料。所以应先求出组中值,然后用各组的销售额和相应的地区数相乘求出各组销售总额,再将各组销售总额和各组地区数分别汇总(、)最后将这两个数值代入公式,便可得到全公司的销售额。解:利用计算表得

即全公司的销售额是697.26万元。从上面的计算可以看出,算术平均数679.26万元是各组标志值和地区数两个因素作用的结果。从各组标志值的位置看,销售额应接近居于中间位置的1500万元左右,然而结果却是697.26万元。显然这主要是由于各地区数,即权数作用的结果。

===697.26万元

所谓权数,是指能够权衡各组标志值在总体中作用大小的数值,它能反映其所对应的标志值在总体中的重要性如何。权数越大,它所对应的标志值在总体中所起的作用就越大,这个标志值越接近于平均指标;反之,权数越小,它所对应的标志值在总体中所起的作用便越小,这个标志值与平均指标的距离便越远。

权数按其确定方式不同可分为客观权数和主观权数。前者是指客观存在的,具有一定具体内容的权数。例4-2利用相对权数计算平均指标相对权数697.263305001474—合计75.42411.39142.4148.0014.245.80357501950006750022750675027500.301690.548520.113920.027430.006330.0021114326054133125075012501750225027500~500500~10001000~15001500~20002000~25002500~3000销售额χƒ绝对权数ƒ组中值χ销售额(万元)=

==697.26万元常用的几种平均数概念 计算公式 特点 优点:①灵敏度高②在某种不能计算的条件下,可以代替

缺点:①不易理解

②易受极值影响

③有“0”值时不能计算

2.调和平均数()标志值倒数平均数的倒数简单:加权:=例4-3某汽车先以每小时75公里的速度行驶225公里,余下160公里以80公里的时速驶完。试计算该汽车跑完全部385公里行程的平均速度:行驶速度(公里/小时)行驶里程(公里)

行驶时间(小时)5385合计322251607580平均行驶速度===77公里/小时

常用的几种平均数概念 计算公式 特点 优点:灵敏度高

②受极值影响小于和

③适宜于各比率之积为总比率的变量求平均缺点:①有“0”或负值时不能计算

②偶数项数列只能用正根3.几何平均数()几个变量值连乘积的几次根简单:加权:公式两边各取对数,则为:

=例4-6

投资银行某笔投资是按复利计算的,25年间年利率的分配情况是:有1年为3%,有4年为5%,有8年为8%,有10年为10%,有2年为15%。求平均年利率。

计算平均年利率,必须先将各年的利率加上100%,换算为各年的本利率;然后按加权几何平均数的方法,计算平均年本利率;再减去100%,得出平均年利率。

=2.0360

=108.6%

这就是说,25年间年平均利率为108.6%。因而,年平均利率为8.6%。常用的几种平均数概念 计算公式 特点 5.众数(Mo)分配数列中出现次数最多的标志值位置平均数 上限公式:下限公式:优点:①容易理解,

②不受极值影响缺点:①灵敏度和计算功能差

②稳定性差

③具有不唯一性例4-11某集团各地区彩电销售额资料如表4-9所示,计算中位数。474合计4743317117411434034574704734741432605413310-500500-10001000-15001500-20002000-25002500-3000向下累计数向上累计数绝对权数f销售额(万元)x

例4-7根据下列资料计算众数。474合计143260541331500500—10001000—15001500—20002000—25002500—3000绝对权数f销售额(万元)x由于表4—11中第二组出现的次数最多,所以第二组是众数组。根据众数组可得如下资料:

L=500U=1000i=500△1=260-143=117△2=260-54=206

将左边资料代入下限公式与上限公式得:

m0=L+

=681.11万元

m0=U-

=681.11万元计算机购买频率

常用的几种平均数概念 计算公式 特点 5.中位数(Me)标志值由小到大顺序排列中居中间位置的标志值位置平均数 上限公式:下限公式:优点:①容易理解,

②不受极值影响③适宜于开口组资料和些不能用数字测定的事物缺点:①灵敏度和计算功能差

②间断数Me从表中的次数合计可知,中位数应当位于的位置。根据向上累计次数可知,第237位置居于第二组,其累计次数为403,包含第237个。由此可知第二组为中位数组。根据中位数组,可得如下资料:=L=500U=1000=

260=143=71

=474i=500将左边资料代入下限公式与上限公式得:利用下限公式:==680.77万元

利用上限公式:=680.77万元

概念 计算公式 6.四分位数四分位数也称四分位点,处在分位点上的数值就是四分位数。 Q1的位置=Q3的位置=未分组Q1L1+Q3L3+

已分组(3.17)(3.18)(3.19)(3.20)例4-13

根据表4-9中数据,计算该公司各地区销售额的四分位数。解:

Q1的位置===118.5,即在0-500这一组=355.5,即在500-1000这一组。Q3的位置==那么:

Q1

L1+0+414.34万元L3+500+908.65万元Q3三算术平均数、中位数、众数的特点(一)三种平均指标的涵义不同算术平均数是应用最广泛的一种平均指标,它的数值是整个总体次数分布的中心或重心,这个中心点的两边具有相等的变量值之和,即相等的。由于它反映了整个总体的次数分布,所以既体现了各变量值的作用,也反映了各变量值次数的影响。中位数是一种位置平均指标,它从各变量值的顺序出发,将所有变量值分成相等的两部分,一部分数值比它大,一部分数值比它小。众数只表明曲线峰顶下的数值,即出现次数最多的数值。可见,所使用平均指标不同,对最后结果的解释也各不相同。(二)三种平均指标受极端值影响的程度不同

算术平均数所受影响最大,而中位数只考虑数值的位置,即中位数与数据个数多少有关,与极值无关,而众数则不受极值的影响。所以,在有极值出现的情况下,算术平均数并不是一个理想的平均指标,而中位数和众数则可以用来代表总体水平。(三)三种平均指标受非对称分布的影响程度不同在非对称的钟形分布情况下,平均指标、众数、中位数三者的差别取决于非对称的程度。非对称的程度越大,它们之间的差别愈大;非对称的程度愈小,它们之间的差别愈小。

众数是一组数据分布的峰值,不受极端值的影响。但缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜使用众数。众数主要适合作为定类数据的集中趋势测度值。中位数是一组数据中间位置上的代表值,不受极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为定序数据的集中趋势测度值。算术平均数是根据全部数据的计算所得,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。但其主要缺点是易受数据极端值的影响,对于偏态分布的数据,算术平均数的代表性较差。算术平均数主要适合作为定距数据和定比数据的集中趋势测度值。第三节离中趋势的测定、离中趋势的涵义和作用平均指标为描述总体次数分布的集中趋势,反映各个总体单位标志的一般水平,认识各单位的一般水平,认识各单位的共性特征提供了工具,但是,还必须认识次数分布的离中趋势,分析各单位的数量差异,才能全面地认识现象,揭示现象的数量规律性。对于一个次数分布来说,其离中趋势的形成是由于各个总体单位的差异形成的。差异来自于大量现象的异质性或多变性。标志变动度便反映总体各单位标志值的差异程度,是反映总体次数分布中各标志值的变动范围或离散程度的综合指标。

(一)离中趋势的涵义标志变动度的作用:1、标志变动度可以衡量平均指标的代表性平均指标作为总体某一数量标志的代表值,其代表性决定于总体中各标志值的差异程度。标志变动度可以说明平均指标的代表性的大小。

2、标志变动度可以反映社会经济活动过程的稳定性和均衡性标志变动度可以表明生产过程的节奏性、稳定性或其他经济活动过程的均衡性,进行产品质量控制和说明经济管理工作的质量。

3、标志变动度可以反映现象的质量与风险标志变动度越小,现象的质量越好;标志变动度越大,现象的质量越差。另外,标志变动度越小,对于某些现象来讲便越稳定,风险越小,

概念 计算特点数列中最大值与最小值之差1.全距(R)R=最大值-最小值优点:容易理解,计算方便缺点:不能反映全部数据分布状况2.平均差(A、D)各标志值与均值离差绝对值的算术平均 简单:加权:优点:反映全部数据分布状况缺点:取绝对值,数字上不尽合理 二、离中趋势的测定方法

概念 计算 特点 各标志值与均值离差平方的平均。方差的平方根(取正根)3.方差(σ2

)和标准差(σ) 优点:反映全部数据分布状况,数字上合理。缺点:受计量单位和平均水平影响,不便于比较4.标准差系数(Vσ)

标准差与均值之商,是无量纲的系数

简单:加权:优点:适宜不同数据集的比较缺点:对数据结构变化反应不灵敏 方差和标准差是应用最广泛的标致变异指标σ2和σ的简易计算公式250—合计4000—合计100107016004010025565

40020800060

006025-555

400-2040100-10501600-4020离差平方离差数据离差平方离差数据乙组甲组标准差计算表例4-16(一般平均法)以下表中甲、乙两组数据资料为例,列表计算标准差甲组:==28.28==7.07乙组:结果表明:在甲乙两组平均数相等的条件下,每个数据与其平均数的标准差,甲组为28.28,乙组为7.07。甲组的标准差大,即标志变动度大,因而其平均数的代表小;乙组的标准差比甲组小,因而其平均数的代表性比甲组大

(加权平均法)标准差计算表===42.50件==8.87件7875.00--4250100-合计3125.00156.2512.51100205550-60281.256.252.52025454540-501406.2556.25-7.5875253530-403062.50306.25-17.52501025离差平方x权数离差平方离差日总产量(件)工人数(人)组中值日产量分组(件)20-30

(三)三定则及其应用数理统计证明,在正态分布情况下:

可包括个体单位总量的68.27%

可包括个体单位总量的95.45%

可包括个体单位总量的99.73%以前面某车间100个工人日产量数据为例,已经计算出平均日产量=42.5件,标准差=8.87件,则有 =42.5 =42.5 =42.5即:有68.27%工人日产量在33.63件到51.37件之间;有95.45%工人的日产量在24.76件到60.24件之间;有99.73%工人的日产量在15.89件到69.11件之间。(四)四分位差四分位差是上四分位数与下四分位数的差值,也称为内距或四分间距。四分位差的计算公式为:

其中,表示上四分位数,表示下四分位数。(五)异众比率异众比率又称离异比率或变差比,是指非众数组的次数占总次数的比率。异众比率的计算公式为:其中,表示变量值的总次数,表示众数组的次数。(六)标准分数标准分数也称标准化值或Z分数,是指变量值与其算术平均数的离差除以标准差的值。它是测量每个数据在该组数据中相对位置的常用指标。设标准分数为,则有:

标准分数给出了一组数据中各数值的相对位置。例如,如果某个数值的标准分数为1.6,我们就知道该数值高于均值1.6倍的标准差。(七)变异系数

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论