第四章平均指标和变异指标课件_第1页
第四章平均指标和变异指标课件_第2页
第四章平均指标和变异指标课件_第3页
第四章平均指标和变异指标课件_第4页
第四章平均指标和变异指标课件_第5页
已阅读5页,还剩157页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学原理第四章平均指标与变异指标统计学原理第一节平均指标的概念和作用一、平均指标的概念同类社会经济现象在一定时间、地点条件下所达到的一般水平的综合指标。概括地描述统计分布的一般水平或集中趋势的数值。特点:代表性、抽象性平均指标=总体标志总量/总体单位数第一节平均指标的概念和作用一、平均指标的概念二、平均指标的作用(一)可以了解总体次数分布的集中趋势(二)可以对若干同类现象在不同单位、地区间进行比较研究(三)可以研究某一总体某种数值的平均水平在时间上的变化,说明总体的发展过程和趋势(四)可以分析现象之间的依存关系(五)平均指标可作为某些科学预测、决策和某些推算的依据二、平均指标的作用众数中位数平均数位置平均数数值平均数

算术平均数调和平均数几何平均数第二节平均指标众数平均数位置平均数数值平均数应用条件:资料未分组,各组出现的次数都是1。5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:一、算术平均数(mean)应用条件:资料未分组,各组出现的次数都是1。5名学生的学习成公式中,1、简单算术平均数

适用于未分组资料,用总体各单位标志值加总得到标志总量除以总体单位总量而得。计算公式为:代表算术平均数。

表示各单位标志值。表示总体单位数。一、算术平均数(mean)公式中,1、简单算术平均数代表算术平均数。表示各单位按家庭人口数分组(人)家庭数1234550150300200100合计800某村800个家庭人口数根据以下资料计算某村平均家庭人口数?按家庭人口数分组(人)家庭数150合计800某村802、加权算术平均数

(Weightedmean)

①根据单项数列计算加权算术平均数计算公式:应用条件:单项式分组,各组次数不同。2、加权算术平均数(Weightedmean)

例:某车间20名工人加工某种零件资料:

按日产量分组(件)x工人数(人)f日产总量xf

14

2

28

15

4

60

16

8

128

17

5

85

18

1

18合计

20

319求平均日产量例:某车间20名工人加工某种零件资料:②根据组距数列计算加权算术平均数应用条件:组距式分组,各组次数不同。按日产量分组(公斤)工人数f组中值x日产总量xf20—30

10

25

25030—40

70

35

245040—50

90

45

415050—60

30

55

1650合计

200

8400例:某车间200名工人日产量资料:求平均日产量②根据组距数列计算加权算术平均数应用条件:组距式分组,各组次权数对均值的影响

甲乙两组各有10名学生,他们的考试成绩及其分布数据如下

甲组:

考试成绩(x): 020100

人数分布(f):118

乙组:考试成绩(x): 020100

人数分布(f):811权数对均值的影响甲乙两组各有10名学生,他们的考试成绩在组距数列中,均值大小不仅受组中值大小的影响,也受权数的影响,因此()A.当组中值较大且权数较大时,均值接近组中值大的一方B.当组中值较小且权数较小时,均值接近组中值小的一方C.当组中值较大而权数较小时,均值接近组中值大的一方D.当组中值较小而权数较大时,均值接近组中值小的一方E.当各组的权数相同时,权数对均值的大小没有影响在组距数列中,均值大小不仅受组中值大小的影响,也受权数的影响

3、是非标志的平均数

是非标志:当总体单位某种品质标志的具体表现为“是”与“非”或“有”与“无”两种情况。

是非标志x单位数f比重

1

0

合计

N

1

平均数的计算:把具有某种特征的用“1”表示,不具有该种特征的用“0”表示。3、是非标志的平均数是非标志:当总体单位某种品质标志的例:某工厂生产某种产品合格率为95%,不合格率为5%,求是非标志平均数。例:某工厂生产某种产品合格率为95%,不3、算术平均数的数学性质(1)算术平均数与标志值个数的乘积等于各标志值的总和。简单算术平均数:加权算术平均数:3、算术平均数的数学性质(1)算术平均数与标志值个数的乘积(2)各个标志值与其算术平均数的离差之和等于零。简单算术平均数:加权算术平均数:(2)各个标志值与其算术平均数的离差之和等于零。(3)各标志值与算术平均数离差的平方和为最小值。(3)各标志值与算术平均数离差的平方和为最小值。4、算术平均数特点

1)集中趋势的最常用测度值2)一组数据的均衡点所在3)易受极端值的影响4)用于数值型数据,不能用于定类数据和定序数据4、算术平均数特点1)集中趋势的最常用测度值二、调和平均数例:一个人步行两里,走第一里时速度为每小时10里,走第二里时为每小时20里,则平均速度为?二、调和平均数例:一个人步行两里,走第一里时速度为每小时10二、调和平均数1.简单调和平均数:标志值的倒数的算术平均数的倒数。 二、调和平均数1.简单调和平均数:标志值的倒数菜场上有1元钱起售的蔬菜,若某人早上用1元钱购买了一种蔬菜共3斤,每斤0.33元;中午降价时又用1元钱买了4斤,每斤0.25元;晚上削价处理又用1元钱买了5斤,每斤0.2元。试问蔬菜平均每斤多少钱?菜场上有1元钱起售的蔬菜,若某人早上用1元钱购买了一种速度

x行走里程

m所需时间

20

1

15

2

10

3

合计

6

速度行走里程所需时间202.加权调和平均数缺少总体单位数计算公式:2.加权调和平均数缺少总体单位数例班组平均劳动生产率x实际工时产品产量(件)m一

10

100

1000二

12

200

2400三

15

300

4500四

20

300

6000五

30

200

6000合计

—1100

19900例班组平均劳动生产率x实际工时产品产量(件)一三、几何平均数(geometricmean)

1、简单几何平均数2、加权几何平均数应用条件:资料未分组(各变量值次数都是1)。计算公式:应用条件:资料经过分组,各组次数不同。计算公式:三、几何平均数(geometricmean)1、简单几车间投入量产出量合格率

%x一

1000

800

80二

800

720

90三

720

504

70例:某企业生产某种产品需经过三个连续作业车间才能完成。车间投入量产出量合格率一100080080年份累计存款额本利率%第1年105%第2年105%第3年108%………第10年112%例:将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率?设本金为年份累计存款额本利率%第1年105%第2年105%第3年10本利率x年数f

105%

2

108%

3

110%

3

112%

2合计

10平均年利率=8.77%本利率x年数f105%2108%三种平均数之间的关系H≤G≤X三种平均数之间的关系H≤G≤X四、众数(mode)1.定义:众数是指社会现象总体中最普遍出现的标志值。1)一组数据中出现次数最多的变量值2)适合于数据量较多时使用3)不受极端值的影响4)一组数据可能没有众数或有几个众数四、众数(mode)1.定义:众数是指社会现象总体中最普遍出众数(不惟一性)无众数

原始数据:10591268一个众数

原始数据:65

9855多于一个众数

原始数据:252828

364242众数(不惟一性)无众数

原始数据:1052.众数的确定1)单项式分配数列:出现次数最多的标志值2)组距式分配数列:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数的近似值。2.众数的确定4、单项式数列

不同品牌饮料的频数分布

饮料品牌频数比例百分比(%)

可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即

Mo=可口可乐4、单项式数列

不同品牌饮料的频数分布饮料品牌频数比例百分按日产量分组(件)工人数(人)2015213022202310按日产量分组(件)工人数(人)2015213022202314)组距式数列确定众数的公式下限公式:

上限公式:

4)组距式数列确定众数的公式下限公式:例:年人均纯收入(千元)农户数(户)5以下2405—64806—711007—87008—93209以上160合计3000农户年人均收入众数计算表例:年人均纯收入(千元)农户数(户)5以下2405—6480判断法则1、当众数相邻的两组次数相等时,则众数组的组中值就是众数;2、当众数组前一组的次数较多,后一组的次数较少时,则众数在众数组内靠近他的下限;3、当众数组后一组次数较多,前一组的次数较少时,则众数在众数组内靠近他的上限。判断法则1、当众数相邻的两组次数相等时,则众数组的组中值就是五、中位数(median)

1、中位数的含义:将总体各单位按其标志值大小顺序排列起来居于中间位置的那个数。2、确定中位数的方法(1)由未分组资料确定中位数排序找中间位置五、中位数(median)1、中位数的含义:将总体各单位按中位数?

【例】

9个家庭的人均月收入数据原始数据:

15007507801080850960200012501630排序:

75078085096010801250150016302000位置:1234

56789中位数1080中位数?

【例】9个家庭的人均月收入数据中位数中位数?【例】:10个家庭的人均月收入数据排序:

660

75078085096010801250150016302000位置:1234

5678910中位数?【例】:10个家庭的人均月收入数据1、未分组资料确定中位数的方法:将总体各单位的标志值按照大小顺序排列当总体单位数n为奇数时:当总体单位数n为偶数时:1、未分组资料确定中位数的方法:(2)分组数列确定中位数

——累计频数到50%所对应的变量值例:按日产量分组(件)x工人数(人)f累计次数向上累计向下累计20101080221525702430555526258025合计80——(2)分组数列确定中位数

——累计频数到50%所对应的变量定序数据的中位数解:中位数的位置为

300/2=150

从累计频数看,中位数在“一般”这一组别中中位数为

Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意不满意

一般

满意非常满意

2410893

4530

24132225270300合计300—定序数据的中位数解:中位数的位置为(3)由组距数列确定中位数计算公式(3)由组距数列确定中位数计算公式例年人均纯收入(千元)农户数(户)向上累计次数5以下2402405—64807206—7110018207—870025208—932028409以上1603000合计3000—(1)计算累计次数(2)确定中位数组(3)根据中位数计算公式计算中位数中位数位次:例年人均纯收入(千元)农户数(户)向上累计次数5以下24022、单项式分组资料确定中位数当为奇数时:,当为偶数时,3、组距式分组资料确定中位数下限公式: 上限公式:2、单项式分组资料确定中位数3、组距式分组资料确定中位数六、众数、中位数和平均数的比较

1、区别:1)

三者的含义不相同;2)

三者的计算(确定)方法不同;3)对数据的“灵敏度”和“概括能力”不同。六、众数、中位数和平均数的比较1、区别:2、联系:(1)

三者都是作为反映总体一般水平(或集中趋势)的平均指标:(2)

三者之间存在着一定的数量关系,A.在对称的正态分布条件下:算术平均数等于众数等于中位数:B.在非对称正态分布的情况下,众数、中位数和平均数三者的差别取决于偏斜的程度,偏斜的程度越大,它们之间的差别越大。

2、联系:3众数、中位数、和算术平均数和的关系对称分布左偏分布右偏分布众数、中位数和算术平均数数量关系的经验公式为:算术平均数和众数的距离约等于算术平均数与中位数距离的三倍:3众数、中位数、和算术平均数和的关系对称分布左偏分布右偏分七、其他分位数1、四分位数(quartile)

1)能够将总体单位按标志值大小等分为四部分的三个数值。(排序)2)不受极端值的影响3)主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QLQMQU25%25%25%25%七、其他分位数1、四分位数(quartile)QLQMQU2

(例题分析)解:QL位置=(300+1)/4=75.25QU位置=3×(300+1)/4=225.75

从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中四分位数为

QL

=不满意

QU

=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意一般

满意非常满意

2410894

4430

24132226270300合计300—

(例题分析)解:QL位置=(300+1)/4=75.数值型数据的四分位数【例】:10个家庭的人均月收入数据排序:

660

75078085096010801250150016302000位置:1234

5678910数值型数据的四分位数【例】:10个家庭的人均月收入数据数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型定类数据定序数据定距数据定比数据适用的测度值※众数※中位数※均值※均值—四分位数众数调和平均数—众数中位数几何平均数——四分位数中位数———四分位数———众数数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据第三节分布的离中趋势一、变异指标的含义与作用1.定义:变异指标以平均数为中心,总体各单位标志值的差异大小范围或离差程度的指标。变异指标值越大,表明总体各单位标志的变异程度越大。2.作用:(1)衡量平均指标的代表性。(2)研究总体标志值分布偏离正态的情况。(3)进行抽样推断等统计分析的一个基本指标。

第三节分布的离中趋势一、变异指标的含义与作用二、极差(全距)(range)1、一组数据的最大值与最小值之差2、易受极端值影响3、未考虑数据的分布7891078910

R

=max(xi)-min(xi)4、计算公式为例:5名学生的成绩为50、69、76、88、97。二、极差(全距)(range)1、一组数据的最大值与最小值之分位差

1)剔除了部分极端值计算的类似于极差的指标。

2)内四分位间距:QR=Q3-Q13)四分位差:QD=(Q3-Q1)/2分位差三、平均差标志值与其算术平均数离差平均值。实质:以算术平均数为中心,各标志值距平均数的平均距离。三、平均差标志值与其算术平均数离差平均值。第一组第二组XX-|X-|XX-|X-|20-404050-101025-353551-9930-303052-8835-252553-7750-101056-44701010600075151562228525257111119030307212121206060731313合计280合计76第一组第二组XX-|X-|XX-|X-|20-4四、方差与标准差(varianceandstandarddeviation)方差:各变量值与其均值离差平方的平均数。(一)数量标志的方差与标准差标准差:方差的平方根,也称均方差。1、数量标志的方差与标准差计算,其计算公式为:资料未分组:资料已分组:四、方差与标准差方差:各变量值与其均值离差平方的平均数。(一例:求产量的标准差日产量(件)209221230241269合计20例:求产量的标准差日产量(件)209221230241269练习:日产量(公斤)工人数f组中值x20—301025288030—407035343040—50904581050—6030555070合计200—12190练习:日产量(公斤)工人数f组中值x20—301025288

(1)变量的方差等于变量平方的平均数减去变量平均数的平方。2、方差与标准差的数学性质即:

(2)变量对算术平均数的方差小于对任何常数的方差。

(3)变量线性变换的方差等于变量的方差乘以变量系数的平方。(1)变量的方差等于变量平方的平均数减去变量平均数(二)是非标志的方差与标准差是非标志的平均数为P。标志值x单位数f10合计N由于标准差有良好的数学性质,它的应用最为广泛。(二)是非标志的方差与标准差是非标志的平均数为P。标志值x单例:某工厂生产某种产品合格率为95%,不合格率为5%,求是非标志的方差及标准差。例:某工厂生产某种产品合格率为95%,不合格率为5%,求五、变异系数

(coefficientofvariation)1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为五、变异系数

(coefficientofvariati变异系数某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度变异系数某管理局所属8家企业的产品销售数据企业编号产品销售额变异系数结论:计算结果表明,v1<v2,说明产品销售额的离散程度小于销售利润的离散程度v1=536.25309.19=0.577v2=32.521523.09=0.710变异系数结论:计算结果表明,v1<v2,说明产品销售额的离东方制造公司和西京自来水公司股票的报酬率及其概率分布情况详见下表,试计算两家公司的风险性大小。东方制造公司和西京自来水公司股票报酬率的概率分布经济情况该种经济情况发生的概率(pi)报酬率(Ki)西京自来水公司东方制造公司繁荣0.2040%70%一般0.6020%20%衰退0.200%-30%东方制造公司和西京自来水公司股票的报酬率及其概率分布情况详见比较两个公司职工的平均工资水平哪个更均衡。月工资额(元)甲公司人数乙公司人数1000以下1000~15001500~20002000以上10201555102510合计5050练习:比较两个公司职工的平均工资水平哪个更均衡。月工资额(元)1、原点矩:是K阶动差的一般形式,公式为:一、原点矩和中心矩

一阶E(X)=

二阶E(X2)=第四节偏度和峰度1、原点矩:是K阶动差的一般形式,公式为:一、原点矩和中心矩

2、中点矩:如果把原点移动到算术平均数的位置,就可以得到一个以频数分配各组标志值对平均数的K阶中心动差,即称中心矩。

2、中点矩:如果把原点移动到算术平均数的位置,就可二、偏度(一)概念变量数列偏斜程度的指标,分布不对称的方向和程度偏态系数=0为对称分布偏态系数>0为右偏分布偏态系数<0为左偏分布(二)计算公式二、偏度(一)概念变量数列偏斜程度的指标,分布不对称的方向和左偏分布右偏分布偏态分布的形状左偏分布右偏分布偏态分布的形状三、峰度(一)概念要点

1、变量数列顶部扁平程度的测度

2、峰度系数=3扁平程度适中

3、偏态系数<3为扁平分布

4、偏态系数>3为尖峰分布

(二)计算公式三、峰度(一)概念要点(二)计算公式扁平分布尖峰分布与标准正态分布比较!峰度分布的形状扁平分布尖峰分布与标准正态分布比较!峰度分布的形状例:已知1997年我国农村居民家庭按纯收入分组的有关数据如表。试计算偏态系数和峰度。1997年农村居民家庭纯收入数据按纯收入分组(百元)户数比重(%)5以下5~1010~1515~2020~2525~3030~3535~4040~4545~5050以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94例:已知1997年我国农村居民家庭按纯收入分组的有关数据如表农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组(百元)组中值Xi户数比重(%)Fi(Xi-X)3Fi(Xi-X)4Fi5以下5—1010—1515—2020—2525—3030—3535—4040—4545—5050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合计—1001689.2572521.25农村居民家庭纯收入数据偏态及峰度计算表按纯收入分组组中值户数根据上表数据计算得将计算结果代入公式得根据上表数据计算得将计算结果代入公式得户数比重(%)252015105偏态与峰度

(从直方图上观察)按纯收入分组(元)1000500←15002000250030003500400045005000→结论:1.为右偏分布

2.峰度适中户数比重252015105偏态与峰度

(从直方图上观察)按纯经常不断地学习,你就什么都知道。你知道得越多,你就越有力量StudyConstantly,AndYouWillKnowEverything.TheMoreYouKnow,TheMorePowerfulYouWillBe写在最后经常不断地学习,你就什么都知道。你知道得越多,你就越有力量写80ThankYou在别人的演说中思考,在自己的故事里成长ThinkingInOtherPeople‘SSpeeches,GrowingUpInYourOwnStory讲师:XXXXXXXX年XX月XX日ThankYou81统计学原理第四章平均指标与变异指标统计学原理第一节平均指标的概念和作用一、平均指标的概念同类社会经济现象在一定时间、地点条件下所达到的一般水平的综合指标。概括地描述统计分布的一般水平或集中趋势的数值。特点:代表性、抽象性平均指标=总体标志总量/总体单位数第一节平均指标的概念和作用一、平均指标的概念二、平均指标的作用(一)可以了解总体次数分布的集中趋势(二)可以对若干同类现象在不同单位、地区间进行比较研究(三)可以研究某一总体某种数值的平均水平在时间上的变化,说明总体的发展过程和趋势(四)可以分析现象之间的依存关系(五)平均指标可作为某些科学预测、决策和某些推算的依据二、平均指标的作用众数中位数平均数位置平均数数值平均数

算术平均数调和平均数几何平均数第二节平均指标众数平均数位置平均数数值平均数应用条件:资料未分组,各组出现的次数都是1。5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为:一、算术平均数(mean)应用条件:资料未分组,各组出现的次数都是1。5名学生的学习成公式中,1、简单算术平均数

适用于未分组资料,用总体各单位标志值加总得到标志总量除以总体单位总量而得。计算公式为:代表算术平均数。

表示各单位标志值。表示总体单位数。一、算术平均数(mean)公式中,1、简单算术平均数代表算术平均数。表示各单位按家庭人口数分组(人)家庭数1234550150300200100合计800某村800个家庭人口数根据以下资料计算某村平均家庭人口数?按家庭人口数分组(人)家庭数150合计800某村802、加权算术平均数

(Weightedmean)

①根据单项数列计算加权算术平均数计算公式:应用条件:单项式分组,各组次数不同。2、加权算术平均数(Weightedmean)

例:某车间20名工人加工某种零件资料:

按日产量分组(件)x工人数(人)f日产总量xf

14

2

28

15

4

60

16

8

128

17

5

85

18

1

18合计

20

319求平均日产量例:某车间20名工人加工某种零件资料:②根据组距数列计算加权算术平均数应用条件:组距式分组,各组次数不同。按日产量分组(公斤)工人数f组中值x日产总量xf20—30

10

25

25030—40

70

35

245040—50

90

45

415050—60

30

55

1650合计

200

8400例:某车间200名工人日产量资料:求平均日产量②根据组距数列计算加权算术平均数应用条件:组距式分组,各组次权数对均值的影响

甲乙两组各有10名学生,他们的考试成绩及其分布数据如下

甲组:

考试成绩(x): 020100

人数分布(f):118

乙组:考试成绩(x): 020100

人数分布(f):811权数对均值的影响甲乙两组各有10名学生,他们的考试成绩在组距数列中,均值大小不仅受组中值大小的影响,也受权数的影响,因此()A.当组中值较大且权数较大时,均值接近组中值大的一方B.当组中值较小且权数较小时,均值接近组中值小的一方C.当组中值较大而权数较小时,均值接近组中值大的一方D.当组中值较小而权数较大时,均值接近组中值小的一方E.当各组的权数相同时,权数对均值的大小没有影响在组距数列中,均值大小不仅受组中值大小的影响,也受权数的影响

3、是非标志的平均数

是非标志:当总体单位某种品质标志的具体表现为“是”与“非”或“有”与“无”两种情况。

是非标志x单位数f比重

1

0

合计

N

1

平均数的计算:把具有某种特征的用“1”表示,不具有该种特征的用“0”表示。3、是非标志的平均数是非标志:当总体单位某种品质标志的例:某工厂生产某种产品合格率为95%,不合格率为5%,求是非标志平均数。例:某工厂生产某种产品合格率为95%,不3、算术平均数的数学性质(1)算术平均数与标志值个数的乘积等于各标志值的总和。简单算术平均数:加权算术平均数:3、算术平均数的数学性质(1)算术平均数与标志值个数的乘积(2)各个标志值与其算术平均数的离差之和等于零。简单算术平均数:加权算术平均数:(2)各个标志值与其算术平均数的离差之和等于零。(3)各标志值与算术平均数离差的平方和为最小值。(3)各标志值与算术平均数离差的平方和为最小值。4、算术平均数特点

1)集中趋势的最常用测度值2)一组数据的均衡点所在3)易受极端值的影响4)用于数值型数据,不能用于定类数据和定序数据4、算术平均数特点1)集中趋势的最常用测度值二、调和平均数例:一个人步行两里,走第一里时速度为每小时10里,走第二里时为每小时20里,则平均速度为?二、调和平均数例:一个人步行两里,走第一里时速度为每小时10二、调和平均数1.简单调和平均数:标志值的倒数的算术平均数的倒数。 二、调和平均数1.简单调和平均数:标志值的倒数菜场上有1元钱起售的蔬菜,若某人早上用1元钱购买了一种蔬菜共3斤,每斤0.33元;中午降价时又用1元钱买了4斤,每斤0.25元;晚上削价处理又用1元钱买了5斤,每斤0.2元。试问蔬菜平均每斤多少钱?菜场上有1元钱起售的蔬菜,若某人早上用1元钱购买了一种速度

x行走里程

m所需时间

20

1

15

2

10

3

合计

6

速度行走里程所需时间202.加权调和平均数缺少总体单位数计算公式:2.加权调和平均数缺少总体单位数例班组平均劳动生产率x实际工时产品产量(件)m一

10

100

1000二

12

200

2400三

15

300

4500四

20

300

6000五

30

200

6000合计

—1100

19900例班组平均劳动生产率x实际工时产品产量(件)一三、几何平均数(geometricmean)

1、简单几何平均数2、加权几何平均数应用条件:资料未分组(各变量值次数都是1)。计算公式:应用条件:资料经过分组,各组次数不同。计算公式:三、几何平均数(geometricmean)1、简单几车间投入量产出量合格率

%x一

1000

800

80二

800

720

90三

720

504

70例:某企业生产某种产品需经过三个连续作业车间才能完成。车间投入量产出量合格率一100080080年份累计存款额本利率%第1年105%第2年105%第3年108%………第10年112%例:将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率?设本金为年份累计存款额本利率%第1年105%第2年105%第3年10本利率x年数f

105%

2

108%

3

110%

3

112%

2合计

10平均年利率=8.77%本利率x年数f105%2108%三种平均数之间的关系H≤G≤X三种平均数之间的关系H≤G≤X四、众数(mode)1.定义:众数是指社会现象总体中最普遍出现的标志值。1)一组数据中出现次数最多的变量值2)适合于数据量较多时使用3)不受极端值的影响4)一组数据可能没有众数或有几个众数四、众数(mode)1.定义:众数是指社会现象总体中最普遍出众数(不惟一性)无众数

原始数据:10591268一个众数

原始数据:65

9855多于一个众数

原始数据:252828

364242众数(不惟一性)无众数

原始数据:1052.众数的确定1)单项式分配数列:出现次数最多的标志值2)组距式分配数列:由组距数列确定众数,先确定众数组,再通过一定的公式计算众数的近似值。2.众数的确定4、单项式数列

不同品牌饮料的频数分布

饮料品牌频数比例百分比(%)

可口可乐旭日升冰茶百事可乐汇源果汁露露15119690.300.220.180.120.183022181218合计501100解:这里的变量为“饮料品牌”,这是个分类变量,不同类型的饮料就是变量值所调查的50人中,购买可口可乐的人数最多,为15人,占总被调查人数的30%,因此众数为“可口可乐”这一品牌,即

Mo=可口可乐4、单项式数列

不同品牌饮料的频数分布饮料品牌频数比例百分按日产量分组(件)工人数(人)2015213022202310按日产量分组(件)工人数(人)2015213022202314)组距式数列确定众数的公式下限公式:

上限公式:

4)组距式数列确定众数的公式下限公式:例:年人均纯收入(千元)农户数(户)5以下2405—64806—711007—87008—93209以上160合计3000农户年人均收入众数计算表例:年人均纯收入(千元)农户数(户)5以下2405—6480判断法则1、当众数相邻的两组次数相等时,则众数组的组中值就是众数;2、当众数组前一组的次数较多,后一组的次数较少时,则众数在众数组内靠近他的下限;3、当众数组后一组次数较多,前一组的次数较少时,则众数在众数组内靠近他的上限。判断法则1、当众数相邻的两组次数相等时,则众数组的组中值就是五、中位数(median)

1、中位数的含义:将总体各单位按其标志值大小顺序排列起来居于中间位置的那个数。2、确定中位数的方法(1)由未分组资料确定中位数排序找中间位置五、中位数(median)1、中位数的含义:将总体各单位按中位数?

【例】

9个家庭的人均月收入数据原始数据:

15007507801080850960200012501630排序:

75078085096010801250150016302000位置:1234

56789中位数1080中位数?

【例】9个家庭的人均月收入数据中位数中位数?【例】:10个家庭的人均月收入数据排序:

660

75078085096010801250150016302000位置:1234

5678910中位数?【例】:10个家庭的人均月收入数据1、未分组资料确定中位数的方法:将总体各单位的标志值按照大小顺序排列当总体单位数n为奇数时:当总体单位数n为偶数时:1、未分组资料确定中位数的方法:(2)分组数列确定中位数

——累计频数到50%所对应的变量值例:按日产量分组(件)x工人数(人)f累计次数向上累计向下累计20101080221525702430555526258025合计80——(2)分组数列确定中位数

——累计频数到50%所对应的变量定序数据的中位数解:中位数的位置为

300/2=150

从累计频数看,中位数在“一般”这一组别中中位数为

Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意不满意

一般

满意非常满意

2410893

4530

24132225270300合计300—定序数据的中位数解:中位数的位置为(3)由组距数列确定中位数计算公式(3)由组距数列确定中位数计算公式例年人均纯收入(千元)农户数(户)向上累计次数5以下2402405—64807206—7110018207—870025208—932028409以上1603000合计3000—(1)计算累计次数(2)确定中位数组(3)根据中位数计算公式计算中位数中位数位次:例年人均纯收入(千元)农户数(户)向上累计次数5以下24022、单项式分组资料确定中位数当为奇数时:,当为偶数时,3、组距式分组资料确定中位数下限公式: 上限公式:2、单项式分组资料确定中位数3、组距式分组资料确定中位数六、众数、中位数和平均数的比较

1、区别:1)

三者的含义不相同;2)

三者的计算(确定)方法不同;3)对数据的“灵敏度”和“概括能力”不同。六、众数、中位数和平均数的比较1、区别:2、联系:(1)

三者都是作为反映总体一般水平(或集中趋势)的平均指标:(2)

三者之间存在着一定的数量关系,A.在对称的正态分布条件下:算术平均数等于众数等于中位数:B.在非对称正态分布的情况下,众数、中位数和平均数三者的差别取决于偏斜的程度,偏斜的程度越大,它们之间的差别越大。

2、联系:3众数、中位数、和算术平均数和的关系对称分布左偏分布右偏分布众数、中位数和算术平均数数量关系的经验公式为:算术平均数和众数的距离约等于算术平均数与中位数距离的三倍:3众数、中位数、和算术平均数和的关系对称分布左偏分布右偏分七、其他分位数1、四分位数(quartile)

1)能够将总体单位按标志值大小等分为四部分的三个数值。(排序)2)不受极端值的影响3)主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QLQMQU25%25%25%25%七、其他分位数1、四分位数(quartile)QLQMQU2

(例题分析)解:QL位置=(300+1)/4=75.25QU位置=3×(300+1)/4=225.75

从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中四分位数为

QL

=不满意

QU

=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数

非常不满意

不满意一般

满意非常满意

2410894

4430

24132226270300合计300—

(例题分析)解:QL位置=(300+1)/4=75.数值型数据的四分位数【例】:10个家庭的人均月收入数据排序:

660

75078085096010801250150016302000位置:1234

5678910数值型数据的四分位数【例】:10个家庭的人均月收入数据数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型定类数据定序数据定距数据定比数据适用的测度值※众数※中位数※均值※均值—四分位数众数调和平均数—众数中位数几何平均数——四分位数中位数———四分位数———众数数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据第三节分布的离中趋势一、变异指标的含义与作用1.定义:变异指标以平均数为中心,总体各单位标志值的差异大小范围或离差程度的指标。变异指标值越大,表明总体各单位标志的变异程度越大。2.作用:(1)衡量平均指标的代表性。(2)研究总体标志值分布偏离正态的情况。(3)进行抽样推断等统计分析的一个基本指标。

第三节分布的离中趋势一、变异指标的含义与作用二、极差(全距)(range)1、一组数据的最大值与最小值之差2、易受极端值影响3、未考虑数据的分布7891078910

R

=max(xi)-min(xi)4、计算公式为例:5名学生的成绩为50、69、76、88、97。二、极差(全距)(range)1、一组数据的最大值与最小值之分位差

1)剔除了部分极端值计算的类似于极差的指标。

2)内四分位间距:QR=Q3-Q13)四分位差:QD=(Q3-Q1)/2分位差三、平均差标志值与其算术平均数离差平均值。实质:以算术平均数为中心,各标志值距平均数的平均距离。三、平均差标志值与其算术平均数离差平均值。第一组第二组XX-|X-|XX-|X-|20-404050-101025-353551-9930-303052-8835-252553-7750-101056-44701010600075151562228525257111119030307212121206060731313合计280合计76第一组第二组XX-|X-|XX-|X-|20-4四、方差与标准差(varianceandstandarddeviation)方差:各变量值与其均值离差平方的平均数。(一)数量标志的方差与标准差标准差:方差的平方根,也称均方差。1、数量标志的方差与标准差计算,其计算公式为:资料未分组:资料已分组:四、方差与标准差方差:各变量值与其均值离差平方的平均数。(一例:求产量的标准差日产量(件)209221230241269合计20例:求产量的标准差日产量(件)209221230241269练习:日产量(公斤)工人数f组中值x20—301025288030—407035343040—50904581050—6030555070合计200—12190练习:日产量(公斤)工人数f组中值x20—301025288

(1)变量的方差等于变量平方的平均数减去变量平均数的平方。2、方差与标准差的数学性质即:

(2)变量对算术平均数的方差小于对任何常数的方差。

(3)变量线性变换的方差等于变量的方差乘以变量系数的平方。(1)变量的方差等于变量平方的平均数减去变量平均数(二)是非标志的方差与标准差是非标志的平均数为P。标志值x单位数f10合计N由于标准差有良好的数学性质,它的应用最为广泛。(二)是非标志的方差与标准差是非标志的平均数为P。标志值x单例:某工厂生产某种产品合格率为95%,不合格率为5%,求是非标志的方差及标准差。例:某工厂生产某种产品合格率为95%,不合格率为5%,求五、变异系数

(coefficientofvariation)1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为五、变异系数

(coefficientofvariati变异系数某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)x1销售利润(万元)x212345678170220390

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论