应用经济统计学数据整理与分析_第1页
应用经济统计学数据整理与分析_第2页
应用经济统计学数据整理与分析_第3页
应用经济统计学数据整理与分析_第4页
应用经济统计学数据整理与分析_第5页
已阅读5页,还剩72页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用经济统计学数据整理与分析第一页,共七十七页,2022年,8月28日主要内容数据分组数据显示数据集中趁势数据离中趋势第二页,共七十七页,2022年,8月28日数据分组1、将原始资料顺序排序2、确定组数与组距3、确定组限4、将各个数据按其数值大小归入相应的组内

如果数据分布比较均匀、对称,即中间数值次数多,大小极端值次数少,考虑用以下公式来确定组数:组数=1+3.322logn组距=(观察值中的最大数值-观察值中的最小数值)/组数第三页,共七十七页,2022年,8月28日数据分组例【例1】设某企业30个非熟练工人的周工资额

(元)如下:106998512184941061101191019591871051061091189612891105111111107103101107106第四页,共七十七页,2022年,8月28日数据分组例排序:

84,85,87,91,91,94,95,96,97,99,101,101,103,103,105,105,105,106,106,106,106,107,107,109,110,111,111,118,119,121,128第五页,共七十七页,2022年,8月28日分组计算组数=1+3.322logn=5.9(n=30)分6组组距:每组区间的宽度=(观察值中的最大数值-观察值中的最小数值)/组数

=(128-84)/6=7.3第六页,共七十七页,2022年,8月28日分6组,组距8

每周工资(元)人数(个)各组人数占总人数百分比(%)84~9251792~100517100~1081240108~116413116~124310124~13213

合计30100第七页,共七十七页,2022年,8月28日结合实际数据一、比较计算组距值(7.3),组距为10比较好计算且方便,二、分组的组数相应从6减少为5。最小值为84,下限从80开始,第八页,共七十七页,2022年,8月28日

分5组,组距10

每周工资(元)人数(个)各组人数占总人数百分比(%)80~9031090~100723100~1101343110~120517120~13027

合计30100第九页,共七十七页,2022年,8月28日分两组

工资收入次数分配表工资收入分组次数80-10513105-13017合计30反映不出观察值分布特征第十页,共七十七页,2022年,8月28日分组太细会出现什么问题?

第十一页,共七十七页,2022年,8月28日数据图示直方图:频数分配直方图、频率分配直方图次数多边形图累积次数分配图:小于上组限的累积次数分配图、大于下组限的累积次数分配图。[特例]洛伦茨曲线茎叶图第十二页,共七十七页,2022年,8月28日

直方图

以变量值为横坐标、次数为纵坐标,以矩形高度表示各组次数(频数)分配多少。如下图:

频数直方图第十三页,共七十七页,2022年,8月28日直方图

频率分布直方图第十四页,共七十七页,2022年,8月28日次数多边形图

第十五页,共七十七页,2022年,8月28日次数多边形图

还可将几种不同数据绘在同一多边形图上用于比较.如图:第十六页,共七十七页,2022年,8月28日累计次数分配图

小于上组限的累积次数分配每周工资(元)上组限组次数小于上组限的累计次数(人)小于上组限的累积百分比(%)80~9090331090~10010071033100~110110132377110~12012052893120~130130230100第十七页,共七十七页,2022年,8月28日累计次数分配图以变量值为横坐标、以累积计次数为纵坐标描点连接而成的图,如下图:第十八页,共七十七页,2022年,8月28日累计次数分配图

大于下组限的累积次数分配每周工资(元)上组限组次数小于上组限的累计次数(人)小于上组限的累积百分比(%)80~908033010090~1009072790100~110100132066110~1201105723120~130120227第十九页,共七十七页,2022年,8月28日累计次数分配图

第二十页,共七十七页,2022年,8月28日洛伦茨曲线以人口百分比为横坐标、以累积收入百分比为纵坐标描点连接而成的图形,如图:第二十一页,共七十七页,2022年,8月28日基尼系数反映一国收入的平等程度。如右图基尼系数r=A/(A+B)r=0绝对平等

r=1绝对不平等

r越大越不平等,反之则越平等。

第二十二页,共七十七页,2022年,8月28日茎叶图

数据源:

21,29,60,1,27,35,66,23,8,38,31,45,57,66,68,62,62,93,68,19,68,72,76,91,46,62,3,10,49,56,52,95

按大小排序后如下:

1,3,8,10,19,21,23,27,29,31,35,38,45,46,49,52,56,57,60,62,62,62,66,66,68,68,68,72,76,91,93,95第二十三页,共七十七页,2022年,8月28日茎叶图茎叶次数

01383109221379431583456935267360222668889726280913554第二十四页,共七十七页,2022年,8月28日数据集中趋势

算术平均数几何平均数调和平均数中位数及四分位数众数第二十五页,共七十七页,2022年,8月28日算术平均数

(概念要点)集中趋势的测度值之一最常用的测度值一组数据的均衡点所在易受极端值的影响第二十六页,共七十七页,2022年,8月28日算术平均数

(计算公式)设一组数据为:简单算术平均值的计算公式为设分组后的数据为:相应的频数为:加权算术平均值的计算公式为第二十七页,共七十七页,2022年,8月28日简单算术平均数

(算例)原始数据: 10 5 9 13 6 8第二十八页,共七十七页,2022年,8月28日加权算术平均数

(算例)

【例2】设某企业经理付给他的雇员的每小时工资分为三个等级:6.5元、7.5元、8.5元。拿这三种工资的人数分别为:14人、10人、2人,则该公司雇员的平均工资为:

第二十九页,共七十七页,2022年,8月28日加权算术平均数

(分组数据算例)表4-1某车间50名工人日加工零件均值计算表按零件数分组组中值(Xi)频数(fi)Xifi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合计—506160.0【例3】根据表4-1中的数据,计算50名工人日加工零件数的均值第三十页,共七十七页,2022年,8月28日算术平均数的数学性质1.各变量值与均值的离差之和等于零2.各变量值与均值的离差平方和最小第三十一页,共七十七页,2022年,8月28日几何平均数

(概念要点)1.集中趋势的测度值之一2.主要用于计算平均比率及平均发展速度3.计算公式为简单几何平均数加权几何平均数4.数据都为正数时才可计算几何平均数

5.可看作是均值的一种变形第三十二页,共七十七页,2022年,8月28日几何平均数

(算例)【例4】设某建筑公司承建的四项工程的利润分别为3%、2%、4%、6%。问这四项工程的平均利润率是多少?第三十三页,共七十七页,2022年,8月28日几何平均数

(算例)【例5】一位投资者持有一种股票,1996年、1997年、1998年和1999年收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。平均收益率=103.84%-1=3.84%第三十四页,共七十七页,2022年,8月28日几何平均数

(算例)【例6】设某银行有一笔20年的长期投资,其利率是按复利计算的,有1年为2.5%,有3年为3%,有5年为6%,有8年为9%,有2年为12%,有1年为5%,求平均年利率。第三十五页,共七十七页,2022年,8月28日调和平均数

(概念要点)集中趋势的测度值之一均值的另一种表现形式易受极端值的影响计算公式为简单调和平均数加权调和平均数第三十六页,共七十七页,2022年,8月28日调和平均数

(说明)加权调和平均第三十七页,共七十七页,2022年,8月28日调和平均数

(算例)

【例7】某人开车,前10公里以时速50公里驾驶,后10公里以时速30公里驾驶。则此人跑这20公里的平均时速为:第三十八页,共七十七页,2022年,8月28日

【例8】某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),若某人早、中、晚分别购买的金额是1元(m1)、2元(m2)、3元(m3),求平均价格。解:平均价格=总金额/总数量

调和平均数

(算例)

第三十九页,共七十七页,2022年,8月28日

【例9】某种蔬菜价格:早上0.4元/斤(x1),中午0.25(x2),晚上0.20(x3),若某人早、中、晚分别买2.5斤(f1)、8斤(f2)、15斤(f3),求平均价格。解:平均价格=总金额/总数量

调和平均数与算术平均数的区别第四十页,共七十七页,2022年,8月28日中位数

(概念要点)1.集中趋势的测度值之一2.排序后处于中间位置上的值Md50%50%3.不受极端值的影响4.各变量值与中位数的离差绝对值之和最小,即第四十一页,共七十七页,2022年,8月28日中位数

(位置的确定)未分组数据:

中位数位置组距分组数据:2∑f=中位数位置第四十二页,共七十七页,2022年,8月28日未分组数据的中位数

(计算公式)第四十三页,共七十七页,2022年,8月28日数值型未分组数据的中位数

(5个数据的算例)原始数据:

2422212620排序:

2021222426位置:

123 45中位数22第四十四页,共七十七页,2022年,8月28日数值型未分组数据的中位数

(6个数据的算例)原始数据:

105 91268排序:56891012位置:

123

4

56

位置=中位数8+928.5第四十五页,共七十七页,2022年,8月28日根据位置公式确定中位数所在的组,设落入第组采用下列近似公式计算数值型分组数据的中位数

(要点及计算公式)第四十六页,共七十七页,2022年,8月28日数值型分组数据的中位数

(算例)表4-2某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—【例10】根据右表中的数据,计算50名工人日加工零件数的中位数第四十七页,共七十七页,2022年,8月28日众数

(概念要点)1.集中趋势的测度值之一2.出现次数最多的变量值:一组数据分布的最高峰点

3.不受极端值的影响4.可能没有众数或有几个众数第四十八页,共七十七页,2022年,8月28日众数

(众数的不唯一性)无众数

原始数据:10591268一个众数

原始数据:65

9855多于一个众数

原始数据:252828

364242第四十九页,共七十七页,2022年,8月28日计算该企业该日全部工人日产量的众数。日产量(件)工人数(人)1011121314合计70100380150100800单值型数列的众数

(算例)【例11】已知某企业某日工人的日产量资料如下:第五十页,共七十七页,2022年,8月28日数值型分组数据的众数

(要点及计算公式)1.众数的值与相邻两组频数的分布有关4.该公式假定众数组的频数在众数组内均匀分布2.相邻两组的频数相等时,众数组的组中值即为众数Mo3.相邻两组的频数不相等时,众数采用下列近似公式计算MoMo第五十一页,共七十七页,2022年,8月28日数值型分组数据的众数

(算例)【例12】某市公寓房租金的统计资料如下表,试求房租金的众数表4-4某市公寓房屋租金资料表每周租金(元)房屋套数(套)累计房屋套数(套)7.5~12.512.5~17.517.5~22.522.5~27.527.5~32.532.5~37.537.5~42.542.5~47.512264560371352123883143180193198200第五十二页,共七十七页,2022年,8月28日众数、中位数和

算术平均数的关系左(负)偏分布算术平均数

中位数

众数右(正)偏分布众数

中位数

算术平均数对称分布

算术平均数=中位数=众数注:对称图形,重叠左右偏时,均值变化最快,中位值次之,众值不变第五十三页,共七十七页,2022年,8月28日数据的离中趋势

极差与平均差方差与标准差变异系数四分位差异众比率第五十四页,共七十七页,2022年,8月28日极差

(概念要点及计算公式)一组数据的最大值与最小值之差离散程度的最简单测度值易受极端值影响未考虑数据的分布7891078910未分组数据

R

=max(Xi)-min(Xi).=组距分组数据

R

最高组上限-最低组下限

计算公式为第五十五页,共七十七页,2022年,8月28日极差

(算例)原始数据:

10591268

排序:

56891012极差=12-5=7原始数据:

极差=140-105=35表4-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650第五十六页,共七十七页,2022年,8月28日平均差

(概念要点及计算公式)离散程度的测度值之一各变量值与其均值离差绝对值的平均数能全面反映一组数据的离散程度数学性质较差,实际中应用较少

计算公式为未分组数据组距分组数据第五十七页,共七十七页,2022年,8月28日平均差

(计算过程及结果)表4-46某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(fi)105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合计—50—312【例13】根据表4-6中的数据,计算工人日加工零件数的平均差第五十八页,共七十七页,2022年,8月28日方差和标准差

(概念要点)1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布4.反映了各变量值与均值的平均差异5.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012X=8.3第五十九页,共七十七页,2022年,8月28日总体方差和标准差

(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式第六十页,共七十七页,2022年,8月28日总体方差和标准差

(算例)原始数据:76908486818786828583第六十一页,共七十七页,2022年,8月28日总体标准差

(计算过程及结果)3100.5739.47572.45259.926.86184.90518.94817.96—246.49114.4932.490.4918.4986.49204.4950—合计358141064107.5112.5117.5122.5127.5132.5137.5105~110110~115115~120120~125125~130130~135135~140频数(fi)组中值(Xi)按零件数分组表4-7某车间50名工人日加工零件标准差计算表【例14】根据表4-7中的数据,计算工人日加工零件数的标准差第六十二页,共七十七页,2022年,8月28日总体方差和标准差

(简化计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式第六十三页,共七十七页,2022年,8月28日总体标准差

(计算过程及结果)762012.534668.7563281.25110450210087.5162562.5105337.575625—11556.2512656.2513806.2515006.2516256.2517556.2518906.2550—合计358141064107.5112.5117.5122.5127.5132.5137.5105~110110~115115~120120~125125~130130~135135~140频数(fi)组中值(Xi)按零件数分组表4-8某车间50名工人日加工零件标准差计算表【例15】根据4-8中的数据,计算工人日加工零件数的标准差第六十四页,共七十七页,2022年,8月28日样本方差和标准差

(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!第六十五页,共七十七页,2022年,8月28日样本方差和标准差

(算例)原始数据:76908486818786828583抽样数据:7684818685

样本均值:样本方差:

标准差:第六十六页,共七十七页,2022年,8月28日变异系数1.各种变异指标与其相应的均值之比2.消除了数据水平高低和计量单位的影响3.测度了数据的相对离散程度4.用于对不同总体数据离散程度的比较注:变异指标:对数据的差异程度进行度量

,包括异众比率、四分位差、极差、平均差、方差和标准差(含比率的标准差)等

第六十七页,共七十七页,2022年,8月28日变异系数分类及计算公式极差系数

平均差系数标准差系数最常用的是标准差系数。第六十八页,共七十七页,2022年,8月28日变异系数

(算例)

【例16】已知以下资料,试比较哪组数据更集中(整齐)。

幼儿组

成人组

幼儿组

成人组由此可看出成人组的数据更集中。幼儿组身高(cm)成人组身高(cm)王甜张琴李朋英洁伍平7172737475佐江财佑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论