第三章统计整理_第1页
第三章统计整理_第2页
第三章统计整理_第3页
第三章统计整理_第4页
第三章统计整理_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2013年第二季度全国星级饭店经营情况整理统计年第二季度全国星级饭店经营情况整理统计 全国有星罗棋布的宾馆、旅店,各星级饭店的营业收入、房价、全国有星罗棋布的宾馆、旅店,各星级饭店的营业收入、房价、出租率等也高低不等。面对海量的数据,科学的归类整理,不仅国家出租率等也高低不等。面对海量的数据,科学的归类整理,不仅国家旅游局能心中有数,每一位游客也会一目了然。例如,旅游局能心中有数,每一位游客也会一目了然。例如,2013年第二年第二季度,全国共有季度,全国共有12101家星级饭店(其中,一星级家星级饭店(其中,一星级156家,二星级家,二星级3100家,三星级家,三星级5774家,四星级家,四星

2、级2355家,五星级家,五星级716家);全国星家);全国星级饭店的平均房价为级饭店的平均房价为326.45元(其中,一星级元(其中,一星级127.77元,二星级元,二星级151.35元,三星级元,三星级210.64元,四星级元,四星级355.89元,五星级元,五星级699.34元)。元)。 相信伴随着中国经济的发展,一个能满足和适宜大众化休闲旅游相信伴随着中国经济的发展,一个能满足和适宜大众化休闲旅游的时代必将早日到来。的时代必将早日到来。 资料来源:国家旅游局,资料来源:国家旅游局,2013-8-31引例第三章第三章 统计整理统计整理v第一节第一节 统计整理的基本问题统计整理的基本问题 v

3、第二节第二节 统计整理的审核统计整理的审核 v第三节第三节 统计分组统计分组 v第四节第四节 统计汇总统计汇总 v第五节第五节 分布数列分布数列 v第六节第六节 统计资料的显示统计资料的显示 v一、学习目的与要求一、学习目的与要求v通过对本章的学习,使同学明确统计整理的通过对本章的学习,使同学明确统计整理的概念和程序,认识统计分组的意义和作用,概念和程序,认识统计分组的意义和作用,掌握统计分组和变量数列的基本理论和方法,掌握统计分组和变量数列的基本理论和方法,了解统计资料汇总的方法和技巧,了解统计了解统计资料汇总的方法和技巧,了解统计表的结构、种类和制表规则。表的结构、种类和制表规则。 v二、

4、本章重点、难点二、本章重点、难点v本章学习重点是统计分组,变量数列的编制本章学习重点是统计分组,变量数列的编制方法;难点是掌握并运用统计分组的种类。方法;难点是掌握并运用统计分组的种类。v三、授课学时三、授课学时:4学时学时变量次数合计27 23 24 2425 2525 2425 2626 2226 23 22 2323 2424 2425 2525 2526 2626 27第一节第一节 统计整理的基本问题统计整理的基本问题 一、统计整理的含义与意义一、统计整理的含义与意义 (1)含义)含义 统计整理:根据统计研究的目的和要求,对调查所得原统计整理:根据统计研究的目的和要求,对调查所得原始材

5、料进行科学分组与汇总和对以往的材料进行再加工,始材料进行科学分组与汇总和对以往的材料进行再加工,使之系统化、条理化成为能反映事物总体特征的综合资使之系统化、条理化成为能反映事物总体特征的综合资料的过程。料的过程。 (2)意义)意义 统计整理是整个统计工作和研究过程的中间环节,起者统计整理是整个统计工作和研究过程的中间环节,起者承前启后的作用,是统计调查的继续也是统计分析的基承前启后的作用,是统计调查的继续也是统计分析的基础。统计整理最后的结果就是形成各种统计表格和统计础。统计整理最后的结果就是形成各种统计表格和统计图。图。 二、统计整理的程序二、统计整理的程序 v审核;分组;汇总审核;分组;汇

6、总 ;制图表;制图表第二节第二节 统计整理的审核统计整理的审核 v对调查资料的进行审核是统计整理的第一步,对调查资料的进行审核是统计整理的第一步,包括以下内容:包括以下内容:v一、审核资料的完整性和及时性一、审核资料的完整性和及时性v二、审核资料的准确性二、审核资料的准确性v三、历史资料的审查三、历史资料的审查 v四、资料审查后的修正四、资料审查后的修正审核很重要,准审核很重要,准确的资料是进行确的资料是进行正确统计分析的正确统计分析的关键。关键。 全国人口男性人口女性人口全国人口按性别分组全国人口全国人口按文化程度分组大学人口高中人口初中人口小学人口文盲人口全国人口全国人口按城乡分组城镇人口

7、乡村人口v一、统计分组的含义一、统计分组的含义v统计分组就是根据统计研究的需要,统计分组就是根据统计研究的需要,按照一定的标志,将总体中所有单按照一定的标志,将总体中所有单位划分为若干个组成部分的一种统位划分为若干个组成部分的一种统计方法。计方法。按商品分类分组按商品分类分组构成构成(%)食品类食品类 40.6衣着类衣着类 4.7家庭设备用品类家庭设备用品类 7.5文化娱乐用品类文化娱乐用品类 11.6交通通讯类交通通讯类 10.8医疗保健类医疗保健类 4.7居住类居住类 14.4杂项商品类杂项商品类5.7合计合计100 2013年我国国内生产总值年我国国内生产总值568845 亿元亿元 。第

8、一产业增加值占国内生产总值。第一产业增加值占国内生产总值的比重为的比重为10%;第二产业增加值比重为;第二产业增加值比重为43.9 %;第三产业增加值比重为;第三产业增加值比重为46.1 %。(第三产业增加值占比首次超过第二产业第三产业增加值占比首次超过第二产业 )例:中国农民家庭按收入分组的恩格尔系数(例:中国农民家庭按收入分组的恩格尔系数(2009年)年)按收入分组(元)低收入户按收入分组(元)低收入户 中低收入户中低收入户 中等收入户中等收入户 中高收入户中高收入户 高收入户高收入户恩格尔系数(恩格尔系数(%) 47.00 45.88 43.70 40.54 34.76小麦播种量与产量关

9、系播种量(公斤亩)亩产量(公斤亩)4.57.51014.5225300290275v1 1统计分组的原则:统计分组的原则:v穷尽原则穷尽原则: :使总体中的每一个单位都应有组可归(使总体中的每一个单位都应有组可归(每个孩子每个孩子都有家可归都有家可归),或者说各分组的空间足以容纳总体所有的单),或者说各分组的空间足以容纳总体所有的单位。位。v互斥原则互斥原则: :就是在特定的分组标志下,总体中的任何一个单就是在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。位的只能归属于某一组,而不能同时或可能归属于几个组。v2 2统计分组的方法统计分组的方法v(1 1

10、)品质分组:按品质标志分组)品质分组:按品质标志分组v事物本身的属性特征;统计研究的要求事物本身的属性特征;统计研究的要求v(2 2)数量分组:按数量标志分组。应注意两个问题:第一,)数量分组:按数量标志分组。应注意两个问题:第一,分组时数量界限的确定必须能反映事物的差别;第二,应根分组时数量界限的确定必须能反映事物的差别;第二,应根据被研究的现象总体的数量特征,采用适当的分组形式,确据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限。定相宜的组距、组限。v(A A)单项式分组与组距式分组)单项式分组与组距式分组v单项式分组:用一个变量值作为一组,形成单项式变量单项式分组:

11、用一个变量值作为一组,形成单项式变量数列。数列。一般适用变动范围不大的离散型变量。一般适用变动范围不大的离散型变量。v组距式分组:将变量依次划分为几段区间,一段区间表组距式分组:将变量依次划分为几段区间,一段区间表现为从现为从“到到”距离,把一段区间内的所有变量距离,把一段区间内的所有变量值归为一组,形成组距式变量数列。区间的距离就是组值归为一组,形成组距式变量数列。区间的距离就是组距。距。适用于连续型变量或者变动范围较大的离散型变量。适用于连续型变量或者变动范围较大的离散型变量。v(B B)间断组距式分组和连续组距式分组)间断组距式分组和连续组距式分组v组距式分组中,每组包含许多变量值,每一

12、组变量值中,其组距式分组中,每组包含许多变量值,每一组变量值中,其最小值为下限,最大值为上限。组距是上下限之间的距离,最小值为下限,最大值为上限。组距是上下限之间的距离,相邻的界限,称为组限。相邻的界限,称为组限。v凡是组限不相连的,称为间断组距式分组。凡是组限相连的,凡是组限不相连的,称为间断组距式分组。凡是组限相连的,即以同一数值作为相邻两组的共同界限,称为连续组距式分即以同一数值作为相邻两组的共同界限,称为连续组距式分组。组。v在连续组距式分组中,存在以同一个数值作为相邻在连续组距式分组中,存在以同一个数值作为相邻两组共同的界限,因此,根据统计分组两组共同的界限,因此,根据统计分组”互斥

13、原则互斥原则“,我国统计制度规定,凡是总体某一个单位的变,我国统计制度规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一单位归入作为下限量值是相邻两组的界限值,这一单位归入作为下限值的那一组内,亦称值的那一组内,亦称“上限在不内上限在不内”原则。原则。v(C C)等距分组与异距分组)等距分组与异距分组v按数量标志进行组距式分组,还可以分为等距分组按数量标志进行组距式分组,还可以分为等距分组与不等距(异距)分组。等距分组就是标志值在各与不等距(异距)分组。等距分组就是标志值在各组保持相等的组距,即各组的标志值变动都限于相组保持相等的组距,即各组的标志值变动都限于相同的范围。凡是在标志值变动

14、比较均匀的情况下,同的范围。凡是在标志值变动比较均匀的情况下,都可采用等距分组。都可采用等距分组。v异距分组即各组的组距不相等。一般地,异距分组异距分组即各组的组距不相等。一般地,异距分组适用于以下几个场合:一是标志值分布很不均匀;适用于以下几个场合:一是标志值分布很不均匀;而是标志值相等的量具有不同意义;标志值按一定而是标志值相等的量具有不同意义;标志值按一定比例发展变化。比例发展变化。 (等距分组)(等距分组)v注意:注意:Nnlg3 . 31NXXnRdlg3.31minmaxv4 组限和组中值组限和组中值v组限:指每组两端数值。分上限和下限。组限:指每组两端数值。分上限和下限。上限:每

15、组的终点数值(最大值)上限:每组的终点数值(最大值)下限:每组的起点数值(最小值)下限:每组的起点数值(最小值)v组限的形式与变量的特点密切相关。如果分组标志是连续变组限的形式与变量的特点密切相关。如果分组标志是连续变量,组限一般重合式;如果分组标志是离散变量,组限一般量,组限一般重合式;如果分组标志是离散变量,组限一般用不重合式。用不重合式。v所谓重合式,就是相邻两组中,前一组中的上限与后一组的所谓重合式,就是相邻两组中,前一组中的上限与后一组的下限数值相重。如人口年龄为下限数值相重。如人口年龄为0-1岁,岁,1-3岁,岁,3-7岁,岁,7-14岁岁。形式上相重,实际上两组之间是没有重复的,

16、一般按。形式上相重,实际上两组之间是没有重复的,一般按”含下限不含上限含下限不含上限“或或”上限不在组内上限不在组内“的原则处理。的原则处理。v所谓不重合式就是前一组的上限与后一组的下限,两值紧密所谓不重合式就是前一组的上限与后一组的下限,两值紧密相连又不重复。相连又不重复。v组中值是各组上下限之间的中点值,代表组内标志值的一般组中值是各组上下限之间的中点值,代表组内标志值的一般水平,具有平均数的性质(但不是平均数)。水平,具有平均数的性质(但不是平均数)。v当两组间的相邻组限重合时:当两组间的相邻组限重合时:v组距组距=本组上限本组下限本组上限本组下限v组中值组中值=(上限(上限+下限)下限

17、)/2 或或=下限组距下限组距/2 或或=上限组距上限组距/2 v当两组间的相邻组限不重合时:当两组间的相邻组限不重合时:v组距组距=下组下限本组下限下组下限本组下限 或或 =本组上限前组上限本组上限前组上限=本组上限本组下限本组上限本组下限+1v组中值组中值=(本组下限下一组下限本组下限下一组下限) 2 或或=本组下限组距本组下限组距/2 或或=下组下限组距下组下限组距/2 v在组距式分组中,常常会遇见首末两组在组距式分组中,常常会遇见首末两组”开开口口“的情况,即第一组用的情况,即第一组用”多少以下多少以下“(有(有上限无下限),最后一组用上限无下限),最后一组用”多少以上多少以上“(有下

18、限无上限)来表示。组中值是以相(有下限无上限)来表示。组中值是以相邻组组距为依据,按下式计算:邻组组距为依据,按下式计算:v 组中值组中值=上限上限-邻组组距邻组组距/2 或或=下限下限+邻组组距邻组组距/2v例如,某企业工人生产定额完成情况,按生例如,某企业工人生产定额完成情况,按生产定额完成程度分组分为:产定额完成程度分组分为:90%以下,以下,90%-100%,100%-110%,110%以上。以上。v当连续型变量按离散型变量表示时,组距数列的编当连续型变量按离散型变量表示时,组距数列的编制采取相邻组限不重叠的形式,组中值的确定应考制采取相邻组限不重叠的形式,组中值的确定应考虑到连续型变

19、量自身的特点。年龄就是比较典型的虑到连续型变量自身的特点。年龄就是比较典型的例子,是连续型变量,习惯上用整数来表示。例子,是连续型变量,习惯上用整数来表示。v例如,一群大学生分为例如,一群大学生分为17-19岁、岁、20-22岁两组岁两组v 组距组距=20-17=3岁岁v 组中值为(组中值为(20+17)/2=18.5岁和(岁和(23+20)/2= 21.5岁岁某研究生班学生按年龄分组年龄人数比重%20-25186025-3093030-35310合计30100下限上限组距=上限-下限=25-20=5(岁)组中值=(上限+下限)/2上限不在本组内80 名同学统计成绩分布表成绩 (分)人数 (人

20、)比重 (%)60 以下78.860-702126.270-802531.280-901923.890 以上810.0合计80100无下限组组中值=本组上限-临近组组距/2无上限组组中值=本组下限+临近组组距/2第四节第四节 统计资料汇总统计资料汇总v一、概念和意义一、概念和意义v1概念:统计汇总:即在统计分组的基础上,将统概念:统计汇总:即在统计分组的基础上,将统计资料归并到各组中去,并计算各组和总体的合计计资料归并到各组中去,并计算各组和总体的合计数(包括单位总数和标志总量)的工作过程。数(包括单位总数和标志总量)的工作过程。v2意义:揭示出总体的数量特征意义:揭示出总体的数量特征v二、统

21、计汇总的组织形式:二、统计汇总的组织形式:v1、逐级汇总、逐级汇总 v2、集中汇总、集中汇总 v3、汇审汇编、汇审汇编 v4、综合汇总、综合汇总手工汇总计算机汇总第五节第五节 频数分布频数分布v一、频数分布基本概念一、频数分布基本概念v1 频数分布和分布数列的定义频数分布和分布数列的定义v在统计分组的基础上,将总体所有的单位按某一标志进行归类排在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算其相应出现的次数。这样得到的分布称为频数分布或列,并计算其相应出现的次数。这样得到的分布称为频数分布或次数分布。频数分布所形成的一系列反映总体各组之间单位分布次数分布。频数分布所形成的一系

22、列反映总体各组之间单位分布状况的数列,即分布数列。分布在各组的单位数叫次数(频数)。状况的数列,即分布数列。分布在各组的单位数叫次数(频数)。各组单位数占总体单位数的比重叫频率。次数和频率从不同的角各组单位数占总体单位数的比重叫频率。次数和频率从不同的角度反映了各组标志值出现的频繁程度,说明总体各单位在各组间度反映了各组标志值出现的频繁程度,说明总体各单位在各组间的分布。的分布。v2 分布数列的两个要素分布数列的两个要素v一个是总体按某标志所分的组,另一个是各组所出现的单位数,一个是总体按某标志所分的组,另一个是各组所出现的单位数,即频数,亦称次数。即频数,亦称次数。v就变量数列而言,总体按数

23、量标志分组,分组标志在各组有不同就变量数列而言,总体按数量标志分组,分组标志在各组有不同的数量表现,形成标志值数列,一般用的数量表现,形成标志值数列,一般用x 表示;次数(也称频数)表示;次数(也称频数)用用f 表示。表示。v3 频率频率v将个标志出现的频数与总体单位总和相除可将个标志出现的频数与总体单位总和相除可以得到频率。即以得到频率。即v频率具有以下性质:频率具有以下性质:v(1)任何频率都是介于)任何频率都是介于0和和1之间的一个分之间的一个分数,即数,即v(2)各组频率之和等于)各组频率之和等于1,即,即iiff频率 10iiff1iiffv4 频数密度和频率密度频数密度和频率密度v

24、频数密度频数密度=频数频数/组距组距v频率密度频率密度=频率频率/组距组距v各组频数密度与各组组距乘积之和等于总体各组频数密度与各组组距乘积之和等于总体单位数,各组频率密度与各组组距乘积之和单位数,各组频率密度与各组组距乘积之和等于等于1。341.等距分组等距分组各组次数的多少不受组距大小的影响各组次数的多少不受组距大小的影响可直接根据次数(频数或频率)来观察变量的可直接根据次数(频数或频率)来观察变量的分布特征和规律分布特征和规律2.不等距分组不等距分组各组次数的多少要受组距大小不同的影响各组次数的多少要受组距大小不同的影响各组次数不能直接反映频数分布的实际状况各组次数不能直接反映频数分布的

25、实际状况用频数密度才能比较各组次数分布的实际状况用频数密度才能比较各组次数分布的实际状况v频数密度频数组距频数密度频数组距异距分组的应用异距分组的应用 1.将总体各单位变量值由小到大排列,计算将总体各单位变量值由小到大排列,计算全距。(全距等于最大值减去最小值)全距。(全距等于最大值减去最小值) 2.确定组距数列的类型(等距或异距)确定组距数列的类型(等距或异距) 3.根据总体的特征,确定组数与组距。(组根据总体的特征,确定组数与组距。(组距以距以5或或10的倍数为好)的倍数为好) 4.确定组限。(有极值,用开口组)确定组限。(有极值,用开口组) 5.从最小组开始排列,分别计算各组频数和从最小

26、组开始排列,分别计算各组频数和其它相关指标,形成频数分布统计表。其它相关指标,形成频数分布统计表。v二、分布数列的编制二、分布数列的编制 v下面以一个实例说明变量数列的编制下面以一个实例说明变量数列的编制v例如,根据抽样调查,例如,根据抽样调查,50户居民的月消费支户居民的月消费支出资料如下(单位:元):出资料如下(单位:元):v830 880 1230 1100 1180 1580 1210 1460 1170 10801050 1100 1070 1370 1200 1630 1250 1360 1270 14201180 1030 870 1150 1410 1170 1230 1260

27、 1380 15101010 860 810 1130 1140 1190 1260 1350 930 14201080 1010 1050 1250 1160 1320 1380 1310 1270 1250v首先将这些数据从小到大进行排列,使其序首先将这些数据从小到大进行排列,使其序列化:列化:v810 830 860 870 880 930 1010 1010 1030 1050 1050 1070 1080 1080 1100 1100 1130 1140 1150 11601170 1170 1180 1180 1190 1200 1210 1230 1230 12501250 12

28、50 1260 1260 1270 1270 1310 1320 1350 13601370 1380 1380 1410 1420 1420 1460 1510 1580 1630v对上述资料采用等距分组,分为对上述资料采用等距分组,分为8组,组距为组,组距为100,以,以800为为第一组下限,得出计算结果如下表:第一组下限,得出计算结果如下表:按户月消费支出额分按户月消费支出额分组(组(x)频数频数频率频率80090050.1900100010.021000110080.1611001200110.2212001300110.221300140070.141400150040.081500

29、以上以上30.06合计合计501ifiiffv三、累计频数与累计频率三、累计频数与累计频率v累计频数(频率)分为向上累计频数(频率)和向下累计频累计频数(频率)分为向上累计频数(频率)和向下累计频数(频率)。数(频率)。v编制向上累计频数(频率)分布的方法是:先列出各组的上编制向上累计频数(频率)分布的方法是:先列出各组的上限,然后由标志值低的组向标志值高的组依次累计频数(频限,然后由标志值低的组向标志值高的组依次累计频数(频率)。向上累计频数表明某组上限以下的各组单位数之和是率)。向上累计频数表明某组上限以下的各组单位数之和是多少,向上累计频率表明某组上限以下的各组单位数占总体多少,向上累计

30、频率表明某组上限以下的各组单位数占总体单位数的比重。单位数的比重。v编制向下累计频数(频率)分布的方法是:先列出各组的下编制向下累计频数(频率)分布的方法是:先列出各组的下限,然后由标志值高的组向标志值低的组依次累计频数(频限,然后由标志值高的组向标志值低的组依次累计频数(频率)。向下累计频数表明某组下限以上的各组单位数之和是率)。向下累计频数表明某组下限以上的各组单位数之和是多少,向下累计频率表明某组下限以上的各组单位数占总体多少,向下累计频率表明某组下限以上的各组单位数占总体单位数的比重。单位数的比重。按户月消费支按户月消费支出额分组出额分组上限上限向上累计向上累计按户月消费支按户月消费支

31、出额分组出额分组下限下限向下累计向下累计频数频数累计频累计频数数频率频率累计频率累计频率频数频数累计频数累计频数频率频率累计频率累计频率900550.10.18005500.111000160.020.129001450.020.911008140.160.2810008440.160.88120011250.220.5110011360.220.72130011360.220.72120011250.220.514007430.140.8613007140.140.2815004470.080.941400470.080.1416002490.040.981500230.040.061700

32、1500.0211600110.020.02合计合计501合计合计501v累计频数分布具有如下两个特点累计频数分布具有如下两个特点(1)第一组的)第一组的累计频数等累计频数等于第一组本身的频数;(于第一组本身的频数;(2)最后一组累计频数等于总体单)最后一组累计频数等于总体单位数。位数。v累计频率分布同样具有两个特点累计频率分布同样具有两个特点(1)第一组的)第一组的累计频率等累计频率等于第一组本身的频率;(于第一组本身的频率;(2)最后一组累计频数等于)最后一组累计频数等于1。四、分布数列的种类四、分布数列的种类v(1)按分组标志的不同分为品质数列和变量)按分组标志的不同分为品质数列和变量数

33、列数列v变量数列按其分组方式不同又有两种:变量数列按其分组方式不同又有两种:v 单项式数列单项式数列v 组距式数列(等距和异距数列)组距式数列(等距和异距数列)v(2)按次数分布特征分为钟型分布数列、)按次数分布特征分为钟型分布数列、U型分布数列和型分布数列和J 型分布数列型分布数列v钟型分布数列分为正态分布和偏态分布数列钟型分布数列分为正态分布和偏态分布数列(右偏和左偏)(右偏和左偏)v钟型分布数列指数列中愈靠近变量值中点,钟型分布数列指数列中愈靠近变量值中点,分布次数愈多,愈离中点,分布次数愈少,分布次数愈多,愈离中点,分布次数愈少,形成形成“中间大,两头小中间大,两头小”的次数分布。的次

34、数分布。vU型分布数列则正好与钟型分布数列相反,型分布数列则正好与钟型分布数列相反,表现出表现出“两头大,中间小两头大,中间小”的次数分布。的次数分布。vJ 型分布数列:一是次数随着变量值的增大型分布数列:一是次数随着变量值的增大而增多;二是次数随着变量值的增大而减少。而增多;二是次数随着变量值的增大而减少。v钟型分布钟型分布()()()vU型分布型分布 10 20 30 40 50 60 70 805040302010 0死亡率()年龄vJ型分布型分布正正J型图型图反反J型图型图第六节第六节 统计资料的显示统计资料的显示v一、统计表一、统计表v(一)统计表的定义和结构(一)统计表的定义和结构

35、v1 定义:对统计调查所获得的原始资料进行整理,得到说明社会现象及定义:对统计调查所获得的原始资料进行整理,得到说明社会现象及其发展过程的数据,并把这些数据按一定的顺序排列在表格上,就形成其发展过程的数据,并把这些数据按一定的顺序排列在表格上,就形成了统计表。统计表可以清楚地、有条理地显示统计资料,直观地反映统了统计表。统计表可以清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。计分布特征,是统计分析的一种重要工具。v2 统计表结构统计表结构v从表式和内容两个方面认识:从表式和内容两个方面认识:v(1)从表式上看,)从表式上看, 总标题总标题 统计表统计表 横行标

36、题横行标题 纵栏标题纵栏标题 指标数值指标数值48表表212 2011年我国城乡居民家庭人均收入及恩格尔系数年我国城乡居民家庭人均收入及恩格尔系数家庭人均可支配收入家庭人均可支配收入恩格尔系数恩格尔系数()()绝对额绝对额(元)(元)指数指数(1978100)农村居民农村居民6977.31046.336.3城镇居民城镇居民21809.81063.240.4总标题总标题纵列纵列标题标题数据数据横行横行标题标题资料来源:资料来源:国家统计数据国家统计数据http:/ 表表1 2004年我国进出口情况年我国进出口情况 单位:亿美元单位:亿美元指标指标数值数值比上年增长比上年增长(%)进出口总额进出口

37、总额1154835.7出口额出口额593435.4进口额进口额561436v(二)统计表的分类(二)统计表的分类v1 按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和复合表分组表和复合表v(1)简单表:主词未经任何分组的统计表。)简单表:主词未经任何分组的统计表。v表表2 2004年固定资产投资新增主要生产能力情况年固定资产投资新增主要生产能力情况指标指标单位单位数值数值新增发电机组容新增发电机组容量量万千瓦万千瓦5055新建铁路投产里程新建铁路投产里程公里公里1433新建公路新建公路公里公里46411v(2)简单

38、分组表:主词只按一个标志进行分组形成的统计)简单分组表:主词只按一个标志进行分组形成的统计表。表。v表表3 2004年主要国家进出口情况年主要国家进出口情况国家国家出口额(亿美元)出口额(亿美元)比上年增长比上年增长(%)美国美国124935.1韩国韩国27838.4日本日本73532.3v(3)复合表:主词按两个或两个以上标志进行分组形成的统计表。)复合表:主词按两个或两个以上标志进行分组形成的统计表。v2 按宾词设计分类,分为宾词简单排列、分组平行排列和分组层叠排列按宾词设计分类,分为宾词简单排列、分组平行排列和分组层叠排列三种。三种。v(1)宾词简单排列:宾词不进行任何分组,按一定顺序排

39、列在统计表)宾词简单排列:宾词不进行任何分组,按一定顺序排列在统计表上。上。v(2)宾词分组平行排列:宾词栏中各分组标志彼此分开,平行排列。)宾词分组平行排列:宾词栏中各分组标志彼此分开,平行排列。v(3)宾词分组层叠排列:统计指标同时有层次地按两个或两个以上标)宾词分组层叠排列:统计指标同时有层次地按两个或两个以上标志分组。志分组。v注意:注意:统计表的主词分组与宾词分组有区别:主词分组的结果使总体统计表的主词分组与宾词分组有区别:主词分组的结果使总体分成许多组成部分,需要用统计指标来描述。宾词分组的结果并不增加分成许多组成部分,需要用统计指标来描述。宾词分组的结果并不增加总体的组成部分,仅

40、仅是比较详细地描述总体已有的各个组成部分。总体的组成部分,仅仅是比较详细地描述总体已有的各个组成部分。v(三)统计表的设计(三)统计表的设计v1 原则:原则:v科学、实用、简明、美观。科学、实用、简明、美观。v2 要求:要求:v标题醒目准确标题醒目准确 v内容简明扼要内容简明扼要 v项目排列有序项目排列有序 v字迹清楚规范(数字按个位数上下对齐,无数填字迹清楚规范(数字按个位数上下对齐,无数填号,缺报号,缺报填填号)号) v规格合乎要求(上下粗线,左右开口,栏间划线,行间空白)规格合乎要求(上下粗线,左右开口,栏间划线,行间空白)v计量单位计量单位v注解或资料来源注解或资料来源 v二、统计图二

41、、统计图v(一)直方图(一)直方图v直方图是用直方形的宽度和高度来表示次数分布的图形。直方图是用直方形的宽度和高度来表示次数分布的图形。v注意:注意:对于不等距式变量数列,通常按对于不等距式变量数列,通常按频数(频率)密度频数(频率)密度绘制直方图以表示分布。绘制直方图以表示分布。v(二)折线图(二)折线图v在直方图基础上,用折线将各组次数高度的坐标连接而成,在直方图基础上,用折线将各组次数高度的坐标连接而成,也可以用组中值与次数求坐标点连接而成。也可以用组中值与次数求坐标点连接而成。v(三)曲线图(三)曲线图v v(四)累计曲线图(四)累计曲线图v累计频数(频率)不仅可以用表格形式表示,还可

42、以用图形累计频数(频率)不仅可以用表格形式表示,还可以用图形表示。累计频数(频率)分布图分为向上累计频数(频率)表示。累计频数(频率)分布图分为向上累计频数(频率)分布图和向下累计频数(频率)。不论向上或下,均以分组分布图和向下累计频数(频率)。不论向上或下,均以分组变量为横轴,以累计频数(频率)为纵轴。在直角坐标系上变量为横轴,以累计频数(频率)为纵轴。在直角坐标系上将各组组距的上限与其对应的累计频数(频率)构成坐标点,将各组组距的上限与其对应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,即是向上累计分布图。对依次用折线(或光滑曲线)相连,即是向上累计分布图。对于向下累计频数(

43、频率)分布图,在直角坐标系上将各组组于向下累计频数(频率)分布图,在直角坐标系上将各组组距的下限与其对应的累计频数(频率)构成坐标点,依次用距的下限与其对应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连。折线(或光滑曲线)相连。v洛伦茨曲线图:累计频数(频率)分布曲线,可以用来研究洛伦茨曲线图:累计频数(频率)分布曲线,可以用来研究财富、土地和工资收入的分配是否公平。这种累计分布曲线财富、土地和工资收入的分配是否公平。这种累计分布曲线图最早是由美国洛伦茨博士(图最早是由美国洛伦茨博士(Dr.M.O.lorenz)提出的。)提出的。v基尼系数,用以衡量收入分配的平等与否。基尼系数,用

44、以衡量收入分配的平等与否。59列出各类别列出各类别60v频频 数:落在各类别中的数据个数数:落在各类别中的数据个数v比比 重:某一类别数据占全部数据的比值重:某一类别数据占全部数据的比值v比比 率:不同类别数值的比值率:不同类别数值的比值61【例【例】为研究广告市场为研究广告市场的状况,一家广告公司的状况,一家广告公司在某城市随机抽取在某城市随机抽取200人人就广告问题做了邮寄问就广告问题做了邮寄问卷调查,其中的一个问卷调查,其中的一个问题是题是“您比较关心下列您比较关心下列哪一类广告?哪一类广告?” 1商品广告;商品广告;2服服务广告;务广告;3金融广告;金融广告;4房地产广告;房地产广告;

45、5招招生招聘广告;生招聘广告;6其他广其他广告。告。广告类型广告类型人数人数(人人)比重比重(%) 商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告1121651910256.08.01.0表表29 某城市居民关注广告类型的频数分布某城市居民关注广告类型的频数分布62人数(人)人数(人)5191610211204080120 商品广告商品广告 服务广告服务广告 金融广告金融广告 房地产广告房地产广告 招生招聘广告招生招聘广告 其他广告其他广告广广告告类类型型 图图2-7 2-7 某城市居民关注不同类型广告的人数分布某城市居民关注不同类型广告的人数分布63 其他广告1.0% 房地产广告8.0% 商品广告56.0% 金融广告4.5% 服务广告25.5% 招生招聘广告5.8%图图2-8 2-8 某城市居民关注不同类型广告的人数构成某城市居民关注不同类型广告的人数构成64v累计频数:将各类别的频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论