第3章 统计整理_第1页
第3章 统计整理_第2页
第3章 统计整理_第3页
第3章 统计整理_第4页
第3章 统计整理_第5页
已阅读5页,还剩73页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第3章 统计整理1第三章 统计(数据)整理 第一节第一节 统计整理的概念统计整理的概念 第二节第二节 统计分组与统计分布(频数分布)统计分组与统计分布(频数分布) 第三节第三节 数据的显示数据的显示统计图和统计表统计图和统计表下一页返回目录本章内容本章内容第3章 统计整理2第一节 统计整理的概念 n一、统计整理意义一、统计整理意义n二、统计整理的步骤二、统计整理的步骤n三、三、ExcelExcel中的统计整理工具中的统计整理工具上一页下一页返回本章首页第3章 统计整理3一、统计整理的意义 统计整理是根据统计研究的任务,对调查统计整理是根据统计研究的任务,对调查所搜集到的大量原始资料进行分组和汇

2、总,使所搜集到的大量原始资料进行分组和汇总,使其系统化、条理化,以得出反映事物总体综合其系统化、条理化,以得出反映事物总体综合特征的资料的工作过程。特征的资料的工作过程。上一页下一页返回本节首页第3章 统计整理4一、统计整理的意义n统计整理在整个统计工作过程中的地位:统计整理在整个统计工作过程中的地位: 起着承前启后的作用。起着承前启后的作用。第3章 统计整理5二、统计整理的步骤 1.1.对数据进行审核对数据进行审核 审核无误后,将数据录入计算机,审核无误后,将数据录入计算机,建立数据表。建立数据表。 数据表可以作为数据库使用。数据表可以作为数据库使用。上一页下一页返回本节首页第3章 统计整理

3、62. 2. 数据排序数据排序 一般来说,录入的数据是无序的,一般来说,录入的数据是无序的,不能反映现象之本质与规律性,为了使不能反映现象之本质与规律性,为了使用的方便,要将其进行排序,以便数据用的方便,要将其进行排序,以便数据按要求排列。按要求排列。上一页下一页返回本节首页二、统计整理的步骤3. 3. 数据分组并编制统计表数据分组并编制统计表 将已排序的数据进行分组,并编制次数将已排序的数据进行分组,并编制次数分布表与累计次数分布表分布表与累计次数分布表 分组的目的是使性质相同的数据归为一组,性质不同的分组的目的是使性质相同的数据归为一组,性质不同的数据分开,使数据之间的差异性显示出来。数据

4、分开,使数据之间的差异性显示出来。 次数分布表次数分布表能表明各单位数在各组间的分布的状态,从能表明各单位数在各组间的分布的状态,从而描述出总体的内部结构,揭示总体的本质特征(见而描述出总体的内部结构,揭示总体的本质特征(见2929页)页) 累计次数分布表累计次数分布表则能够表明各标志值以上或以下所出现则能够表明各标志值以上或以下所出现的次数或比重(见的次数或比重(见3030页)页)第3章 统计整理7二、统计整理的步骤第3章 统计整理84. 4. 制作统计图制作统计图 将将次数分布的数据次数分布的数据画出各种各样的画出各种各样的统计图,可以形象、直观地表明数据的统计图,可以形象、直观地表明数据

5、的分布形态与发展变化的趋势。分布形态与发展变化的趋势。 上一页下一页返回本节首页二、统计整理的步骤第3章 统计整理9三、 Excel中的统计整理工具 1.1.数据排序数据排序 Excel可以根据用户的要求对数据表的行或列数据进行排序。排序时,Excel 将利用指定的排序顺序重新排列行、列或各单元格,从而使现象的规则性更加简洁地表现出来。上一页下一页返回本节首页第3章 统计整理10 2.2.频数分布函数频数分布函数 频数分布函数频数分布函数是Excel 的一个工作表函数,是编制次数分布的主要工具,通过频数分布函数,可以对数据进行分组与归类,从而使数据的分布形态更加清楚地表现出来。3.3.数据透视

6、表数据透视表 数据透视表数据透视表是一种交互式工作表,用于对已有数据表和数据库中的数据进行汇总和分析的一种工具。上一页下一页返回本节首页三、 Excel中的统计整理工具第3章 统计整理114.4.统计图统计图 Excel可以绘制许多图表,其中大部分是统计图,可用于数据的整理与分析,能够直观形象地描述现象的数量规律性。上一页下一页返回本节首页三、 Excel中的统计整理工具第3章 统计整理12第二节 统计分组与统计分布(频数分布) n一、统计分组的意义和作用一、统计分组的意义和作用n二、二、统计统计分组的方法分组的方法n三、统计分布(频数分布、分布数列、分配三、统计分布(频数分布、分布数列、分配

7、数列)数列)上一页下一页返回本章首页一、 统计分组的意义和作用第3章 统计整理13 就是根据统计研究的需要,将总体按照一定的标志区分为若干个组成部分的一种统计方法。第3章 统计整理14一、 统计分组的意义和作用第3章 统计整理15一、 统计分组的意义和作用互斥原则完备原则第3章 统计整理16(1)划分现象的类型(2)揭示现象内部结构(3)分析现象之间的依存关系 上一页下一页返回本节首页一、 统计分组的意义和作用第3章 统计整理17 某年我国的社会商品零售额资料一、 统计分组的意义和作用零售额零售额比重比重(%)(%)国有城镇集体其他8014.55.5合计100第3章 统计整理18 某年我国农民

8、的消费结构如下 一、 统计分组的意义和作用 分分 类类 比比 重重(%)(%)消费品 其中:食品 其他劳务97.7662.6837.322.24 合 计100商场按流转额分组商场数 各组商品流通费用率%50万元以下50200万元200400万元400600万元600800万元8001000万元1000万元以上25701307540181011.210.49.96.75.95.05.5商品流转额和流通费用率之间有依存关系。其中,流通费用率=费用额/销售额第3章 统计整理20(1)按分组标志的多少,分为简单分组和复合按分组标志的多少,分为简单分组和复合分组。分组。 简单分组简单分组是按一个标志对总

9、体进行分组。 复合分组复合分组是用两个或两个以上的标志层叠在一起对总体进行分组。一、 统计分组的意义和作用第3章 统计整理21n如对学生按学科、学历、性别分组 学科 学历 性别 文科 大专 男生 女生 本科 研究生及以上 理工科一、 统计分组的意义和作用第3章 统计整理22n说明:n平行分组体系平行分组体系:多个简单分组构成一个平行分组体系。n复合分组体系复合分组体系:复合分组本身构成复合分组体系。一、 统计分组的意义和作用第3章 统计整理23(2)按分组标志的性质不同可分为按分组标志的性质不同可分为 按品质标志分组(属性分组)按品质标志分组(属性分组) 按数量标志分组(变量分组)按数量标志分

10、组(变量分组)一、 统计分组的意义和作用第3章 统计整理24 按品质标志分组按品质标志分组:就是以反映事物属性差异的标就是以反映事物属性差异的标志作为分组标志,将总体分为若干性质不同的组成部志作为分组标志,将总体分为若干性质不同的组成部分。如按性别分组分。如按性别分组上一页下一页返回本节首页一、 统计分组的意义和作用第3章 统计整理25 品质标志分组,按复杂程度大致可分为三品质标志分组,按复杂程度大致可分为三种情况:种情况: 在分组标志下各单位性质差异比较明确,区分比较容易,因而各组划分比较简单; 在分组标志下存在性质差异的过渡形态,以致差异界限不分明; 有些现象本身情况复杂,对其分组须经过实

11、际和理论的深入考察、分析与研究,以确定分组原则和可供操作的划分标准及界限。一、 统计分组的意义和作用 例如:我国现行的工业行业分类就是按照产品使用方向、生产设备及生产工艺流程、使用原材料这样三个标志,把工业划分为40个大类,197个中类和611个小类。第3章 统计整理26一、 统计分组的意义和作用第3章 统计整理27 按数量标志分组按数量标志分组:从某个变量的差异程度上来区分各种类型。 具体又可分为单项式分组和组距式分组。一、 统计分组的意义和作用第3章 统计整理28 单项式分组:离散变量的每个变量值为一组。单项式分组:离散变量的每个变量值为一组。例如例如 工人平均日产量资料工人平均日产量资料

12、 上一页下一页返回本节首页一、 统计分组的意义和作用工人平均日产量工人平均日产量(件件)工人数工人数绝对数比重(%)2345610153040208.713.026.134.817.4合 计115100.0第3章 统计整理29组距式分组:以变量值的一定变动范围为一组。组距式分组:以变量值的一定变动范围为一组。上一页下一页返回本节首页组距式分组还可以细分为等距分组和异距分组。组距式分组还可以细分为等距分组和异距分组。一、 统计分组的意义和作用第3章 统计整理30二、统计分组的方法二、统计分组的方法 统计分组的关键问题是选择分组标统计分组的关键问题是选择分组标志和划分各组界限。志和划分各组界限。

13、1 1、分组标志的选择原则:、分组标志的选择原则:根据研究的目的选择分组标志根据研究的目的选择分组标志要选择最能反映事物本质特征的标志要选择最能反映事物本质特征的标志根据现象的历史条件和经济条件选择分根据现象的历史条件和经济条件选择分组标志组标志第3章 统计整理31二、统计分组的方法二、统计分组的方法第3章 统计整理322 2、各组界限的划分、各组界限的划分 分组标志确定后,则应划分各组界限。分组标志确定后,则应划分各组界限。 如果是按品质标志分组的如果是按品质标志分组的,各组之间界限的,各组之间界限的划分比较简单。划分比较简单。 如果是按数量标志分组的如果是按数量标志分组的,组和组之间的界,

14、组和组之间的界限的划分则需详细分析和比较。下面主要研究限的划分则需详细分析和比较。下面主要研究此种分法。此种分法。二、统计分组的方法二、统计分组的方法第3章 统计整理33三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)统计分布的概念与种类统计分布的概念与种类 1 1、定义、定义 在统计分组的基础上,将总体的所有单位在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体按组归类整理,并按一定顺序排列,形成总体中各个单位在各组间的分布,称为统计分布,中各个单位在各组间的分布,称为统计分布,又称次数分配、频数分配或分配数列。又称次数分配、

15、频数分配或分配数列。 上一页下一页返回本节首页第3章 统计整理34三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)2 2、分配数列的构成要素、分配数列的构成要素上一页下一页返回本节首页次数:分布在各组间的总体单位数,又称频数。次数:分布在各组间的总体单位数,又称频数。 用用f f表示表示频率:次数的相对数,各组次数占总次数的比重。频率:次数的相对数,各组次数占总次数的比重。 用用f/ff/f表示表示第3章 统计整理363 3、分配数列的分类、分配数列的分类三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)第3章 统计

16、整理371 1、变量数列的种类:、变量数列的种类: 单项式:一个变量值代表一组。 组距式:一组变量值代表一组。 其中:组距式又分为等距式和不等距式两种 (二)变量数列(二)变量数列三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)等距式等距式上一页下一页返回本节首页不等距式不等距式上一页下一页返回本节首页(三)影响变量数列分布的要素(三)影响变量数列分布的要素第3章 统计整理40三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)组数、组距、组限、组中值第3章 统计整理411 1、组数(、组数(n n):某个变量数列共分

17、多少组):某个变量数列共分多少组 组数的确定有两种方式: (1)根据对资料的定性分析确定 (2)Sturges(斯特奇斯)经验公式: 其中,K表示组数,n表示数据的个数。 实际中,根据经验,研究总体分布时,分组的数目一般不低于5组,不高于15组。nnKlg322. 312lglg1三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)第3章 统计整理422 2、组距(、组距(d d):指各组中的最大值与最小值之差):指各组中的最大值与最小值之差 组距数列可以分为等距数列和不等距(异距)数列。 对于等距数列,可根据全部数据的最大最小值及组数来确定。计算公式为:组

18、距=(最大值-最小值)/组数 对于等距数列,两者的关系:对于等距数列,两者的关系:当全距(R)一定时,组数的多少和组距的大小成反比 对于不等距数列,组数根据实际情况确定。三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)第3章 统计整理43n注:对于等距数列,由于各组组距相等,各组频数多少不受组距的影响,所以分布密度与分布频数一致。不等距数列由于各组组距不同,分布密度与分布次数不同。n为了说明各组分布的疏密程度,可采用计算频数密度的方法消除组距因素对频数的影响。n频数密度是指单位组距的分布次数。n频数密度频数密度=各组次数各组次数/组距组距三、统计分布(频

19、数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)第3章 统计整理44n例:某单位有高级职称人员年龄分布数列:年龄分组/岁人 数频数密度3034354950596064245120380.43.012.07.6合 计205三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)第3章 统计整理453 3、组限:、组限:定义:定义:组距的两个端点称为组限,是各组的数量界限。 一个组中的最大值为组上限,最小值为组一个组中的最大值为组上限,最小值为组下限。下限。 若一组内只有上限或者只有下限,称此组为开口组开口组;上限与下限齐全的为闭口组闭口组。

20、三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)第3章 统计整理46组限的划分:组限的划分:na)最低组的下限应小于至多等于原始资料中的最小值,最高组的上限应大于至少等于原始资料的最大值,以保证分组的完备性。nb)若变量为连续型,相邻组的组限必须重叠;在统计次数时,应遵循的原则为:上组限不统计在本组内。(29页)nc)若变量为离散型,相邻组的组限应该断开。三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)第3章 统计整理474 4、组中值:各组上限和下限之间的中点值。、组中值:各组上限和下限之间的中点值。公式为:公式

21、为:n注意开口组的组中值的求法:注意开口组的组中值的求法:缺下限组的组中值缺下限组的组中值 = 首组上限首组上限 相邻组组距相邻组组距 / 2缺上限组的组中值缺上限组的组中值 = 末组下限末组下限 + 相邻组组距相邻组组距 / 22下限上限组中值三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)第3章 统计整理48n注意实际问题;西瓜按重量分为三组:三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)重量重量组中值组中值2斤以下2-6斤6斤以上4总结:对变量数列分组应注意总结:对变量数列分组应注意n分组不能过粗,也不能过

22、细 1、分组过粗,容易将不同质的单位分在同组,看不出总体分布的特征。n 某班统计学成绩(最低分56,最高分99) 分 数人 数566060100238合 计40 2 2、分组过细,容易将具有相同性质的单位分、分组过细,容易将具有相同性质的单位分开,也反映不出总体的分布特征。开,也反映不出总体的分布特征。 分分 数数人人 数数56606064646868727276768080848488889292969610023413745344合合 计计40 3 3、如下分法,则基本上能反映出总体分布、如下分法,则基本上能反映出总体分布的特征。的特征。 分 数人 数5060607070808090901

23、002711128合 计40第3章 统计整理52三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列) 例:某地区30户居民人均月收入抽样调查资料如下:(单位:元) 730 630 550 720 420 440 620 540 600 440 640 650 660 470 640 680 610 430 700 660 620 520 670 460 600 490 630 590 610 710举例说明组距数列编制过程举例说明组距数列编制过程第3章 统计整理53三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)(1)

24、将原始资料按大小顺序排列,确定总体的最大值、最小值。420 430 440 440 460 470 490 520 540 550 590 600 600 610 610 620 620 630 630 640 640 650 660 660 670 680 700 710 720 730 (2)确定编制数列的类型,即编制单项式数列或组距式数列。第3章 统计整理54三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)第3章 统计整理55三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)(3)确定组数和组距。n A、对资料

25、进行定性分析,可将其分为高收入、中等偏上、中等收入、低收入四种类型,故设定为4组,组距为n B、若用Sturges(斯特奇斯)经验公式元元组数全距组距805 .774310691. 530lg322. 31组数第3章 统计整理56三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)(4)确定组限(5)计算各组次数,编制频数分布表第3章 统计整理57三、统计分布(频数分布、分布数列、分配数列)三、统计分布(频数分布、分布数列、分配数列)按月收入分组户 数40050050060060070070080074154合 计301 1、钟型分布钟型分布n主要特征是两头

26、小、中间大,即靠近中间的变量值分布的频数多,靠近两端的变量值分布的频数少。绘成曲线宛如一口古钟。例P38n如人的身高、学生的考试成绩即为该分布第3章 统计整理58四、次数分布的类型四、次数分布的类型n正态分布(对称分布)n正偏(右偏)分布n负偏(左偏)分布第3章 统计整理59四、次数分布的类型四、次数分布的类型2 2、“U”“U”分布分布n“U”分布的特征与分布的特征与“钟型分布钟型分布”恰好相恰好相反:靠近中间的变量值分布的频数少,反:靠近中间的变量值分布的频数少,靠近两端的变量值分布的频数多,形成靠近两端的变量值分布的频数多,形成两头大、中间小的分布特征。(两头大、中间小的分布特征。(P3

27、8)n如按年龄分组的人口如按年龄分组的人口死亡率即为死亡率即为“U”分分布布第3章 统计整理60四、次数分布的类型四、次数分布的类型3 3、“J J”分布分布n“J J”分布有两种:正分布有两种:正“J J”分布和反分布和反“J J”分布(分布(P38)n正正“J J”分布:频数随着变量值的增大而分布:频数随着变量值的增大而增多。如投资额与利润率的关系增多。如投资额与利润率的关系n反反“J J”分布:频数随着变量值的增大而分布:频数随着变量值的增大而减少。如价格和销售量的关系减少。如价格和销售量的关系第3章 统计整理61四、次数分布的类型四、次数分布的类型第3章 统计整理62第三节 数据的显示

28、统计图和统计表 一、统计图一、统计图 二、统计表二、统计表 上一页下一页返回本章首页第3章 统计整理63一、统计图一、统计图n常用的统计图有四种:直方图、折线图、曲线图、茎叶图。n见书上P35第3章 统计整理64分组数据直方图(histogram)n1.用矩形的宽度和高度来表示频数分布的图形,实际上是用矩形的面积面积来表示各组的频数分布n2.在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图第3章 统计整理65n注:对于异距数列,由于各组组距不同,频数的差异不能直接表明变量的分布特征。制作直方图时,要先计算出各组的频数密度,然后以组距为宽,以频数密

29、度为高画直方图。第3章 统计整理66分组数据分组数据折线图折线图(frequency polygon)1.折线图也称频数多边形图2.是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是n第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴n折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的第3章 统计整理67分组数据分组数据曲线图曲线图n当变量数列的组数无限增多时,折线便趋于一条平滑的曲线。n曲线图的画法与折线图基本类似,只是在连接各个坐标点

30、时,用平滑曲线而不是用折线。第3章 统计整理68未分组数据茎叶图(stem-and-leaf display)1.用于显示未分组的原始数据的分布2.由“茎”和“叶”两部分构成,其图形是由数字组成的3.以该组数据的高位数值作树茎,低位数字作树叶4.树叶上只保留一位数字5.茎叶图类似于横置的直方图,但又有区别n直方图可观察一组数据的分布状况,但没有给出具体的数值n茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息 例如某生产车间例如某生产车间5050名工人日加工零件数(单位:名工人日加工零件数(单位:个)如下:个)如下: 117 122 124 129 139 107 11

31、7 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121第3章 统计整理69未分组数据茎叶图(stem-and-leaf display)根据以上数据制成的茎叶图如下图所示: 茎茎 叶叶 频数频数 10 788 3 11 0223457778889 13 12 001222233334445566777889

32、 24 13 0133445799 10第3章 统计整理70未分组数据茎叶图(stem-and-leaf display)第3章 统计整理71二、统计表二、统计表统计表的构成:统计表的构成: 1.1.从表式上看从表式上看,由表头 (总标题)、横行标题、纵栏标题和指标数值四个部分组成。 2.2.从内容上看从内容上看,也可分为主词栏和宾词栏。n主词栏是表中所要说明的总体及其组成部分,一般位于表的左边;n宾词栏是各种指标,包括指标名称和指标数值,位于表的右边。n例见P P3131第3章 统计整理72统计表的结构19992000年城镇居民家庭抽样调查资料年城镇居民家庭抽样调查资料项目项目单位单位1999年年 2000年年 调查户数调查户数 平均每户家庭人口平均每户家庭人口 平均每户就业人口平均每户就业人口 平均每户就业面平均每户就业面 平均一就业者负担人数平均一就业者负担人数 平均每人全部年收入平均每人全部年收入 可支配收入可支配收入 平均每人消费性支出平均每人消费性支出户户人人人人%元元元元元元元元 400443.141.7756.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论