统计学原理(第3章统计整理)_第1页
统计学原理(第3章统计整理)_第2页
统计学原理(第3章统计整理)_第3页
统计学原理(第3章统计整理)_第4页
统计学原理(第3章统计整理)_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章 统统 计计 整整 理理 教教 学学 目目 的的 通过本章的学习,要求掌握各种不同类通过本章的学习,要求掌握各种不同类 型资料的整理方法、整理原则、以及一些相型资料的整理方法、整理原则、以及一些相 关的概念,并能够利用所学的方法对所给的关的概念,并能够利用所学的方法对所给的 实际资料按照研究目的的要求进行整理。实际资料按照研究目的的要求进行整理。 第三章第三章 统计整理统计整理 统计整理的意义和方法 统计分组的含义和种类 统计分组的方法 统计分布和分配数列的编制 统计表的结构和种类 第三章第三章 统计整理统计整理 统计整理是根据统计研究任务的要求,统计整理是根据统计研究任务的要求,

2、 对调查所搜集到的原始资料进行分组、汇对调查所搜集到的原始资料进行分组、汇 总,使其条理化、系统化的工作过程。总,使其条理化、系统化的工作过程。 一、统计整理的意义 统计整理是统计调查的继续,是统计分析的前统计整理是统计调查的继续,是统计分析的前 提和基础,在整个统计工作中发挥着承上启下的作提和基础,在整个统计工作中发挥着承上启下的作 用。用。 编表:是把汇总的资料按一定的规则在表编表:是把汇总的资料按一定的规则在表 格上表现出来。格上表现出来。 统计整理的方法统计整理的方法 统计整理的方法是分组、汇总和编表。统计整理的方法是分组、汇总和编表。 分组:是根据研究任务的要求分组:是根据研究任务的

3、要求,对调查所得对调查所得 的原始资料的原始资料,确定哪些分组或分类。统计分组是确定哪些分组或分类。统计分组是 统计整理的关键。统计整理的关键。 汇总:是在统计分组的基础上汇总:是在统计分组的基础上,把总体把总体 单位各种标志的标志值汇总起来单位各种标志的标志值汇总起来,汇总主要汇总主要 有手工汇总和电子计算机汇总。有手工汇总和电子计算机汇总。 根据某班根据某班4040名学生统计学考试成名学生统计学考试成 绩分析该班学生考试情况。绩分析该班学生考试情况。 57 89 49 84 86 87 75 73 72 68 57 89 49 84 86 87 75 73 72 68 75 82 97 8

4、1 67 81 54 79 87 95 75 82 97 81 67 81 54 79 87 95 76 71 60 90 65 76 72 70 86 85 76 71 60 90 65 76 72 70 86 85 89 89 64 57 83 81 78 87 72 61 89 89 64 57 83 81 78 87 72 61 按成绩等级分按成绩等级分 组组 人数(人)人数(人) 各组人数占总各组人数占总 人数比重(人数比重(%) 不及格不及格 410.0 及及 格格 6 15.0 中中 1230.0 良良 15 37.5 优优 37.5 合合 计计 40100.0 第三章第三章 统

5、计整理统计整理 再如:通过调查取得再如:通过调查取得100100个企业某月销售额个企业某月销售额 资料:(单位:万元)资料:(单位:万元) 2020,6060,4545,9090,105105,5656,250250,8989,130130, 3030,9898,300300。 将这些数据资料按将这些数据资料按“销售额销售额”的多少进行整的多少进行整 理,得到下列整理结果:理,得到下列整理结果: 销售额(万元)销售额(万元)企业数(个)企业数(个) 0 5012 50 10025 100 15030 150 20023 250 30010 合合 计计100 统计整理的方法:分组、汇总、编表统计

6、整理的方法:分组、汇总、编表 第三章第三章 统计整理统计整理 统计分组统计分组:根据研究任务的要求和现象总体的内在特点, 把统计总体按照某一标志划分为若干性质不 同又有联系的几个部分。 统计分组应统计分组应 达到的要求达到的要求 同一组内的单位性质相同,不 同组所包括的单位性质相异。 二、 例如: 工业企业按经济类型分组,可分为以下几组: 经济类型 企业数(个) 国有企业 1000 合资企业 200 合作经营企业 300 股份制企业 500 工业企业按职工人数分组,可分为以下几组: 职工人数 企业数(个) 500人以下 50 5001000 200 10001500 100 工业企业按地区分组

7、,可分为以下几组: 地区 企业数(个) 北京市 10000 天津市 8000 上海市 11000 统统 计计 分分 组组 的的 种种 类类 按研究任务和作用不同 按分组标志的多少不同 按分组标志的性质不同 类型分组 结构分组 分析分组 简单分组 复合分组 品质分组 变量分组 例:按所有制性质划分,我国现有例:按所有制性质划分,我国现有8种经济类型:种经济类型: 国有经济、集体经济、私营经济、个体经济联营经济国有经济、集体经济、私营经济、个体经济联营经济 、股份制经济、外商投资经济、港澳台投资经济、股份制经济、外商投资经济、港澳台投资经济 例:上海市按例:上海市按GDP计算的三次产业结构(计算的

8、三次产业结构(%) 1980年年 1990年年 1996年年1997年年 GDP 100 100 100 100 第一产业第一产业 3.2 4.3 2.5 2.3 第二产业第二产业 75.7 63.8 54.5 52.2 第三产业第三产业 21.1 31.9 43.0 45.5 例:中国农民家庭按收入分组的恩格尔系数(例:中国农民家庭按收入分组的恩格尔系数(1984年)年) 按收入分组(元)按收入分组(元) 200 300 400 500 600 800 1000 恩格尔系数(恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6 分组标志的选择分组标志的选择

9、选择什么样的分组标志,就会形成什么样的分组结果, 因此,分组标志的选择是统计分组的关键。 选择分组标志的一般原则 必须根据统计研究的目的,在对现象进行分析的基础 上,抓住具有本质性的区别及反映现象内在联系的标 志来作为分组标志。 第三章第三章 统计整理统计整理 变量变量 分组分组 方法方法 以一个变量值代表一组。如:家庭总体按家庭成员 数分为以下几组:一个人的、两个人的、三个人的、 四个人的、五个人的组。这种分组适用于离散性变 量,且变量值的个数较少的情况。 以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。 按品质标志对资料进行分组。这种

10、分组有些比较简 单,如:人口按性别分组、按职业分组、企业按经济类 型分组等。有些非常复杂,复杂的品质分组称为分类。 单项式 分 组 组距式 分 组 三、统计分组方法 品质品质 分组分组 方法方法 第三章第三章 统计整理统计整理 在进行组距分组时,会涉及到一些在进行组距分组时,会涉及到一些 问题,包括:等距分组和不等距分组、组问题,包括:等距分组和不等距分组、组 限、组中值。限、组中值。 第三章第三章 统计整理统计整理 等等 距距 分分 组组 各组组距均相等。如: 1020 2030 3040 以上各组组距均为10。 这种分组适用于均匀分布的总体。 不等距不等距 分分 组组 各组组距不一定相等。

11、如: 1020 2050 5060 6070 以上分组中,其中第二组与其它各组的 组距不同。这种分组适用于资料分布离差较 大或者是为了满足特殊的研究目的的需要。 组限组限 组限就是每一组两端的数值。 10 20 20 30 30 40 下限上限 确定组限的方法有两种:间断式确定组限和重叠式确定组限。 职工人数(人) 99以下 100199 200299 300399 固定资产额(万元) 5060 6070 7080 8090 间断式确定组限 适用于离散变量 重叠式确定组限 适用于连续变量 第三章第三章 统计整理统计整理 组中值 每组上限与下限之间的中点数值,是各组的 假定平均数。 组中值 =

12、(上限值+下限值)2 开口组组中值的计算: 缺下限:组中值=本组上限 相邻组组距/2 缺上限:组中值=本组下限+ 相邻组组距/2 例如产值(万元) 50以下 50 60 60 70 70以上 第一组组中值: 50(102)= 45 最后一组组中值: 70+(102)= 75 第三章第三章 统计整理统计整理 合理确定组中值合理确定组中值 例如:例如: 第一组:第一组:5050人以下人以下 第二组:第二组:5050200200人人 按公式按公式 (不合理)组中值25 2 50200 50 252/500)(组中值 应定下限为应定下限为0 注意注意:当连续型变量按离散变量表示,组距数列的编制:当连续

13、型变量按离散变量表示,组距数列的编制 采取相邻组限不重叠形式,组中值的确定应考虑到连续型采取相邻组限不重叠形式,组中值的确定应考虑到连续型 变量自身的特点。变量自身的特点。(P58) 第三章第三章 统计整理统计整理 (一)统 计 分 布 统计分布又称分配数列统计分布又称分配数列。它是把总 体的所有单位按组归并排列后形成总 体中各个单位在各组间的分布。它由 两部分组成: 总体按某标志所分的组和各组所 拥有的单位数(次数或频数)。 四、统计分布和分配数列的编制 第三章第三章 统计整理统计整理 频率:各组的频率大于频率:各组的频率大于0 0, 各组的频率总和等于各组的频率总和等于1 1或或100%1

14、00%。 工资分组工资分组(元元) 职工人数(人)职工人数(人) (次数或频数)(次数或频数) 各组人数所占比重(各组人数所占比重(%) (频率)(频率) 500600 600700 700800 100 200 100 25 50 25 合合 计计 400 100 (二)分配数列的种类(二)分配数列的种类 分配数列是在分组的基础上形成的,根据分组时采用的分分配数列是在分组的基础上形成的,根据分组时采用的分 组标志不同,分配数列可分为:组标志不同,分配数列可分为: 品质分配数列品质分配数列 变量分配数列变量分配数列 单项式分配数列单项式分配数列 组距分配数列组距分配数列 等距数列等距数列 不等

15、距数列不等距数列 分配数列分配数列 这种数列一般比较稳定,只要分组这种数列一般比较稳定,只要分组 标准定的比较恰当,通常能准确地反标准定的比较恰当,通常能准确地反 映总体的分布特征。映总体的分布特征。 第三章第三章 统计整理统计整理 (三)分配数列的编制(三)分配数列的编制 1 1、品质分配数列的编制、品质分配数列的编制: 只需将品质标志的表现一一排列出来,然后汇总只需将品质标志的表现一一排列出来,然后汇总 出每一种标志表现出现的次数即可。如下例:出每一种标志表现出现的次数即可。如下例: 第三章第三章 统计整理统计整理 100 100 250 250 合合 计计 40 40 32 32 20

16、20 8 8 100 100 80 80 50 50 20 20 国有企业国有企业 股份制企业股份制企业 合资企业合资企业 独资企业独资企业 比重(比重(% %) 企企 业业 数数 经济类型经济类型 第三章第三章 统计整理统计整理 2、变量分配数列的编制:、变量分配数列的编制: 其基本步骤为:其基本步骤为: 第一步:将原始资料按数值大小依次排列。第一步:将原始资料按数值大小依次排列。 第二步:确定变量的类型和分组方法(单第二步:确定变量的类型和分组方法(单 项式分组或组距分组)。项式分组或组距分组)。 第三步:确定组数和组距。当组数确定后,第三步:确定组数和组距。当组数确定后, 组距可计算得到

17、:组距可计算得到: 组距组距 = = 全距全距组数组数 全距全距 = = 最大变量值最小变量值最大变量值最小变量值 第三章第三章 统计整理统计整理 第四步:确定组限。第四步:确定组限。 注意:注意:第一组的下限要小于或等于最第一组的下限要小于或等于最 小变量值,最后一组的上限要大于最大变量小变量值,最后一组的上限要大于最大变量 值值 间断式确定组限:汇总各组单位数时,按照间断式确定组限:汇总各组单位数时,按照“上下限均上下限均 包括在本组内包括在本组内”的原则汇总。的原则汇总。 职工人数(人)职工人数(人) 499499以下以下 500 500 599 599 600 600 699 699

18、700 700 799 799 重叠式确定组限:汇总各组单位数时,按照重叠式确定组限:汇总各组单位数时,按照“上组限不在上组限不在 内内”的原则汇总。的原则汇总。 产值(万元)产值(万元) 50 50 60 60 60 60 70 70 70 70 80 80 80 80 90 90 单位数(个)单位数(个)单位数(个)单位数(个) 因为有了因为有了“上组限不在内上组限不在内”的原则,实际工作中,对的原则,实际工作中,对 于离散型变量也经常采用重叠式确定组限的方法。于离散型变量也经常采用重叠式确定组限的方法。 第五步:汇总出各组的单位数,计第五步:汇总出各组的单位数,计 算频率,并编制统计表。

19、算频率,并编制统计表。 注意注意不同方法确定的组限在汇总单位数不同方法确定的组限在汇总单位数 时是有区别的时是有区别的 序序 计划完成计划完成 工人数工人数 比重比重 向上累计向上累计 向下累计向下累计 号号 程度(程度(%) (人)(人) (%) 人数人数 比重比重 人数人数 比重比重 1 60 70 2 1.0 2 70 80 5 2.5 3 80 90 14 7.0 4 90 100 31 15.5 5 100110 65 32.5 6 110120 52 26.0 7 120130 23 11.5 8 130140 8 4.0 合合 计计 200 100 3、累计频数或频率分配数列的编

20、制方法、累计频数或频率分配数列的编制方法 通过累计频数分配数列可以反映累计到某一组出现的总次通过累计频数分配数列可以反映累计到某一组出现的总次 数或总频率。想一想:第四组的累计结果说明什么问题?数或总频率。想一想:第四组的累计结果说明什么问题? 第三章第三章 统计整理统计整理 2 7 21 52 117 169 192 200 1.0 3.5 10.5 26.0 58.5 84.5 96.0 1008 31 83 148 179 193 198 200 4.0 15.5 41.5 74.0 89.5 96.5 99.0 100 第三章第三章 统计整理统计整理 (四)(四)统计分布的类型统计分布

21、的类型 钟型分布、钟型分布、U U型分布、型分布、 J J型分布、洛伦茨分布型分布、洛伦茨分布 钟型分布:钟型分布: 特征是特征是“两头小,中间大两头小,中间大”,即靠近中间的,即靠近中间的 变量值分布的次数多,靠近两端的变量值变量值分布的次数多,靠近两端的变量值 分布的次数少,其形状宛如一口古钟。分布的次数少,其形状宛如一口古钟。 (见教材(见教材P62P62) U U型分布:型分布: 特征是靠近中间的变量值分布的次数少,特征是靠近中间的变量值分布的次数少, 靠近两端的变量值分布的次数多,其形状靠近两端的变量值分布的次数多,其形状 宛如英文字母宛如英文字母U U。(见教材。(见教材P63P6

22、3) J J型分布:型分布: 特征是次数随着变量值的增大而增多或随特征是次数随着变量值的增大而增多或随 变量值的增大而减少,其形状宛如英文大变量值的增大而减少,其形状宛如英文大 写字母写字母J J。(见教材。(见教材P63P63) 洛伦茨分布:洛伦茨分布: 专门用以检定社会收入分配的平等程度。专门用以检定社会收入分配的平等程度。 第三章第三章 统计整理统计整理 五、统计表的结构和种类五、统计表的结构和种类 从表的内容上看:由主词和宾词组成。主词指总从表的内容上看:由主词和宾词组成。主词指总 体所分的各个组,宾词用来说体所分的各个组,宾词用来说 明主词的各个指标。明主词的各个指标。 统计表是表现

23、统计资料整理结果的表格统计表是表现统计资料整理结果的表格 从表的形式看:由标题、横行和纵栏、数字资料从表的形式看:由标题、横行和纵栏、数字资料 等部分组成。等部分组成。 统计表统计表 的结构的结构 统计表统计表 的种类的种类 按照主词是否分组和分组的程度分为:按照主词是否分组和分组的程度分为: 简单表:主词未经分组的统计表。简单表:主词未经分组的统计表。 分组表:主词按某一标志进行分组的统计表。分组表:主词按某一标志进行分组的统计表。 复合表:主词按两个或两个以上的标志进行分组复合表:主词按两个或两个以上的标志进行分组 的统计表。的统计表。 第三章第三章 统计整理统计整理 一、判一、判 断断 对对 错错 1 1、组中值是根据各组上限和下限计算的平均值,所、组中值是根据各组上限和下限计算的平均值,所 以它代表了各组的平均分配次数。(以它代表了各组的平均分配次数。( ) 2 2、分配数列的实质是把总体单位总量按照总体、分配数列的实质是把总体单位总量按照总体 所分的组进行分配。(所分的组进行分配。( ) 3 3、某企业职工按文化程度分组形成的分配数、某企业职工按文化程度分组形成的分配数 列是一个单项式分配数列

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论