统计学第四章课件_第1页
统计学第四章课件_第2页
统计学第四章课件_第3页
统计学第四章课件_第4页
统计学第四章课件_第5页
已阅读5页,还剩62页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 统计整理,第四章 统计整理,4.1 统计整理概述 4.2 统计分组 4.3 次数分布 4.4 统计数据的表现,第一节 统计整理概述,一、统计整理的概念和内容,制定统计整理方案,审核统计资料,.对资料进行分组和汇总,制作统计表或统计图,二、统计整理的程序,积累、保管和公布统计资料,三、统计资料汇总的方法 (一)手工汇总 划记法 过录法 折叠法 卡片法,编制程序,编码,数据录入,数据运算,(二)计算机汇总,数据的储存与打印,第二节 统计分组,一、统计分组的概念 二、统计分组的作用,统计分组的作用:,总体经过分组,能够突出组与组之间的差异而抽象掉组内各单位之间的差异,使数据变得条理化,便于进

2、一步分析研究。,划分社会经济现象的类型 反映社会经济现象的内部结构和比例关系 揭示社会经济现象之间的数量依存关系,三、统计分组的原则 统计分组的双重含义:分与合 1、正确选择分组标志的原则: 根据统计研究的目的 选择能够反映现象本质的分组标志 结合现象所处的具体历史条件选择分组标志,对大学生月生活费支出情况进行分组研究: 按家庭收入水平分组; 按城乡分组; 按性别分组; 按年龄分组。,统计分组的例子,不符合科学性,2、正确划分各组界限的原则: 组的大小适中 穷尽原则 互斥原则,统计分组的例子,对父母亲下岗情况进行分组研究: 单亲下岗; 双亲下岗; 双亲在岗。,不符合穷尽原则,四、统计分组的种类

3、 (一)按分组标志的性质: 品质分组 数量分组(变量分组) (二)按分组标志的多少: 简单分组 “平行分组体系” 复合分组 “复合分组体系”,平行分组体系,对教师的分类,按性别分类,男性,女性,按职称分类,按年龄分类,高级,中级,初级,青年,中年,共计7组 2+3+2,复合分组体系,按性别分类,按职称分类,按年龄分类,男,女,高级,中级,初级,青年,中年,共计12组232,对教师的分类,五、统计分组的方法 (一)品质分组的方法 (二)数量分组的方法 1、单项分组与组距分组 单项分组适用于变动范围不大的离散型变量 组距分组适用于连续型变量或变动范围较大的离散型变量 2、间断组距分组与连续组距分组

4、 连续组距分组的“上限不在内”原则,3、等距分组与异距分组 等距分组适用于变量值变动比较均匀的情况 异距分组适用于: 标志值分布很不均匀 标志值相等的量具有不同意义 标志值按一定比例发展变化 4、有关分组的计算 组距=上限-下限 (连续组距分组) =本组上限-前组上限=后组下限-本组下限(间断组距分组),组距大小直接关系到组数的多少 确定组数和组距的经验公式Sturges公式: m=1+3.3lgN,代表各组标志值的平均水平,组中值(上限下限)/2,分组组数参考表,当连续型变量按离散型变量表示,分组又采用间断组距分组时:,开口组的组中值计算公式:,缺下限的最小组的组中值上限相邻组组距的一半,缺

5、上限的最大组的组中值下限相邻组组距的一半,组中值=本组下限+组距/2 =(本组下限+后组下限)/2,第三节 次数分布,一、次数分布的概念 次数分布(频数分布):在统计分组的基础上,将总体的所有单位按组归类,并按顺序排列,形成总体中各单位在各组间的分布称为次数分布,又称频数分布。 次数(频数):分布在各组的单位数称为次数,也叫频数。 频率:各组单位数占总体单位总数的比重。,分 类,二、变量数列的编制,主要问题: 1确定分组方式:单项、等距、异距 2确定组数、组距和组限(上、下限) 3分组汇总资料,同时 具备,变量数列的编制,【例】己知某车间有24名工人,他们的日产量(件)分别是:20,23,20

6、,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根据以上资料编制变量数列。,编制结果如下:,变量数列的编制,变量值变动区间的长度相等,变量值变动区间的长度不完全相等,相关概念,某地区100个百货 商店月销售额情况,上组限U,下组限L,如:组距d=U-L =200-100=100(万元),如:组中值x=(U+L)/2 =(200+100)/2 =150(万元),编制等距数列,适用于总体单位的标志值变动比较均匀的情况,实例,己知某地区某年50个商店商品销售额的资料如下(单位:百万元): 7.4 12.6 29.0

7、2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0 要求编制组距数列。,编制步骤:,按大小排序,求全距,确定组距及组数,R组距(d) 组数(m),编制等距数列,计算组数(组数不宜过多,也不宜太少),上例中,取

8、d=5,则有,编制等距数列,确定组限,编制等距数列,(一)频率及其性质,(二)频数密度与频率密度 频数密度=频数/组距 频率密度=频率/组距 各组频数密度与组距乘积之和等于总体单位数 各组频率密度与组距乘积之和等于1,三、累计频数与累计频率,累计频数(频率),从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。,从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。,累计频数分布的特点,累计频率分布的特点,累计频数(频率)分布图,在直角坐标点系上将各组组距的上限与其相应的累计频数(频率)构成坐

9、标点,依次用直线(或光滑曲线)相连 。,在直角坐标点系上将各组组距的下限与其相应的累计频数(频率)构成坐标点,依次用直线(或光滑曲线)相连 。,洛伦茨(Lorenz)曲线,用于研究财富、土地和工资收入等的分配是否公平。 它的绘制方法。,某国家收入所得的分配情况,基尼系数,其中, 表示实际收入分配曲线与绝对平等线所包围的面积, 表示实际收入分配曲线与绝对不平等线所包围的面积. G越接近于0,说明收入分配越平均;G越接近于1,说明收入分配的差异越大。,第四节 统计数据的表现,一、统计表 (一)统计表的定义和结构 1.定义:统计调查所得来的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这

10、些数据按一定的顺序排列在表格上,就形成了统计表。 2.结构: 从表的形式看,包括四大部分:总标题、横行标题、纵栏标题和指标数值 。 从内容看,包括主词栏和宾词栏两个部分 。,统计表的结构,横行标题,纵栏标题,指标数值,总标题,附加,(二)统计表的分类,1.按用途,广义的统计表可分为: (1)调查表 (2)整理表或汇总表 (3)分析表,2.按主词结构(主词是否分组和分组的程度)分 (1)简单表 (2)简单分组表 (3)复合分组表,2005年北京市主要社会经济指标,资料来源:北京市统计年鉴2006。,简单表,2004-2005年北京市地区生产总值及其构成表,资料来源:中国统计年鉴2000年。,资料

11、来源:北京市统计年鉴2006年。,简单分组表,2005年北京市地区生产总值构成情况表,资料来源:北京市统计年鉴2006年。,复合分组表,3.按宾词设计分类 (1)宾词简单排列 (2)宾词分组平行排列 (3)宾词分组层叠排列。,20042005年北京市社会商品购进、销售、库存总值 单位:万元,资料来源:北京市统计年鉴2006年。,宾词简单排列,各地区社会商品零售总额 单位:亿元,宾词分组平行排列,20012005年各年从业人员分布表,宾词分组层叠排列,(三)统计表的设计 1.表式设计应注意的事项: (1)形状的设计 (2)线条的绘制 (3)合计栏的设置 (4)栏次较多时需编号,2.内容设计应注意的事项: (1)标题设计 (2)指标数值 (3)计量单位 (4)注解或资料来源,二、统计图 常用的图形有三种:直方图、折线图和曲线图,某班学生统计学考试成绩次数分布表,(一)直方图,学生成绩次数分布直方图,(二)折线图,学生成绩次数分布折线图,(三)曲线图,学生成绩次数分布曲线图,三、频数分布的类型 (一)钟型分布:两头小,中间大 分为:对称分布(图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论