




已阅读5页,还剩61页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第三章 统计整理,2,主要内容,第一节 统计数据整理的概述 第二节 统计分组 第三节 分配数列 第四节 统计表和统计图,3,一、数据审核(Data Auditing) 是指在进行数据整理之前对原始数据的审查与核对。 数据整理是按照数据分析的要求进行的,数据分析的思路和目的决定着数据整理的分类或分组。基于人类认识活动的渐进性,往往需要采用不同的分组方式对原始数据进行反复整理,以便得出正确的认识结论。,第一节 统计数据整理的概述,4,二、数据审核的内容,1、时效性的审核 检查是否在规定的调查时间内完成数据的搜集工作,采集的数据是否为规定调查时点上或规定的调查时段内的数量特征,以保证统计数据在时间上的准确性和可比性。 2、准确性的审核 检查是否每一调查单位的特征都无偏差、无失真、准确无误地记录在登记资料中,抽样调查的误差是否有效地控制在规定的范围内.,3、一致性的审核 检查统计数据在时间和空间上的连续性和 可比性。,5,三、数据审核的方式 1、逻辑审核 检查原始数据中各项数据是否合理的数据审核方式。要求检查人员具备较强的逻辑推理能力和丰富的专业知识及数据审核经验。 2、技术审核 对调查数据原始登记表和其他原始材料进行机械性核对的数据审核方式。由于技术检查是一种机械性的核对,一般可采用专门的计算机软件来实现。,6,四、数据的排序,数据排序是指将一组数据按照大小、高低、优劣等顺序进行依次排列的过程。 数据排序为计算取值范围、最大值、最小值等总体参数提供了便利,有助于人们了解数据大致的分布状态。数据排序也是有效地进行数据分类或分组的前期准备工作。 数据排序可以使用计算机软件来实现, Excel就具有很强的数据排序功能。,7,第二节 统计分组,一、统计分组的概念 统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干个不同类型或性质的部分的一种统计方法。 统计分组具有两方面含义: 对总体而言是“分”,即将总体分为性质相异的若干部分。对总体单位而言则是“合”,即将性质相同的总体单位组合起来。,8,二、统计分组的作用与原则 1、统计分组的作用(P40-42) 划分现象的类型; 揭示现象的内部结构; 分析现象之间的内在关系: 正依存关系:现象之间成同向变动 负依存关系:现象之间成反向变动 2、统计分组的原则 穷尽原则:组数有限且不宜过多。 互斥原则:组间的差异、界限要分明。,9,三、分组标志的选择,(一)选择分组标志的原则 P42 1.目的性原则:根据研究问题的目的选择分组标志。 2.本质性原则:选择最能反映现象本质特征的标志分组。 例如反映家庭生活水平的因素:总收入?平均收入? 研究学生的学习状况:成绩?性别?年龄?籍贯?,3.具体条件原则:结合现象所处的具体历史条件或经济条件选择分组标志。,10,(二)统计分组的种类,按分组标志个数不同分为: 简单分组与复合分组 P44,简单分组,11,工业企业按经营组织形式和规模大小同时进行分组 按经营组织形式分组: 按规模分组: 大型企业 内资企业 中型企业 小型企业 大型企业 港澳台商投资经营企业 中型企业 小型企业 大型企业 外商投资经营企业 中型企业 小型企业,复合分组,12,2按分组标志性质不同可分为: 品质标志分组和数量标志分组,品质标志分组,数量标志分组,13,1)品质标志分组:对总体按照品质标志分组,如人口按性别分组;企业按所有制、行业分组等属于简单分组;复杂分组有国家制定统一的分类目录。(P44) 2)数量标志分组:对总体按照数量标志分组,具体又分为以下两种情况: 单项式分组:是以一个变量值为一组的分组方法,只适用于离散型变量的分组。,14,组距式分组:是按变量变动的一定区间来分组的方法。既适用于连续型变量,也适用于离散型变量。具体又分为以下两种情况: 等距分组与异距分组:根据变量值变动的均匀性来确定。均匀变动的变量适合用等距分组,否则应选择异距分组。 说明:离散型变量采用单项式分组还是组距式分组主要取决于变量值的多少和变量值变动范围的大小,变量值少且变动范围小的用单项式分组,反之用组距式分组。,15,一、分配数列的概念和种类 (一)分配数列的概念(P46) 在数据分组的基础上,将总体的所有单位按组归类整理,并按一定的顺序排列,形成总体中各个单位在各组间的分布就称为分配数列(次数分布)。分布在各组的总体单位数叫次数或频数,各组次数与总次数之比叫比重或频率。, 第三节 分配数列,16,(二)分配数列的种类,分配 数列,单项式数列,组距式数列,等距分组,异距分组,品质分配数列 (品质数列),数量分配数列 (变量数列),17,中国2005年人口状况品质分配数列,各组名称,次数或频数,比率或频率,(品质分组标志),(品质分组标志),18,变量数列单项式数列 某企业工人平均日产量(离散变量),变量,次数,比率或频率,19,变量数列等距数列 某厂工人生产定额完成情况表(连续变量),变量,次数,比率或频率,20,二、单项式数列的编制,1、对变量值排序 通常按照由小到大的顺序来排列。,例如,某生产车间21名工人日加工零件数资料如下: 117 108 110 117 110 117 130 114 110 114 128 120 110 120 108 117 124 114 120 117 124,21,2、某车间21名工人日加工零件分组表,22,三、组距数列的编制,(一)组距与组数 首先对已取得的调查数据进行排序(P48)。 1、组、组限和组距的概念 在组距数列中用变量变动的一定范围代表一个组。每个组的最小值为该组的下限,最大值为该组的上限,下限与上限合称为组限,每个组上限和下限之间的距离称为组距。,23,2、组数和组距的关系,组数:即整个组距数列中所包含的组的个数 组数的多少和组距的大小成反向变动关系:组距大则组数少,组距小则组数多。因此,组距的大小会直接影响组数的多少。 确定组距的原则:体现组内资料的同质性和组间资料的差异性。一般取510的倍数为宜。学生按考试成绩分组:,24,某班学生统计学考试成绩统计表,不及格,及格,中等,良好,优秀,体现组内资料的同质性和组间资料的差异性,25,(二)等距分组和异距分组,按组距是否相等可将组距数列分为: 1、等距数列:是指各组组距都相等的组距数列。 适用范围:适用于变量值变动比较均匀的现象,即各组间性质差异是由变量值均匀增加或减少而引起的。(P50)例如,成绩、身高、体重、计划完成程度等。,26,等距数列可绘制次数分布直方图和次数分布折线图,直方图的面积与折线图所围成的面积相等。折线两端应在直方图的左右两边各延伸一个假想组,并连接至假想组的中点。 根据分组表绘制次数分布直方图 次数分布折线图,27,某班学生统计学考试成绩表,28,29,30,2、异距数列:指各组组距不完全相等的组距数列。 1)适用范围:当总体的分布存在明显的偏斜状况时,变量不适合等距分组;总体单位的变量变动范围较大,若变量按一定比例关系发展变化的话可按等比间隔分组编制异距数列(P52)。例如,炼钢高炉按容积(m3)的异距分组为:,31,钢炉容积(m3) 组 距 100以下 100200 100 200400 200 400800 400 8001600 800 1600以上 组距间隔等比为2,32,2)次数密度与频率密度,在异距数列中,由于各组组距不完全相同,因此分布在各组中的次数就不具有可比性。要使各组的次数可比,必须要消除组距不同的影响将不等组距的次数换算为标准组距次数。 标准组距的确定:选择数列中最小的组距。 次数密度:单位组距内分布的次数。公式: 次数密度=各组次数各组组距 频率密度:单位组距内分布的频率。公式:,33,频率密度=各组频率各组组距 通过标准组距次数或次数密度将异距数列中不可比的各组次数换算成可比的各组次数,并可根据标准组距次数或次数密度来绘制次数分布直方图和次数分布折线图,用以反映总体的数量分布特征。 现以某厂工人年龄分布情况为例,将上述两种方法的换算结果列成表格,并绘制次数分布直方图和次数分布折线图,并与等距数列进行比较。,34,某厂工人年龄分布情况表,标准组距为组距最小值5,35,年龄,人数,未经处理的异距数列直方图,36,次数密度,某厂工人年龄次数分布直方图,异距数列,标准组距人数,年龄,37,标准组距人数,异距数列,A,B,C,D,某厂工人年龄次数分布折线图,次数密度,年龄,B+D 与 A+C哪一个要大一些?,38,(三)组限与组中值,1、组限:组距两端的数值称为组限。 组限的确定也是统计分组中的重要问题。 确定组限的原则: 体现组内的同质性和组间的差异性 “上组限不在内”原则 只要遵循“上组限不在内”的原则,无论是连续变量还是离散变量均可以采用相邻两组的上限和下限共用同一个数值做组限的方法。,39,2、组中值:是各组变量范围的中间数值,可以根据各组的上限与下限的简单平均数来确定。 组中值=(上限+下限) 2 为什么要计算组中值 原因:组距数列是按变量变动的一段区间来分组的,它掩盖了分布在各组内的各单位的实际变量值。为了反映每一组变量值的一般水平,统计上就用组中值来代表每一组变量值的一般水平。例:,40,学生按体重(公斤)进行分组: 40以下 39.9以下 39.99以下 4045 4044.9 4044.99 4550 4549.9 4549.99 5055 5054.9 5054.99 5560 5559.9 5559.99 6065 6064.9 6064.99 65以上 65以上 65以上,41,某班学生统计学成绩分布情况表,组中值 =(上限+下限) 2 = 下限 + 组距/2 = 上限 - 组距/2,42,3、开口组组中值的确定: 开口组:是组限不齐全的组,可分为有上限缺下限和有下限缺上限两种。 缺上限的开口组组中值=,缺下限的开口组组中值=,43,5=10 -(20-10)2 85=70 +(70- 40)2,开口组,开口组,国有工业企业净产值完成情况分组表,44,四、累计次数分布,(一)次数分布:是指总体中各单位数在各组间的分布。次数分布是统计研究的一个基本课题,通过次数的分布规律,可以研究大量现象的统计规律性。P54 (二)累计次数分布:是指将变量数列各组的次数和频率逐组累计相加而成的。有两种累计方法:,45,1.向上累计(较小制累计,上限以下累计),是将各组次数或比率,由变量值低的组向变量值高的组逐组累计的方法。 含义:表明各组上限以下总共所包含的总体次数或比率有多少。,46,是将各组次数或比率,由变量值高的组向变量值低的组逐组累计的方法。 含义:表明各组下限以上总共所包含的总体次数或比率有多少。,2.向下累计(较大制累计,下限以上累计),47,某班统计学考试成绩次数分配表,考 分,48,(三)累计次数的特点:(P55) 同一数值的向上累计和向下累计次数之和等于总体总次数,而累计比率之和等于1或100%。 单项数列也可以计算累计次数和累计比率。 累计次数分布是确定各种位置平均数的依据;累计次数分布图还可以用于研究社会财富分配的公平程度等问题。 累计次数分布折线图见下表:,49,考分,累计次数分布折线图,40,38,31,20,8,2,9,20,32,40,50,五、次数分布的类型,(一)钟型分布 特点:“两头小中间大”,即两头次数分布少,中间次数分布多。,变量,次数,a.对称分布(正态分布) 中轴线两边的图形 完全对称。,51,b. 右偏分布: 当变量值中存在极大值时,次数分布曲线就会向右延伸,即右偏。,次数,变量,0,52,C.左偏分布:当变量值中存在极小值时,次数分布曲线就会向左延伸,即左偏。 许多社会经济现象都接近正态分布,如市场价格、学生成绩、职工的工资等。,次数,变量,53,(二)U型分布 特征:“两头大,中间小”,即中间变量值分布的次数少,两端变量值分布的次数多。其分布图形像英文字母“”字。,变量,次数,(d)型分布,0,54,(三)J型分布 特征:“一边小,一边大”,即大部分变量值集中在某一端分布,分布曲线图像英文字母“”字。具体分布有两种类型:,次数,次数,变量,变量,()正型分布,()反型分布,0,0,55,第四节 统计表和统计图,一、统计表的定义与作用 (一)统计表的定义:将通过汇总整理的系统化的统计资料,按一定顺序填列在一定的表格内,这种表格称为统计表。 (二)作用: 1.使大量统计资料系统化、条理化; 2.便于比较各项目之间的关系和计算; 3.简明、紧凑、一目了然。,56,1.总标题:是统计表的名称,简要说明全表的内容,位于统计表的上端正中央。 2.分标题(横标题、纵标题):是指总体名称或分组名称以及说明总体的各种统计指标。 3.数字资料:即指标数值,列示在统计表的右下方,也是宾词的组成部分。 4.资料来源说明,(二)统计表的结构,57,2002年全国工业增加值(总标题),项 目,横标题,主词,纵标题,指标数值,指标名称,宾词,资料来源:中国统计摘要,中国统计出版社2003年,第125页。,58,(三)统计表的分类,1.按主词是否分组和分组的程度分类(P59) (1)简单表(表2-15) (2)分组表(表2-14) (3)复合表(表2-16) 2.按宾词是否分组和分组的程度分类 P60-61 (1)宾词简单排列(表2-16) (2)宾词分组平行排列(表2-17) (3)宾词分组层叠排列(表2-18),59,二、统计图 直方图,条形图,60,柱形图,61,圆锥图
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 吸波材料制作工职业技能模拟试卷含答案
- 液化气体生产技能测试题库及答案
- 选矿工实操任务书
- 学校一班级上期语文教学方案
- 中秋节福利发放方案
- 无人机驾驶员理论学习手册练习试题及答案
- 重冶湿法冶炼工技能测试题库及答案
- 点基础服务建设方案(3篇)
- 社区门市销售方案模板(3篇)
- 中国网民网络行为分析管理课件
- 液压滑模施工资料
- 2024-2029全球及中国苯丙酮尿症(PKU)行业市场发展分析及前景趋势与投资发展研究报告
- 学术期刊推广方案
- 2023年保定市蠡县教师招聘考试真题
- T-SZHW 001-2024 深圳市城市管家服务管理规范(试行)
- 三废环保管理培训
- 《分娩方式的选择》课件
- 培训课件 -BBF品牌建设模型-
- 新的患者护理模式个性化医疗关怀培训课件
- 安徽省蚌埠二十六中学2022-2023学年七年级上学期入学考试语文试题(学生版)
- 《防暑降温-知识培训》
评论
0/150
提交评论