




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
,应用统计学,编 著 陈在余 陶应虎,第3章 统计整理,1.1 统计整理概述 1.2 统计资料的汇总 1.3 统计数据分组与频数分布 1.4 次数分布数列 1.5 频数分布类型与数据显示,学习目标与关键概念,学习目标 1、了解统计整理的概念、意义和内容 2、掌握统计分组的概念、原则、方法和作用 3、了解分组的类型 4、掌握频数分布的概念、种类、变量数列的编制方法 5、掌握统计表的构成和制表、填表规则 关键概念 统计分组、 统计图、 统计表,第一节 统计整理概述,一、统计整理的概念及意义 统计整理就是对统计调查所搜集的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映现象总体特征的工作过程 统计整理对这些资料进行加工整理,使之系统化,以便对总体做出概括性的说明 统计整理是整个统计工作和研究过程的中间环节,起着承前启后的作用 统计整理还是积累历史资料的必要手段,二、统计整理的内容,对搜集到的资料进行全面审核,如发现问题,及时加以纠正,以确保准确无误 根据研究目和统计分析的需要,选择整理的标志,并进行划类分组 在分组的基础上,将各项资料进行汇总,得出反映各组和总体数量特征的各种指标 统计资料的显示 对统计数据分门别类地系统积累,三、数据的预处理,数据的审核 资料审核后的订正 通过审核,如发现有缺报、缺份和缺项等情况,应及时催报、补报;如有不正确之处,则应分别不同情况进行处理,四、统计分组的含义,统计分组:根据社会经济现象的特点和统计研究的目的要求,按照一个或几个标志,将统计总体划分为若干不同性质而又有联系的几个部分 统计分组的对象是总体,统计分组的标志可以是品质标志,也可以是数量标志,五、统计分组的类型,按分组的作用或目的不同,分为类型分组、结构分组和分析分组 按分组标志的多少,可分为简单分组、复合分组和并列分组 按分组标志的性质,分为品质标志分组和数量标志分组,返回,第二节 统计资料的汇总,一、统计资料汇总的组织形式 逐级汇总 集中汇总 综合汇总 汇审汇编,二、统计资料的汇总技术,手工汇总 是以手工操作方式进行汇总,常用的手工汇总方法有点线法、过录法、折叠法、卡片法四种 机械汇总 是由自动化的专用机器代替手工操作进行统计资料的汇总 电子计算机汇总 是在20世纪中叶发展起来的进行统计资料汇总的方式,电子计算机汇总包括对原始数据的加工、存贮、合并、分类、逻辑检查、运算以及打印出汇总表式或图形等,返回,第三节 统计数据分组与频数分布,一、统计数据分组的原则 穷尽原则:就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位 互斥原则:就是在特定的分组标志下,总体中的任何一个单位只能归属于某一组,而不能同时或可能归属于几个组,二、统计数据分组的步骤和方法,统计分组一般经过三个步骤:即选择分组标志、分组界限的划分、选用分组体系,1、分组标志的选择 要符合统计研究的具体任务和目的选择分组标志 选择具有本质性的重要标志进行分组 要考虑到社会经济现象所处的历史条件,2、分组界限的划分 (1)按属性分组 组限是自然形成的或比较明显的 比较复杂的属性分组,国家有关部门都制定有标准的分类目录,分组时可以依据分类目录来确定组限,(2)按变量分组 首先,分组时各组数量界限的确定必须能反映事物质的差别 ,其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限和组数。 单项式分组与组距式分组 间断组距式分组和连续组距式分组 【专栏】不等距分组,3、选用分组体系 简单分组或复合分组只是概括现象某一侧面或某几个方面的内容,而不足以充分表明其全貌,为了从各方面全方位认识和分析某一社会经济现象,需要采用多个分组标志进行多种分组的分组体系,三、统计分组的应用,划分社会现象的不同类型 揭示社会现象的内部结构 分析社会现象之间的依存关系,返回,划分社会不同类型,揭示社会经济现象的内部结构,我国出口商品构成(%),划分社会现象的依存关系,第四节 次数分布数列,一、次数分布数列及其构成要素 在统计分组的基础上,将总体所有单位按某一标志进行归类,并计算各组的单位数称为次数分布数列,或频数分布数列 构成要素 组别:总体按某标志所分的组 次数(频数)和频率:各组的单位数称次数,各组的单位数与总体单位总数之比称频率,频数分布数列的种类 品质频数分布数列:简称为品质数列,它是经过属性分组后形成的频数分布数列 变量频数分布数列:简称为变量数列,它是经过变量分组后形成的分布数列 单项数列:是以一个变量值为一组编制的变量频数分布 组距数列:是以表示一定变动范围的两个变量值构成的组所编制的变量频数分布,二、累计频数与累计频率,向上累计频数(或频率)分布:即先列出各组的上限,然后由标志值低的组向标志值高的组依次累计频数(或频率) 向下累计频数(或频率)分布:即先列出各组的下限,然后由标志值高的组向标志值低的组依次累计频数(或频率) 【例】以某城市50户居民某月购买消费品支出额的频数分布资料为例,分别进行向上和向下累计,累计频数(频率)分布图 以分组变量为横轴,以累计频数(频率)为纵轴 向上累计分布图:在直角坐标系上将各组组距的上限与其相应的累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连 向下累计分布图 :在直角坐标系上将各组组距下限与其相应累计频数(频率)构成坐标点,依次用折线(或光滑曲线)相连,三、次数分布数列的编制,根据变量的类型和变量值的多少确定是编制单项数列还是编制组距数列,单项变量数列的编制方法,编制步骤 第一,将日产量按从小到大顺序排列 第二,将变量值分为若干组 第三,找出每组变量出现的次数 第四,按变量值的大小顺序编制出单项数列 【例】己知某车间有24名工人,他们的日产量(件)资料,要求编制变量数列。,组距式变量数列编制方法,编制步骤 第一,计算全距,R=最大的标志值最小的标志值 第二,确定组数,组数的多少直接取决于两个因素,一个是总体的全距,另一个是组距 第三,计算组距 ,组距是指各组上下限之间的距离 (1)连续组距式分组的组距,组距=上限-下限 ;(2)间断式分组的组距 ,组距=上组下限-本组下限,组距式变量数列编制方法,第四,计算组限,指每组两端数值,分为上限和下限 上限:每组的终点数值(最大值) 下限:每组的起点数值(最小值) 第五,计算次数和频数,组距式变量数列编制方法,第六,计算组中值,即各组中点位置所对应的变量值。其计算公式为: 组中值= (适用所有闭口组) 或= (适用上开口组) 或= (适用下开口组) 【例】根据某市50户居民某月购买消费品支出情况,请进行分组,返回,第五节 频数分布类型与数据显示,一、频数分布的类型 不同性质的社会经济现象的次数分布的类型,概括起来,根据曲线形状的特点,大致有三种类型:钟型分布、U型分布和J型分布,钟型分布数列、U型分布数列与J型分布数列,钟型分布:,特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。,U型分布:,特征是靠近中间的变量值分布的次数少, 靠近两端的变量值分布的次数多,其形状 宛如英文字母U。如:人口死亡率。,J型分布:,特征是次数随着变量值的增大而增多或随变量值的增大而减少,其形状宛如英文大写字母J,二、统计表,1、统计表的定义和结构 将经过统计调查所得来的数字资料,经过汇总整理后,得到一些系统化的统计资料,将这些数据按一定的顺序排列在表格上,这种表格就是统计表 。 广义的统计表包括统计工作各个阶段中所用的一切表格,狭义的统计表专指分析表和容纳各种统计资料的表格,也就是通常所说的统计表,统计表的结构,可以从表式和内容两个方面来认识。 (1)从表式上看,统计表是由纵横交叉的线条组成的一种表格,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。 总标题是统计表的名称,它扼要地说明表的基本内容,并指明时间和范围。它置于统计表格的正上方。,横行标题是横行的名称,一般放在表格的左方; 纵栏标题是纵行的名称,一般放在表格的上方。横行标题和纵行标题共同说明填入表格中的统计数字所指的内容。 指标数值是列在横行和纵栏的交叉处,即表格中的数字就是指标数值,用来说明总体及其组成部分的数量特征,它是填写在统计表格的核心部分,(2)从内容上来看,统计表是由主词栏和宾词栏两个部分组成。 主词栏是统计表所要说明的总体及其组成部分,一般都列在表的左半部分; 宾词栏是统计表用来说明总体数量特征的各个统计指标及其数值,一般都列在统计表的右半部分。 此外,统计表还有补充资料、注解、资料来源、填表单位、填表人等附加内容。,2、统计表的分类 (1)按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和复合表。 简单表:主词未经任何分组的统计表称为简单表。,分组表:主词只按一个标志进行分组形成的统计表,又称为简单分组表。简单分组表应用十分广泛,对比简单表,它有如下作用:区分事物的类型,研究总体结构,分析现象的依存关系。 复合表:主词按两个以上标志进行分组的统计表,又称为复合分组表。下表就是复合表,表中国内生产总值分别按产业和国民经济行业这两个标志进行分组。,( 2) 统计表按宾词设计不同分为宾词简单排列、分组平行排列和分组层叠排列。,宾词简单排列是指宾词不加任何分组、按一定顺序排列在统计表上。 宾词分组平行排列是指宾词栏中各分组标志彼此分开,平行排列。 宾词分组层叠排列是指统计指标同时有层次地按两个或两个以上标志分组,各种分组层叠在一起,宾词的栏数等于各种分组的组数连乘积 。,(3)按统计表的内容来分类,可分为空间数列表、时间数列表 空间数列表:反映同一时间条件下不同空间范围内的某项或某几项统计数列的表格,又称静态表 时间数列表:反映在同一空间条件下不同时间阶段某项或某几项统计数列的表格,又称动态表,3、统计表的设计 统计表的设计要求是:简练、明确、实用、美观,便于比较。 (1)统计表表式设计应注意的事项 统计表应设计成由纵横交叉线条组成的长方形表格,长与宽之间保持适当的比例; 线条的绘制。表的上下端应以粗线绘制,表内纵横线以细线绘制;表格的左右两端一般不划线,采用“开口式”。,合计栏的设置。统计表各纵列须合计时,一般应将合计列在最后一行;各横行若须合计时,可将合计列在最前一栏或最后一栏。 栏数的编号。如果栏数较多,应当按顺序编号,习惯上主词栏部分分别编以“甲乙丙丁”等序号,宾词栏编(1)(2)(3) 序号。,(2)统计表内容设计应注意的事项 标题设计。无论是总标题,还是横栏、纵栏标题都应简明扼要,简练而又准确得表述出统计资料的内容及所属的时间和空间范围。 指标数值。表中数字应填写整齐,对准位数。当数字因小而忽略不计时,可填写为“0”;当缺某项数字资料时,可用符号“”表示;不应有数字时用符号“-”表示。如品质标志值的合计项目,计量单位。统计表必须注明数字资料的计量单位。当全表只有
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 农业技术推广与培训服务合同书
- 车辆变速器维修协议
- 2026届江西师大附中高三上化学期中教学质量检测试题含解析
- 2026届四川雅安中学化学高二第一学期期中达标检测模拟试题含解析
- 产品生命周期佣金合同
- 企业税务管理基础制度文档
- 干股合作投资协议
- 个人形象代言合作推广协议
- 品牌推广活动计划制作模板
- 产品品质管理检查标准化表单
- 2025年秋招:新媒体运营笔试题目及答案
- 工作总结及工作思路(输电运维班)
- 感染性休克的护理诊断与措施
- Unit 14 I remember meeting all of you in Grade 7(大单元教材分析)教学课件 人教新目标九年级英语全册
- 肺炎护理试题填空及答案
- 食材配送 售后服务方案
- GB/T 4604-2006滚动轴承径向游隙
- Fanuc系统宏程序教程
- 药物竹罐临床应用课件
- 2022年咸阳经开城市发展集团有限公司招聘笔试试题及答案解析
- 不等式的基本性质说课课件
评论
0/150
提交评论