




已阅读5页,还剩14页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章统计整理第一节统计整理的概念、原则和步骤一、统计整理的概念统计整理是统计工作的第三阶段,是统计调查的继续,统计分析的前提。统计整理,是根据统计研究的目的,将统计调查所得的原始资料进行加工,为统计分析准备系统化的、条理化的综合资料的工作过程。二、统计整理的原则和步骤原则:在对研究社会经济现象进行深刻的政治经济分析的基础上,抓住最基本的、最能说明问题本质特征的统计分组和统计指标对统计资料进行加工整理。基本步骤:1. 设计编制统计资料的汇总方案;2. 对原始资料进行审核;3. 用一定的组织形式和方法对原始资料进行分组、汇总和计算;4. 对整理好的资料进行审核,改正在汇总过程中所发生的有关联系;5. 编制统计表,简明扼要地表达社会经济现象在数量方面的有关联系;6. 进行统计资料汇编,系统地积累历史资料,作为总结历史经验,研究社会经济发展规律的重要依据。第二节统计分组一、统计分组的意义统计分组是根据统计研究的目的和任务,按照一个或几个标志将总体划分为若干性质不同的组成部分的一种统计方法。统计分组产生了两个后果:一是消除了组内差异;二是扩大了组间差异。二、统计分组的作用1. 区分社会经济现象的类型。2. 研究现象的内部结构。如:下表所示表3-1 国内生产总值产业结构 单位:%国内生产总值产业结构1980198519901995第一产业30.128.427.120.6第二产业48.543.141.638.4第三产业21.428.531.331.13. 分析现象间的依存关系。表32地区编号乡镇工业总产值(万元)农村购买力(万元)165392734534224437235392264830754318322095835三、统计分组的方法统计分组的关键在于选择分组标志和划分各组界限。(一)分组标志的选择如何正确选择分组标志是统计分组的核心问题。在选择分组标志时应注意以下几点:1. 分组标志的选择应根据统计研究的目的和任务确定。2. 分组标志应在众多可供选择的标志中,选择最能反映事物本质特征的标志作为分组标志。3. 分组标志的选择应考虑现象所处的具体历史条件及其发展的变化。(二)分组标志的种类与各组界限的划分分组标志按其形式,可分为品质标志和数量标志。即统计总体可按品质标志分组也可按数量标志分组。1. 按品质标志分组。如人口按性别分为男性和女性两组。2. 按数量标志分组。如人口按年龄分组等。四、统计分组体系班级运用多个标志对总体进行分组所形成的完整体系,这是统计分组体系。(一)简单分组与平行分组体系总体只按一个标志进行分组,称为简单分组。如人口按年龄进行分组。对同一总体选择两个或两个以上的标志分别进行简单分组,就形成平行分组体系。如人口总体分别按性别、文化程度、年龄等标志进行分组。如:按性别分组男性女性按文化程度分组大中专以上小学中学文盲(二)复合分组与复合分组体系对同一总体按两个或两个以上的标志层叠起来进行分组,称为复合分组。如:人口总体先按年龄分组,然后在此基础上再按学历分组,最后再在前述基础上按性别分组,就形成复合分组。按年龄分组按学历分组按性别分组60岁以上组60岁以下组文盲小学中学中专以上女性男性女性男性女性男性女性男性文盲小学中学中专以上女性男性女性男性女性男性女性男性第四节分配数列一、分配数列概念及构成要素在统计分组的基础上,将总体的所有单位按组归类整理,并按一定的顺序排列,形成总体中各个单位及数值在各组间的分布,称为次数分布或频数分布,又称分配数列或分布数列。分配数列由两个要素构成:一是分组标志的标志表现,另一个是总体单位在各组中出现的次数及其各组标志值。次数有两种表现:形式一是以绝对数形式表现的次数也称频数,用f表示。二是以相对数形式表现的次数,即各组次数占全部次数的比重,称为比率、频率或相对次数,用表3-3 某单位职工按月工资水平分组表按月工资水平分组职工人数(f)各组工人数占总数的%(f/f)200元以下281420040050254006007638600100030151000以上168合 计200100工工工比率(频率)次数(频数)各组变量值二、分配数列的种类根据分组标志4 不同,分配数列可分为品质分配数列和变量分配数列。品质分组-品质分配数列数量分组-变量分配数列(一)品质分配数列是按品质标志分组形成的分配数列。如表3-4 某大学在校学生的性别分布性别人数(人)比率(%)男性127054.27女性107045.73合计2340100.00(二)变量分配数列是将总体按数量标志分组形成的分配数列。如表3-5 某班同学年龄分布(单项数列)按年龄分组(岁)人数(人)比率(%)181410.019826.7201446.721413.32613.3合计30100.0变量数列按照变量类型的不同,可分为连续型变量数列和离散型变量数列。1. 离散型变量数列,就是由离散变量分组构成的变量数列。2. 连续型变量数列,就是由连续变量分组形成的变量数列。如:表3-6 变量数列示例(组距数列)按分数分组人数组中值60以下55560701165708017758090118590以上695合计50表3-6 变量数列示例(组距数列)按班级人数班级组中值59人以下560691165707917758089118590人以上6合计50三、变量数列的编制方法变量数列按形成不同,可分为单项式分组的变量数列和组距式分组的变量数列。 单项式分组数列,简称单项式数列。即数列中每一组的变量值只有一个,每组由一个变量值来代表。如表2-5. 组距式分组数列,简称组距数列。即数列中每组的值是由两个变量值确定的一个数值范围来表示。如表2-6.(一)单项式变量数列的编制(二)组距式变量数列的编制几个概念: 全距:是资料中最大值与最小值之差,用R表示。Range 组数:变量数列中组的数目即分几组。 组限:每组变量值的数值界限。 组距:一组的数值跨度. 邻上组下限-本组下限即各组上限值与下限值之差,用以说明各组变量值变化的跨度与范围。通常用d表示。即 等距与异距:各组组距都相等的组距数列称作等距数列。各组组距不相等的组距数列称作异距数列。 闭口组与开口组:上限和下限都 齐全的组称闭口组。有上限而缺下限或有下限而缺上限的组称为开口组。 组中值:为各组变量值的中点值。即:实例:经调查取得某单位40名工人月工资资料如下:54085083079078092080095062068072083085064073060084010808107809907408107007706607108307503407808308808608307408906807408701.排序,求全距将上述资料从小到大排列:3405406006206406606806807007107207307407407507707807807807908008108108308308308308308308408508508608708808909209509901080300-4002.确定组距与组数组数和组距的关系是相互制约成反比的关系:增大组距的影响是把不同质的总体单位归于同一组中,减少组距则会把同质的总体单位纳入不同组中。在等距分组的情况下,组数的确定可以采用以下经验公式来确定:由上式可以得出以下总体单位数与组数的关系表:表3-7N152425444589901791803593607197201439n567891011对于本例: 组距:取整的数在编制组距数列时,现象变化比较均匀则采用等距数列,如果现象变化不均匀,则应采用异距数列。采用等距数列的好处在于: 便于各组间进行直接对比; 便于计算各项综合指标。如果是异距数列,则应计算次数密度,即单位组距内的次数,又称频数密度。计算公式为:3.确定组限应注意:(1) 组限最好采用整数表示;(2) 组限一般不用负数表示,最小为零;(3) 应使最小组下限低于或等于最小变量值,最大组上限应大于最大变量值;(4) 如有极端值,即特别大或特别小的值,可用开口组;(5) 对连续变量相邻两组的组限应该重叠,并且按照“上限不在内”的原则处理与上限相同的变量值;(6) 对于离散变量,相邻两组应该间断,间断时又能相互衔接;4.计算各组单位数及有关数值注意“不重复,不遗漏”的原则。本例分组结果可表示成:表3-8 工人按月工资分组表工人按月工资分组(元)工人数(人)频数密度600以下20.0260070060.06700-75060.1275080070.1480085090.18850-90060.12900以上40.04合计40100.0分组结果可用直方图来示成:60070080090010001100212108641416图3-1 直方图5005.向上累计次数与向下累计次数 向上累计次数,又称较小制累计,即把各组次数由变量值 小的组向变量值较大的组顺序逐项累计。 向下累计次数,又称较大制累计,即把各组次数由变量值较大的组向变量值 较小的组顺序逐项累计。表3-9 工人按月工资分组表工人按月工资分组(元)工人数(人)较小制累计较大制累计600以下22(2)40(4+15+13+6+2)60070068(2+6)38(4+15+13+6)7008001321(2+6+13)32(4+15+13)8009001536(2+6+13+15)19(4+15)900以上440(2+6+13+15+4)4(4)合计40资料来源:中国国家统计局 http:/www.djajfalsjfl;as第五节统计表一、统计表的构成统计表就是将统计民得数字资料,资料过汇总后,按一定的顺序和要求填列在该表格之内,这种表格就叫统计表。统计表的结构主要包括:1. 总标题2. 划线总标题3. 主栏和宾栏例:表3-10 上海市1988年工业总产值按企业规模分组平均(亿元)比重(%)甲(1)(2)基线大型企业386.63135.70中型企业18.1112小型企业500.12123446合计100.0宾栏主栏二、统计表的分类1. 简单表2. 简单分组表3. 复合分组表三、统计表的设计规则:1. 统计表的各种标题应简明、确切。总标题要能说明全表的主要内容,资料所属的时间空间。2.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030功能性食品申报审批流程优化及营销合规边界研究报告
- 2025-2030功能性食品原料科学背书策略与消费者认知培育研究报告
- 2025年农村新能源市场消费升级与技术革新研究报告
- 2025年高考时事政治时事政治考试题库及完整答案详解
- 2025年农产品质量检测师考试试题及答案
- 2025年爆破考核试题及答案
- 2025年新能源产业国际合作与政策协同研究报告
- 2025年秦皇岛市G2电站锅炉司炉证考试题库及答案
- 2025年风电行业市场前瞻:技术创新引领风电产业绿色低碳发展报告
- 2025年注册会计师考试《会计》差错更正全面复习模拟试题试卷
- 物流园区规章制度模版(2篇)
- 《多能源耦合供热系统》
- 《搞定:无压工作的艺术》完整课件
- 京东方岗位胜任力测评题库
- 印刷包装公司安全生产管理方案
- 高中数学64数列求和省公开课获奖课件市赛课比赛一等奖课件
- 二手车国庆节活动方案
- 人教版八年级上册地理教学计划及进度表
- 2025高考物理步步高同步练习必修3练透答案
- DZ∕T 0215-2020 矿产地质勘查规范 煤(正式版)
- 2024年初中升学考试九年级数学专题复习新课标要求-中考33讲
评论
0/150
提交评论