统计学之资料整理(ppt 34页).ppt_第1页
统计学之资料整理(ppt 34页).ppt_第2页
统计学之资料整理(ppt 34页).ppt_第3页
统计学之资料整理(ppt 34页).ppt_第4页
统计学之资料整理(ppt 34页).ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本资料来源,第三章 资料整理,统计调查,统计整理,统计分析,有组织、 有计划地 搜集资料。 要求:准确、 完整、及时,对调查资料 去伪存真、 去粗取精、 科学分类、 浓缩简化,描述性分析 推断分析、 决策分析。 要求:定性 定量结合,统计工作的三个中心阶段,本章主要内容,第一节 资料整理概述 第二节 统计分组 第三节 次数分布数列 第四节 统计表和统计图,第1节 资料整理概述,主要任务,资料审核、分组、 汇总、制表、制图等。,分组,频数分布,统计表,统计图,1统计资料整理 它是指将大量的个体单位的原始资料,进行科学性的分类、汇总,使其系统化、条理化,可以有效地展示,为下一阶段的统计分析作准备的

2、过程。 2资料整理的内容 (1)统计资料审核; 完整性审核、正确性审核 (2)统计资料分组; (3)汇总; (4)编制统计图表; (5)资料积累。,3数据的预处理 (1)数据的审核; 完整性审核、及时性审核、正确性审核 次级资料的审核 (2)资料审核后的订正。,4资料整理方案的设计 (1)确定汇总指标与综合表; (2)确定分组方法; (3)选择资料汇总的形式; (4)确定资料的审查内容与方法。,返回,它是根据统计研究的目的和任务,按照某种标志,将总体区分为若干部分的一种统计方法。,第2节 统计分组,统计分组的两层涵义;,统计分组的基本原则;,资料整理的重要环节。,什么是统计分组?,分组 P57

3、,分组前,分组后,25,33,42,1划分现象类型,作用:,例:按所有制性质划分,分为公有经济和非公有经济。公有经济包括国有及国有控股经济和集体经济;非公有经济包括私营经济、个体经济、联营经济、股份制经济、外商投资经济、港澳台投资经济等。,2揭示现象内部结构,例:上海市按GDP计算的三次产业结构(%) 1978年 1990年 2000年 2009年 GDP100 100 100 100 第一产业4.03 4.31 1.83 0.76 第二产业 77.36 63.8147.54 39.86 第三产业 18.61 31.8850.63 59.38,3分析现象之间的依存关系,例:中国农民家庭按收入分

4、组的恩格尔系数(1984年),按收入分组(元) 200 300 400 500 600 800 1000 恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6,恩格尔系数介绍(由德国统计学家恩格尔的定律而得),反映人民生活水平类型的指标,用家庭或个人食品支出总额占消费支出总额比重计算。,30%以下,30%40%,40%50%,50%60%,60%以上,最富裕水平,富裕水平,小康水平,勉强度日水平(温饱),绝对贫困水平,2000年,我国居民的恩格尔系数首次低于50。,最新的调查统计显示,长三角地区15个城市居民生活水平相对较高。上海市统计局城调队提供的数据表明,

5、2003年,15个城市的恩格尔系数继续走低,全部降到35至43之间,其中有10个城市恩格尔系数降到40以下。 因此,长三角地区15个城市中,已有六成以上的城市居民过上富裕生活。,广东顺德恩格尔系数跌破30% 成为全球最富裕地区之一。(新华网 2004年08月02日),分组标志的选择与分组形式,1、正确选择分组标志的原则:,形式,按分组标志性质分,品质标志分组,数量标志分组,按分组标志个数分,简单分组,复合分组,分组体系,(1)根据研究问题的目的来选择分组标志;,(2)要选择最能反映被研究现象本质特征的标志 作为分组标志;,(3)要结合现象所处的具体历史条件或经济条件 来选择分组标志。,2、分组

6、的形式,返回,采用一系列相互联系、相互补充的标志对现象进行多种分组,这些分组结合起来构成的一个体系称为分组体系。,第3节 次数分布数列,是一种重要的分组资料,反映总体单位在各组的分布 状态。,基本形式:,分组,单位数(频数),频率(%)或比重,合计,100,频数分布,频率分布,分类,品质数列,变量数列,单项数列,组距数列,等距数列,异距数列,例,例,例,例,变量数列的编制,1计算全距,初步分析,全距(R)变量的最大值变量的最小值,2估算组数与组距,3定上下限,组数:K = R / I R 为全距,I 为组距,变量数列的编制,2组限的确定与归类,1确定形式,单项数列:离散型且取值不多。,组距数列

7、:离散型且取值多或连续型。,连续变量、离散变量的组限,重合式归类:上限不在内,组限(上限和下限):一组的最大值和最小值。,开口组,具体问题,变量数列的编制,3组距的计算,4组中值的计算,组距上限下限,离散变量组的组距:,组距上组的下限本组的下限,开口组的组距怎么办?,组中值=(上限+下限)/2,缺上限的组中值=下限(邻组组距/2),缺下限的组中值=上限(邻组组距/2),累计次数分布表和分布图,某班统计学成绩的累计次数分布表,累计次数分布表和分布图,某班统计学成绩的累计次数分布折线图,较小制累计次数分布折线,较大制累计次数分布折线,第4节 统计表和统计图,构成,总标题,横行标题:统计研究的对象。

8、也称主词。,纵栏标题:说明主词的指标名。也称宾词。,数字资料,分类,主词,简单表(表3-8),简单分组表(表3-7),复合分组表(表3-9),宾词,平行形式,复合(交叉)形式(表3-10),编制统计表注意点:P69,统计表 ,某地区工业企业的工人性别和工龄,平行形式,统计图,直方图,图3-4,折线图,曲线图,等距数列:(组中值,频数),异距数列:(组中值,频数密度),单项数列:(变量,频数),较小累计分布:(变量上限,累计频数),较大累计分布:(变量下限,累计频数) ,变量的组数无限增多时,折线 便趋于一条光滑的曲线。,P72 图3-5,图形,条形图 书 P 71,饼形图 书 P 71,象形图

9、 书 P 73,分布类型,1、正态分布(也叫钟型分布):对称和偏态,特征:两头小,中间大。 图,2、U型分布,特征:两头大,中间小。 图,3、J型分布:正J型和反J型,特征:一头大,一头小。 图,返回,本章结束!,某厂职工人数统计表,按性别分组,男 职 工,女 职 工,合 计,人数(人),(频数),比率(),(频率),253,115,368,68.75,31.25,100.00,返回,某厂职工家庭人口分组统计,按家庭人口分组,1,合 计,职工户数,(频数),比率(),(频率),7,返回,2,3,4,5,6,38,105,54,31,20,2.9,15.2,41.3,20.5,12.1,8.0,255,100.0,某小区居民家庭人均月消费性支出分布表,返回,等距数列,我国土地状况分组表,返回,异距数列,中国统计年鉴1998,上海市总人口数,年份,1980

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论