第二章 统计数据调查与整理_第1页
第二章 统计数据调查与整理_第2页
第二章 统计数据调查与整理_第3页
第二章 统计数据调查与整理_第4页
第二章 统计数据调查与整理_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 统计数据调查与整理,第一节 统计数据 第二节 统计数据调查 第三节 统计数据整理 第四节 频数分布 第五节 数据显示,基本要求,统计调查和统计整理是统计研究中的两个阶段, 统计整理是统计工作过程中间环节,它既是统计调查 的继续又是统计分析的前提。通过本章的学习,应掌 握统计数据的概念及分类方法、统计调查方案及数据 的调查方法;了解统计整理、统计分组、分布数列、 统计表等概念和内容;重点掌握统计分组的方法,在 统计分组的基础上进行分布数列的编制,并学会用统 计图和统计表来表示统计资料。,第一节 统计数据,一、统计数据的概念 它是对客观现象计量的结果,有两种表现形式: 数值型和文字型。 它

2、是个数据集,不是指单个的数字 二、统计数据的分类 (一)来源分:直接数据和间接数据 (二)时间状况分:时间序列数据和截面型数据,(三)层次分: 定类数据、定序数据、定距数据、定比数据 1.定类数据(最低级) 按类别分类,不带数量信息,不能排序,主要的数据运算为频数和频率。 2.定序数据(中间级) 可以分类、排序,进行不等式运算。,3.定距数据 具有一定单位的实际测量值,可以加减运算 4.定比数据(最高等级) 为实际测量值,存在绝对零点,可以加减乘除运算 前两类用文字表示,后两类用数值表示。,定类数据,定序数据,品质标志,条形图,圆形图,定距数据,定比数据,茎叶图,直方图,频数表,条形图,圆形图

3、,第二节 统计数据调查,统计调查是按照统计研究的目的和任务, 运用各种调查的组织形式和方法,有组织、 有计划的向调查对象搜集各种原始资料工作 过程。 搜集资料的方式:原始资料和次级资料(后者不属于调查范畴) 要求:准确、及时、全面、系统,按调查单位的范围大小分为,一、统计调查的种类和方法,按调查时间是否连续分为,按调查的组织方式不同分为,(一)按照调查对象的范围: 普查 全面统计报表 重点调查 典型调查 抽样调查,全面调查,非全面调查,1.普查: 含义:是一种专门组织的一次性的全面调查,用来调查某一特定时点的社会经济现象的总量。 特点: (1)是一次性或周期性的 (2)必须规定标准时点,避免数

4、据的重复或遗漏 (3)数据全面、详尽、规范 (4)使用范围较窄,2.统计报表 含义:按照国家或上级统一规定的表格形式、指标和内容、上报时间和程序,定期向上级和国家报告计划执行情况和重要经济活动的调查方式。 特点:内容全面、资料连续;报送时间统一、及时;资料准确 类型: (1)按内容分:国民经济基本报表和专业报表 (2)按报送周期分:日(旬)报、月报、季报、年报 (3)按填报单位范围分:全面的和非全面的报表,3.抽样调查 含义:是一种非全面调查,从总体中随机抽取部分单位进行调查,用部分单位的指标数值来推断总体的指标数值。 特点: (1)遵守随机原则 (2)以部分单位指标数值来推断总体的指标数值。

5、 (3)会产生抽样误差,可事先计算,并能进行控制 (4)对全面调查进行检验、修正、补充 (5)其他:节省调查成本、适用范围广,4.重点调查 含义:选择重点单位,了解总体基本情况的一种非全面调查。 方法: 在掌握基本情况下,要确实存在重点单位。重点调查的关键是重点单位的确定,这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况,5.典型调查 含义:选择具有代表性的典型单位进行调查,以认识事物的本质及其发展变化规律的一种非全面调查。 关键:正确地选择典型 方式:解剖麻雀式,划类选典式,指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量,(二)按照登记时间

6、的连续性: 经常性调查和一次性调查 一次性调查分为:定期和不定期调查两种 (三)按照组织方式分: 统计报表制度和专门调查(普查、重点调查、典型调查、抽样调查),二、统计调查方案,(一)确定调查目的(首要问题-为什么调查) (二)确定调查对象和调查单位(向谁调查) 调查对象:需要调查的某一经济现象的总体。 调查单位:构成该总体的个体,调查中应登记其标志的具体单位。 报告单位:按规定日期、表式负责提交统计资料的单位。 * 调查单位与报告单位有时一致,有时不一致。,(三)拟订调查项目和设计调查表(调查什么) 1.确定调查项目的注意点: (1)只列入必需项目,且能够取得确切资料的项目 (2)含义要明确

7、具体 (3)调查项目之间尽可能相互联系 2.调查表:单一表和一览表 单一表:一张表上只登记一个调查单位,可以容纳较多的标志。 一览表:一张表上登记若干调查单位。,(四)确定调查时间和调查期限 时间:调查的所属时间(时期和时点之分) 期限:整个调查的起止时间 (五)拟订调查组织实施计划 包括以下内容:确定调查时间;规定调查地点;做好各项准备工作。,三、统计调查问卷,基本点: 1.含义:调查者根据调查目的和要求所设计的,由一系列问题、调查项目、备选答案、说明等组成的一种调查工具。 2.特点:内容标准化、调查面广、传播快 3.注意点: (1)所有项目与调查目的有关 (2)词语简明准确 (3)易引起疑

8、虑等项目不列入 (4)先易后难或有浅入深的顺序排列 (5)应切合实际,(一)问卷的类型与结构,1.类型 (1)自填问卷 (2)访问问卷 2.问卷的基本结构 由前言、主体和结语三部分组成 前言:说明调查目的、内容、要求等,包括题目、问候 语、填写说明、问卷编号等 主体部分(核心):包括调查的主要内容及答题说明,两部分,被调查者的背景资料和调查的基本情况 结语:基本信息,如调查时间、地点、调查员姓名等,(二)问卷设计的程序和形式,1.设计程序 三部分:事前准备、进行设计、事后检查,事前准备,确定所需资料,确定调查方式,确定分析方法,问卷设计,提问项目设计,回答项目设计,问题顺序设计,版面格式设计,

9、事后检查,模拟试卷,问卷修正,问卷完成,2.设计的形式 (1)开放式 被调查者回答不受限制,易获得较多信息;不易编码,易出现误差 (2)封闭式 根据备选答案进行选择,有填空式、选 择式等,容易滋生腐败,容易控制,但不易全面,不易控制,但内容丰富,(3)量表式 对被调查者的态度、意见等心理活动进行判 别和测定。常用的有:评比量表、李克特量表、 配对比较量表。,四、统计调查误差,(一)调查误差的含义与种类 1.含义: 2.种类:登记性误差和代表性误差 登记性误差:由于工作环节的不准确造成的误差,如计量错误、记录错误等 代表性误差:用样本推断总体时产生的误差,在非全面调查中出现,无法消除。 (二)调

10、查误差的防止 主要防止登记性误差,第三节 统计数据整理,一、统计整理的概念 根据统计研究的目的与任务,对所取得的原始 资料进行科学地分类和汇总,为统计分析提供系 统化和条理化的统计资料的工作过程,称为统计整 理。它是统计调查的继续,也是统计分析的基础和 前提。,二、统计整理的程序和内容 (一)程序 1.统计整理方案 2.统计资料的审核 3.统计资料的分组和汇总 4.编制统计图表 5.统计资料的积累和保管,(二)内容 1.统计资料的审核 三方面:准确性、完整性、及时性 准确性是重点,采用逻辑检查和计算检查方法 2.统计分组(基础) 3.统计汇总(中心内容) 4.编制统计表或统计图,三、统计分组,

11、(一)统计分组的概念和种类 1.统计分组的概念 根据统计研究的目的和任务,按照选定的变异 标志将总体划分为若干部分或组别,使组与组之间 具有差异性,而同一组的各单位保持相对的同质性。 统计分组是统计整理的基础,也是统计研究的基本方 法之一。 须遵循穷尽原则和互斥原则,划分社会经济现象的类型 反映社会经济现象的内部结构和比例关系 揭示社会经济现象之间的相互依存关系,统计分组的作用:,2.种类 (1)按分组标志的性质: 品质标志分组和数量标志分组 (2)按分组标志的多少: 简单分组、复合分组、分组体系 简单分组:按一个标志分组 复合分组:用两个或两个以上标志重叠进行分组 分组体系:,平行分组体系,

12、对教师的分类,按性别分类,男性,女性,按职称分类,按年龄分类,高级,中级,初级,青年,中年,共计7组 2+3+2,(二)统计分组的方法,关键:分组标志的选择和划分各组界限 1.分组标志的选择 注意点: (1)根据研究的具体任务和目的 (2)在分析基础上选择具有本质的重要标志 (3)结合所处的历史条件,2.选择分组种类 (1)单项式分组与组距式分组 单项式分组数列指每个组值只用一个具体的变量值表现的数列,适用于离散型变量且变量变动范围不大 组距式分组数列指每个组的变量值用一个区间来表现的变量数列,连续型变量只能编制组距式分组,离散型变量若其变动范围较大,也可编制。,(2)等距分组与异距分组 等距

13、数列:变量值变动区间的长度相等 异距数列:变量值变动区间的长度不完全相等 (3)间断组距式分组与连续组距式分组 间断组距式分组适用于离散型变量 连续组距式分组两者均适用 注意组界限的问题 (4)划分分组界限,第四节 频数分布,一、频数分布的概念 在统计分组的基础上,将总体单位按组归类整 理,形成总体单位在各组间的分布。 两个要素:组别、频数或频率 分布数列:各组与频数(频率)依次排列而形成的数列,它反映总体各单位的分布状况和特征,也可以进一步分析总体的平均水平和变异程度的基础。,二、分布数列的种类 属性分布数列(品质标志数列)和变量数列 三、变量数列的编制 1.确定变量数列的形式 2.将变量值

14、排序,并计算全距R R=Xmax-Xmin 3.确定组距(I)和组数(K) 组距(I)=全距R/组数(K) 组距最好是选5的倍数,如5,10,等,4.划分组限 关于组中值的计算: 闭口组:组中值=(上限+下限)/2 开口组: 缺上限:组中值=下限+邻组组距/2 缺下限:组中值=上限-邻组组距/2 5.计算各组次数(比率),实例1,己知某地区某年50个商店商品销售额的资料如下(单位:百万元): 7.4 , 12.6 , 29.0, 2.0, 12.4, 7.0 , 14.8, 17.5 , 15.0, 18.2, 18.7, 15.5, 12.8 , 26.0 , 17.3 , 8.3 , 14

15、.7, 12.0, 3.5 , 6.8, 25.0, 19.3, 6.4, 4.0, 11.9, 8.5 , 13.2 , 14.5 , 17.1, 15.6, 13.4 , 4.5, 9.5, 20.0, 15.7, 6.0, 11.4, 23.0, 14.2, 16.7, 21.0, 16.0, 13.6, 10.0, 13.9, 5.0, 5.8, 10.5, 16.3, 22.0 要求编制组距数列,求全距,确定组距及组数,编制步骤:,组距(I)=全距R/组数(K),计算组数 (组数不宜过多,也不宜太少),上例中,取I=5,则有,确定组限,计算次数,(编制结果):,【例2】己知某车间有2

16、4 名工人,他们的日产量分 别是(件):20,23,20, 24,23,21,22,25,26, 20,21,21,22,22,23, 22,22,24,25,21,22, 21,24,23.要求根据以上 资料编制变量数列。,四、累计频数与累计频率 向上累计:各组次数由变量值低的组向变量值高的 组累计,表明各组上限以下的累计次数 或累计比率。 向下累计:各组次数由变量值高的组向变量值低的 组累计,表明各组下限以上的累计次数 或累计比率。,五、频数分布的类型 1.钟形分布、偏态分布(左偏分布和右偏分布) 2.J形分布(正反之分) 3.U形分布,第五节 数据显示,一、统计表 (一)概念和结构 1、

17、概念:表现统计资料的表格称为统计表。 2、结构 (1)从形式上看: 总标题、横行标题、纵栏标题和指标数值 (2)从内容上看:主词和宾词 主词:统计表所要说明的总体,在表的左方 宾词:说明主词的统计指标,包括指标名称和指 标数值, 在表的右方,部分地区工业增加值(2005年11月),总标题,纵栏标题,横行标题,指标数值,主 词,宾 词,(二)统计表的分类 1.按主词分类: 简单表:主词未作任何分组(*) 简单分组表:主词按一个标志分组(*) 复合分组表:主词按两个或两个以上标志 分组(*),我国近年来国内生产总值,2005年国内生产总值分布表,某地区2005年工业总产值和职工人数,2.按宾词设计的不同,分为: 简单排列:宾词不加任何分组(*) 分组平行排列:宾词按各分组标志平行排列(*) 分组复合排列:宾词按两个或两个以上分组 标志且层叠在一起.(*),主要农作物播种面积(万公顷),(三)统计表的设计 原则:科学、实用、简炼、美观、便于比较 1.表式设计的注意事项 (1)表格的左右两端采用“开口式” (2)若栏数较多,应顺序编号,主词“甲、乙丙、丁”,宾词以“(1)、(2)、(3)” (3)表式数据一般右对齐,小数位数应统一且以小数点对齐。,2.统计表内容设计的注意事项: (1)各标题应简明扼要 (2)必须注明数据

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论