统计资料的搜集与整理_第1页
统计资料的搜集与整理_第2页
统计资料的搜集与整理_第3页
统计资料的搜集与整理_第4页
统计资料的搜集与整理_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章 统计资料的搜集与整理,重点与难点: 重点: 统计调查的方式:普查、抽样调查、统计报表、重点调查、典型调查 统计分组方法 次数分布 难点: 统计分组方法 次数分布,学习内容: 一、统计资料及其搜集方法 二、调查方式与调查方案 三、统计调查误差 四、统计数据的整理,一、统计调查的意义,第一节 统计资料及其搜集方法,统计调查就是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集资料的过程,应当正确理解社会调查在人们认识中的地位; 应当正确理解统计调查在统计工作中的地位; 应当正确理解统计调查理论和方法在统计学原理中的地位,例:企业生存取决于市场。对企业来说,生产什么? 售价多少?

2、何地销售?如何推广?产品市场份额多大?产品发展潜力多深?竞争对手会有什么应对策略?等等,一系列问题均要通过市场调查,请看目前,各国企业和研究机构全年,投资于每个消费者的平均调查费,单位:美元,英国22.9,美国16.5,日本8,中国0.1,统计资料的三个基本性质: 数量性:统计学以事物数量特征为主要研究对象,因此统计资料都具有数量性。 总体性:统计资料描述的是大量的、密集型事物的总体特征。虽然以个体认识为起点,但目的都是了解由许多个体所聚合而成的“总体”的特征。 客观性:统计资料都是对具体事物的描述,都是具体的数量,而不是如同数学所研究的那种抽象的量,二 统计资料的搜集,准确性要求和及时性要求

3、是相互结合相互依存的,及时性在准确性要求的前提下才有意义,而准确性也不能损害及时性的要求,原始资料:是通过统计调查或试验所取得的统计资料,都属于第一手资料; 次级资料:来源与别人通过统计调查或试验所取得并已经加工整理过的统计资料,都属于第二手资料。 原始资料的收集方法: 1 访问调查 2 电话调查 3 邮寄问卷 4 观测 5 互联网调查,从获得资料的途径看,统计资料可以分为原始资料和次级资料,1 涉及范围要适度; 2 事先进行规划; 3 注意版权问题,三、搜集资料的注意事项,要进行统计调查 一方面要选择恰当的调查方式; 另一方面要在调查之前通盘设计好调查的活动方案,第二节 调查方式与调查方案,

4、1、统 计 报 表,统计报表是按国家有关规定,自上而下地统一布置,自下而上地逐级填报统计报表的调查方式。 从调查范围来看,统计报表可以分为全面统计报表和非全面统计报表。 统计报表具有强制性,必须经过法定程序审批,有关部门和单位必须切实执行,统计调查可分为统计报表和专门调查,统计报表分为,按报送周期长短不同统计报表分为,分为普查、重点调查、抽样调查、典型调查。普查为全面调查,后三者为非全面调查,普查,普 查,涵义:普查是专门组织的,一般用来调查属于一定 时点上社会经济现象数量的全面调查,普查通常是一次 性的或周期性的,普查必须规定 标准调查时间,作用:普查主要用来搜集那些反映国 情国力方面的基本

5、统计资料,例如:人口普查、工业普查、物资库存普查、 乡镇企业普查、商业饮食业普查等等,普查:为专门组织的一次性调查,用来调查属于一定时点的社会现象的总量,例: 每5年进行一次的经济普查,包括工业普查、三产普查、基本单位普查、建筑业普查。这种普查制度在周期安排上和国家编制五年计划相衔接,普查举例,我国历次人口普查资料 普查年份 总人口(单位:万人) 1953 59435 1964 69458 1982 100818 1990 113368 2000 126583 2010 133281,增长的真快!普查真重要,就是支出太高了,抽样调查:按随机原则从总体中抽取一部分单位进行调查,例,对一批灯泡的合

6、格率进行调查,应该采用抽样调查方式,抽 样 调 查,抽样调查是一种非全面调查,它是按照随机原则从 总体中抽取部分单位进行观察,用以推断总体数量 特征的一种调查方式,是一种非全面调查,但是又要 达到对总体数量特征的认识。 按照随机原则抽选调查单位,经济性、时效性、 准确性、灵活性,能够解决全面调查无法或难以解决的问题。 可以补充和订正全面调查的结果。 可以用于对总体的某种假设进行检验,简单随机抽样 类型随机抽样 等距随机抽样 整群随机抽样,组 织 形 式,对总体不进行任何整理,直接从总 体中按照随机原则抽选调查单位,作 用,特 点,涵 义,优 点,先对总体各单位按主要标志进行分 类,再按随机原则

7、抽选调查单位,将总体各单位按某一标志大 小顺序排列,然后依一定间 隔抽取样本单位进行调查,先将总体各单位划分为许多群,再 以群为单位,从中随机抽选部分群 ,对中选群的所有单位进行调查,重点调查:对重点单位进行调查。重点单位指的是这些单位数占总体的很少部分,而研究的标志总量占绝大部分(或绝大比重,例:某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量80%的五个大型水泥厂的生产情况进行调查,属于重点调查,典型调查:从总体中有意识地选择有代表性的单位进行较深入调查的调查方式,例,选取部分企业进行调查,以了解企业股份制改革后的成果及问题,重点调查与典型调查的区别与联系,都属于非全面调查,

8、二者共同点,根据客观标准 选择重点单位,在对现象分析的基础上 有意识地选择典型单位,调查目的不同,选择调查单位的方法不同,重点调查,典型调查,重点调查的目的是反映总体的基本情况,典型调查的目的是推算总体的数量特征,二者区别,二、统计调查的设计(即统计调查方案,调查对象就是我们需要进行研究的总体范围,即调查总体。它是由性质相同的许多调查单位所组成的。 作为调查单位乃是进行登记的标志表现的直接承担者。例:人口普查的调查单位是每一个人,1.确定调查的目的 即为什么调查,2.确定调查对象和调查单位 即向谁做调查,报告单位:也叫填报单位,也是调查对象的组成要素,它是提交调查资料的单位,一般是基层企事业组

9、织。 调查单位和报告单位有时一致有时不一致,例: 如对每个国有工业企业进行调查,则每个国有工业企业既是调查单位也是报告单位; 但如果对每个国有工业企业的全部生产设备进行调查,则每台生产设备是调查单位,每个国有工业企业是报告单位,3.调查内容和调查表 即用什么方法调查,拟订调查项目时要注意几个原则,调查项目要少而精; - 调查项目含义要明确; - 尽可能做到各个调查项目之间有一定的联系,调查活动的核心是要进行调查的内容,也就是需要想调查单位了解的情况和问题,调查表分为,把许多调查单位和相应的项目按次序登记在一张表格里。这便于汇总,但缺点是分不开,故调查深度不够,将一个调查单位的项目登记在一份表或

10、一种卡片上。这便于容纳较多的项目,且便于整理、分类,缺点是繁琐,调查表是把所调查的内容具体化为一些明确的项目或指标,并恰当排列制成表格,4.其他内容,调查内容的时间特征; 调查工作的时间限制; 搜集数据的具体方法; 调查的具体组织实施工作,调查时间和调查时限 调查时间:是调查资料所属的时间,即所谓客观时间。 (1)如果调查的是时期现象,调查时间就是资料所反映的起讫日期。 (2)如果调查的是时点现象,调查时间就是规定的统一标准时间。 调查时限是进行调查工作的期限,包括搜集资料和报送资料的整个工作所需要的时间,即所谓主观时间,时期现象指标是一段时间内积累的总量,其基本特征有两点:第一,指标的数值严

11、格随时间长短变化;第二,指标数值具有可加性。如产量、产值、成本、利润等。 时点现象指标是某一时刻的总量,它反映总体已经存在并经常变化的数量状态在某一个具体时刻的表现,其基本特征是:第一,指标的数值不严格随时间长短变化;第二,指标数值没有可加性。如人口数、资产占用额等,例1:某管理局要求所属企业在2002年1月10日上报2001年工业总产值资料,则调查时间和调查期限分别是什么? 调查时间:2001年 调查期限:10天 例2:某管理局要求所属企业在2002年1月31日上报2001年产成品库存资料,则调查时间和调查期限分别是什么? 调查时间:2001年12月31 日 调查期限:31天,第三节 统计调

12、查误差,一、统计调查误差的种类 统计调查误差是指通过调查或实验所获得的统计数据与调查对象的实际数量的差别。 分为登记误差、代表性误差。 登记误差:由于调查过程中在测量、记录、填报、计算等活动中所产生的误差。 代表性误差:指在非全面调查中,由于选取的那部分单位对全部单位的代表性不足而产生的误差,二、产生误差的客观原因 客观随机性 操作不当 计算中的舍入错误 故意制造的误差,三、怎样看待误差 第一,误差降低了统计数据的质量。 第二,误差是难以避免的。 第三,人们对准确性的要求是相对的。 第四,追求过高的准确性往往得不偿失,第四节 统计数据的整理,统计调查搜集上来的资料,不论是哪一种类型的资料都必须

13、经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。 统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程,一 、统计数据整理的意义和步骤,1.目的:数据简单化、系统化,一 统计数据整理的意义和步骤,2.方法:分组,进行数据整理,必须保证分组的“穷尽”,即每一个个别单位有且只有一个组的归属,不能出现重复和遗漏,每组内包含的单位数总和等于总的单位数,3.步骤: (1)对原始资料进行审核; 审核原始资料的主要方法有:常识性审查、比较性审查、设置疑问框审核。 (2)对原始资料进行分组和汇总; (3)经汇总结果用统计表或统

14、计图的方式表现出来,为统计资料的使用和分析做好准备,1.概念 把同质总体中的具有不同特点的单位分开,从而正确地认识事物的本质及其规律性,二 统计分组,2.分组的关键: 选择恰当的分组标准(品质标志) 准确地划分组的界限(数量标志,一)统计分组的意义,品质标志分组 反映事物属性差异,二) 统计分组的类型,1.按分组标志的特征不同分为,简单分组。如人口按性别分组。 - 复杂分组,亦称分类。如人口按职业分组,单项式数量分组 运用于变量变动幅度小、项目少的分组。 - 组距式分组 运用于变量变动幅度大、项目多的分组,数量标志分组 反映事物数量差异,统计总体按照某一标志分组以后,用以反映总体各单位分配情况

15、的统计数列,称分配数列,又可称次数分配,或次数分布。 次数或频数:分布在某一组的单位数。 频率:各组次数占总次数的比重,用百分数表示,三、次数分布,组别(变量) 次数(频数) 频率(比率,二) 数量分组的次数分布,组距两端的数值。分为上限和下限,组距=上限-下限,因数列两端组限形式不同分,开口式组距:最低组与最高组不封口。例:成绩60分以下,90分以上。 闭口式组距:例40-60分,90-100分,1.分组方法,若将考试成绩仅分为不及格与及格两组, 则可编成如下组距数列,某班学生统计学考试成绩表,若把上表改变为如下统计表,则基本上能准确反映总体的分布特征,某班学生统计学考试成绩表,2.分组组距

16、和组中值,关于组限问题 组距分组通常有等距分组和不等距分组两种。 等距分组即标志变量在各组保持相等组距。 反之为不等距分组。 在分组标志变更比较均匀的情况下适用等距分组。 标志变异差别急剧升降时,就应按不等距分组,不等距分组更多的应根据事物性质变化的数量界限来确定组距,已知组距为5,组数为7,最大值39,最小值5,怎样分组,按分法(a)较合适,适用于越大越好的变量,如产值。 P46,适用于越小越好的变量,如成本,对连续变量,组数也要连续。在登记次数时,习惯上遵守,对不连续变量,组与组间是间断的,关于组中值问题,闭口式分组的组中值求法,关于组中值问题,开口式分组的组中值求法,上限不在内原则: 在

17、组距数列中,每组的最大变量值(终点值)为上限,最小变量值(起始值)为下限。连续变量数列中小组中(上一组)的上限也是大组中(下一组)的下限。在分组时如果遇到变量值恰好等于相邻两组的组限时,一般把此值归入大组中。 现在举例说明变量数列编制的过程。例如根据抽样调查,1995年某城镇50户居民家庭平均每人每月生活费收入的资料如下,36703220 2940 2730 2370 3980 3270 2980 2760 2460 3110 35502400 2750 2960 3240 3820 2290 2640 2880 2350 2710 2910 3190 3600 2260 2620 2860

18、3090 3520 3370 2220 2600 2840 3040 3430 2170 2590 2830 3030 2000 2530 2810 3010 3290 2120 2570 2810 3030 3320 将这些数字从小到大排列起来: 2000 2120 2170 2220 2260 2290 2350 2370 2400 2460 2530 2570 2590 2600 2620 2640 2710 2730 2750 2760 2810 2810 2810 2830 2840 2860 2800 2910 2940 2960 2980 3010 3030 3040 3090

19、3110 3190 3220 3240 3270 3290 3320 3370 3430 3520 3550 3600 3670 3820 3980 计算全距。3980-2000=1980,根据这50户居民家庭人均月生活费收入序列化后所呈现出一定规律性的认识,参照上面所说一系列分组方法的原理,我们假定把变动全距分为8个相等的组距, 则组距为: 1980/8=247.5元,化整为250元。 这里第一组的下限应为2000元,于是上下限化整为20002250元,22502500元。分组情况见下表,3、累计次数分布,1.次数分布的表示方法,表示法 即用统计表来表示次数分布。 向上累计:数值由小到大的方

20、向进行累计,某组的向上累计频数或频率等于该组和该组以上所有组的频数或频率之和。 向下累计:数值由大到小的方向进行累计,某组的向下累计频数或频率等于该组和该组以下所有组的频数或频率之和,某班统计学考试成绩次数分配,图示法,即用统计图来表示次数分布,直方图(或次数分配曲线图,仍以上例考试成绩数据,画成如下直方图,若组距不等的话,用标准组距人数,然后据此画直方图,直方图,折线图,在直方图的基础上连接各条形顶边的中点成折线图。 如下图红笔围成的,即为次数分配曲线图,折线图还可用来表示累计次数分布(仍以上例数据,曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线,向下累计,向上累计,钟形分布:一

21、般次数分布呈正态分布曲线,或称正态曲线,对称型,常见的分布曲线有三种类型:钟形分布、U型分布和J型分布,Y,Y,右偏型 (上偏型,左偏型 (下偏型,X,X,很多是偏态分布曲线,或称偏态曲线,还有其他形态,J型分配曲线,U型分配曲线,双峰曲线,小结,1、统计调查的方式:普查、抽样调查、重点调查、典型调查、统计报表 2、统计调查误差 3、统计分组方法:组限、上限、下限、组距、组数、组中值 4、次数分布:向上累计和向下累计 5、次数分布曲线的类型,一、判 断 对 错,1、全面调查和非全面调查是根据调查结果所得到的资料是 否全面来划分的。(,2、对某市下岗职工生活状况进行调查,要求在一个月内报 送调查

22、结果。所规定的一个月时间是调查时间。(,3、我国人口普查的总体单位和调查单位都是每一个人,而 填报单位是户。(,课堂练习,4、统计资料描述的是大量的、密集型事物的总体特征,说明统计资料具有客观性。 (,4、采用重点调查搜集资料时,选择的调查单位是标志值较 大的单位。(,5、统计调查误差就是指由于错误判断事实或者错误登记事 实而发生的误差。(,6、典型调查既可以搜集数字资料,又可以搜集不能用数字 反映的实际情况。(,7、重点调查与抽样调查的目的是一致的,即都是通过对部 分单位的调查,来达到对总体数量特征的认识。(,8、对统计资料进行分组的目的就是为了区分各组单位之间质的不同。(,9、组中值是根据

23、各组上限和下限计算的平均值,所以它代表了各组的平均分配次数。(,10、分配数列的实质是把总体单位总量按照总体所分的组进行分配。(,11、某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。(,12、对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。(,13、任何一个分布都必须满足:各组的频率大于0,各组的频数总和等于1或100%(,14、统计分组后掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。(,16、调查工作的时间限制指的是调查数据的所属时间。(,17、重点调查的目的是为了了解某类事物的发展趋势或构成情况。(,18、统计分组的

24、关键在于选择恰当的分组标准和确定组距。(,15、重点调查是在调查对象中选择一部分样本单位进行的一种非全面调查。(,二、单 项 选 择 题,1、统计整理的关键是( ) A、对调查资料进行审核 B、对调查资料进行统计分组 C、对调查资料进行汇总 D、编制统计表,B,2、下列分组中属于按品质标志分组的是( ) A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组,B,3、有一个学生考试成绩为80分,在统计分组中,这个变量值应归到( )组。 A、6070分 B、7080分 C、8090分 D、90100分,C,4、某主管局将下属企业先按轻、重工业分组,再按规模分

25、组,这种分组属于( )分组。 A、简单分组 B、复合分组 C、分析分组 D、结构分组,B,5、中华人民共和国统计法对我国政府统计的调查方式做的概括中指出,调查方式的主体是( ) A.统计报表 B.重点调查 C.经常性抽样调查 D.周期性普查 6.次数分布可以形成一些典型的类型,并用曲线表示。其中,靠近极端值次数少而靠近中间值次数多的分布曲线是( ) A.弧形分布曲线 B.钟型分布曲线 C.U型分布曲线 D.J型分布曲线,C,B,7、统计资料的性质是( ) A、数量性、总体性、客观性 B、准确性、及时性、全面性 C、科学性、具体性、社会性 D、大量性、同质性、差异性 8、调查单位是( ) A、调查对象的全部单位 B、调查项目和指标的承担者 C、负责向上提供资料的单位 D、基层企事业单位,A,B,9、某地区为了掌握该地区煤炭生产情况,拟对占该地区煤炭总产量70%的四大煤矿企业进行调查,这种调查方法是( ) A、普查 B、抽样调查 C、重点调查 D、典型调查 10、在分组时, 如果某个标志值恰好等于相邻两组下、下限数值时,一般应是( ) A、应将此值归入下限所在组 B、应将此值归入上限所在组 C、将此值归入上、下限所在组均可 D、单独设一组 11、对连续变量分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论