第6章抽样调查_第1页
第6章抽样调查_第2页
第6章抽样调查_第3页
第6章抽样调查_第4页
第6章抽样调查_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章

抽样调查

第一节抽样调查的意义及基本概念

一、抽样调查的意义

一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。二、抽样调查的适用范围

抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。1.实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;2.虽可进行全面调查观察,但比较困难或并不必要;3.对普查或全面调查统计资料的质量进行检查和修正;4.抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;5.利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:三、抽样调查的基本概念

(一)全及总体和抽样总体(总体和样本)全及总体:所要调查观察的全部事物。总体单位数用N表示。抽样总体:抽取出来调查观察的单位。抽样总体的单位数用n表示。

n≥30大样本

n<30小样本(二)全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。抽样指标:抽样总体的那些指标。

抽样框——即总体单位的名单,是指对可以选择作为 样本的总体单位列出名册或顺序编号,以 确定总体的抽样范围和结构。样本数——指从总体中可能抽取的样本的数量。样本容量——指一个样本所包括的单位数。(三)重复抽样和不重复抽样

抽样方法不同,重复抽样和不重复抽样重复抽样:又称有放回抽样。不重复抽样:又称不放回抽样。例例四、抽样调查的理论依据

(一)大数定律独立同分布大数定律贝努里大数定律说明了抽样平均数(成数)趋近于总体平均数(成数)的趋势(二)中心极限定律独立同分布极限定律德莫佛-拉普拉斯定理说明了在抽样单位数n充分大的情况下,抽样平均数也趋近于正态分布。第三节抽样平均误差

一、抽样误差的概念及其影响程度

在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。统计误差登记误差代表性误差系统性误差随机误差实际误差抽样平均误差抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。抽样误差的影响因素:

1.全及总体标志变异程度。——正比关系2.抽样单位数目的多少。——反比关系3.不同的抽样方式。4.不同的抽样组织形式。抽样误差的作用:1.在于说明样本指标的代表性大小。

误差大,则样本指标代表性低; 误差小,则样本指标代表性高; 误差等于0,则样本指标和总体指标一样大。2.说明样本指标和总体指标相差的一般范围。二、抽样平均误差

抽样平均误差实际上是样本指标的标准差。

通常用μ表示。在N中抽出n样本,从排列组

合中可以有各种各样的样本组:1.如果是重复抽样:例2.如果是不重复抽样:⑴考虑顺序的不重复抽样:例⑵不考虑顺序的不重复抽样:例例1010-204002015-152253020-101004025-5255030001015-152252020-101003025-52540300050355251020-101002025-52530300040355255040101001025-5252030003035525404010100504515225103000203552530401010040451522550505020400合计--2500接左:以上资料编成次数分配表如下:样本数f(即次数分配)101-20152-15203-10254-530503545403104521550120合计25-∴抽样误差是所有可能出现的样本指标的标准差。它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。

抽取样本样本平均数离差10201510100104025-52510503000203025-525204030002050355253040355253050401010040504515225合计--750上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则:三、简单随机抽样的抽样平均误差

(一)平均数的抽样平均误差1.重复抽样取得σ的途径有:用过去全面调查或抽样调查的资料,若同时有n个σ的资料,应选用数值较大的那个;2.用样本标准差S代替全及标准差σ;3.在大规模调查前,先搞个小规模的试验性的调查来确定S,代替σ;4.用估计的方法。2.不重复抽样:(二)成数的抽样平均误差

已证明得:成数的方差为p(1-p)

第四节全及指标的推断

一、优良估计的标准(一)无偏性(二)一致性(三)有效性(一)点估计例二、点估计和区间估计(二)区间估计是根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。

根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下:

抽样极限误差△=tμ,(t为概率度)可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);例

抽样误差范围的实际意义是要求被估计的全及指标或P落在抽样指标一定范围内,即落在或的范围内。二、全及平均数和全及成数的推断

在概率F(t)的保证下:即:全及平均数(成数)=抽样平均数(成数)三、全及总体总量指标的推断(一)直接换算法抽样平均数(成数)×总体单位数=总体标志总量1.如果采用点估计方法:上例1中:400×10000=400(万千克)

如果用区间估计方法:上例1中该农场小麦总产量的范围为:

t=2:(397.62~402.38)×10000=397.62~402.38(万千克)t=3:(396.43~403.57)×10000=396.43~403.57(万千克)2.上例2中,全部一级品数量的范围为:

(92.82%~97.18%)×8000=7425.6~7774.4(件)(二)修正分数法

就是用抽样所得的调查结果同有关资料对比的分数来修正全面统计资料时采用的一种方法。

第五节抽样方案设计

抽样方案设计的基本原则:(一)随机性原则(二)代表性原则(三)最大效果原则通常有以下四种组织形式:一、简单随机抽样(纯随机抽样)即从总体单位中不加任何分组、排队,完全随机地抽取调查单位。随机抽选可有各种不同的具体做法,如:1.直接抽选法;2.抽签法;3.随机数码表法;二、类型抽样(分类抽样)先对总体各单位按一定标志加以分类(层),然后再从各类(层)中按随机原则抽取样本,组成一个总的样本。

类型的划分:一是必须有清楚的划类界限;二是必须知道各类中的单位数目和比例;三是分类型的数目不宜太多。类型抽样的好处是:

样本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。两种类型:1.等比例类型抽样(类型比例抽样);2.不等比例类型抽样(类型适宜抽样)。类型抽样的抽样平均误差

在重复抽样情况下:不重复抽样

:在成数情况下:重复抽样

:三、机械抽样(等距抽样)

先将全及总体的所有单位按某一标志顺序排队,然后按相等的距离抽取样本单位。排列次序用的标志有两种:1.选择标志与抽样调查所研究内容无关,称无关标志排队。2.选择标志与抽样调查所研究的内容有关,称有关标志排队。机械抽样按样本单位抽选的方法不同,可分为三种:1.随机起点等距抽样2.半距起点等距抽样3.对称等距抽样机械抽样的好处:

1.可以使抽样过程大大简化,减轻抽样的工作量;2.如果用有关标志排队,还可以缩小抽样误差,提高抽样推断效果。机械抽样,实际上是一种特殊的类型抽样。因为,如果在类型抽样中,把总体划分为若干相等部分,每个部分只抽一个样本,在这种情况下,则类型抽样就成了机械抽样。机械抽样(等距抽样)的抽样平均误差

1.若按无关标志排队一般采用简单随机抽样不重复抽样公式:2.若按有关标志排队一般用类型抽样重复抽样的公式:四、整群抽样

整群抽样即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进行观察。

整群抽样的好处:组织工作比较简单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的抽样误差大。整群抽样的抽样平均误差

整群抽样的抽样平均误差受三个因素影响:(1)抽出的群数(r)多少(反比关系)(2)群间方差()(正比关系)2

d一般计算方法如下:(3)抽样方法

,当R的数目较大整群抽样都采用不重复抽样,所以在计算抽样误差时要使用修正系数时,可用来代替。五、多阶段抽样

即把抽样本单位的过程分为两个或几个阶段来进行。(如果一次就直接抽选出具体样本单位,这叫单阶段抽样)具体讲:①先抽大单位(可以用类型抽样或机械抽样),②再在大单位中抽小单位(可用整

群抽样或简单随机抽样),③小单位中再抽更小的

单位;而不是一次就直接抽取基层的调查单位。七、多阶段抽样的抽样平均误差

以两阶段抽样为例设总体分R组,每组包含个单位,若各组相等,则在抽样第一阶段,从R组中抽出r组;在抽样第二阶段,在中选的r组中随机抽选个单位,若各组m相等,则n=rm则:在重复抽样下在不重复抽样下以上抽样平均误差的公式归纳如下:最基本的是:⑴若为不重复抽样:⑵若为类型抽样:⑶若为整群抽样:第六节必要抽样单位数的确定

一、影响必要抽样单位数的因素(一)简单随机抽样二、必要抽样单位数的计算公式(二)类型抽样重复抽样:不重复抽样:(三)机械抽样

在有总体差异程度和比重的全面资料时,可采用类型抽样的公式;没有总体的全面资料时,可采用简单随机抽样的公式。(四)整群抽样第七节假设检验一、假设检验的意义所谓假设检验,就是对某一总体参数先作出假设的数值;然后搜集样本资料,用这些样本资料确定假设数值与样本数值之间的差异;最后,进一步判断两者差异是否显著,若两者差异很小,则假设的参数是可信的,作出“接受”的结论,若两者的差异很大,则假设的参数准确的可能性很小,作出“拒绝”的结论。二、假设检验的程序

(一)提出原假设和替代假设原假设(又称虚无假设)是接受检验的假设,记作H0;替代假设(又称备选假设)是当原假设被否定时的另一种可成立的假设,记作H1;

H0与H1两者是对立的,如H0真实,则H1不真实;如H0不真实,则H1为真实。H0和H1在统计学中称为统计假设。关于总体平均数的假设有三种情况:

(1)H0:μ=μ0H1:μ≠μ0(2)H0:μ≥μ0

H1:μ<μ0(3)H0:μ≤μ0

H1:μ>μ0以上三种类型,对第一种类型的检验,称双边检验,因为μ≠μ0,包含μ>μ0和μ<μ0。而对第二、三种类型的检验,称单边检验。例(二)选定检验统计量及其分布例(三)选择显著性水平

当原假设H0为真时,却因为样本指标的差异而被否定,这种否定真实的原假设的概率就是显著性水平。用α表示。例α=0.05(即5%)或α=0.01(即1%)

在假设检验中,要分析样本数值与参数假设值之间的差异,若两者差异越小,假设值真实的可能性则越大;反之,假设值真实的可能性越小。因此,要分析两者差异是否显著,如两者差异是显著的,就要否定原假设

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论