抽样调查-整群抽样培训课件.ppt_第1页
抽样调查-整群抽样培训课件.ppt_第2页
抽样调查-整群抽样培训课件.ppt_第3页
抽样调查-整群抽样培训课件.ppt_第4页
抽样调查-整群抽样培训课件.ppt_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、4.1整个抽样组,1,整个抽样组的定义和特性,1。整个采样组的定义整个采样组是一种采样技术,它将整个划分为多个组,然后使用组作为采样单位随机抽取部分组,以研究泵组的所有基本单位。2.整个抽样组的优点(1)简化了抽样框的编制;(2)便于实施调查,降低了成本3。整个抽样组的缺点:样品误差大。2,组划分,整个抽样组中,组主要可分为两个茄子类别。一个是根据行政或地区而形成的集团(如学校企业和街道),对此的整个集团调查旨在降低成本,以便于调查。另一组是调查人员人工确定的。例如,如果将大面积分成几个小面积,就要考虑如何分类,以便在相同的调查费下将调查误差降到最低。组划分的一般原则是为了提高准确度,应尽可能

2、地扩大同一组内每个单位之间的差异,避免同一组内的每个单位提供重复信息。牙齿原则与分层抽样中划分层次的原则相反。因此,完整采样和层次采样是徐璐为其他整体结构建议的两种茄子不同的采样方法。3、组大小、组大小表示组成,组的规模大,估计的准确度低,但节约了成本。群体的规模很小,可以提高估算的准确度,但费用会增加。实际上,确定组的规模包括组的具体结构、精度、成本、调查和实施的组织管理等多种因素。组的大小有两种茄子情况。一个是整个组的大小相同。另一个是整个组的大小不相同。4,附录,整个I组中第j个单元的指标值:采样I组中第j个单元的观察值:整个组(PSU)数:n采样组数:第n个组中的单位(SSU)数:总单

3、位数:整个组平均值:采样的组首先,让我们考虑最简单的方案。每个组中包含的单位数M相同,称为组大小相同。(在实际问题中,如果组大小接近,则可以认为组大小相同。)如果组大小相同,则整个抽样组通常使用简单的随机抽样方法提取组,此时对整体平均值的估计非常简单。1,组大小相等时的估计,1,平均估计量及其方差是简单的随机采样,如果组大小相等,则整个平均值的估计值为:定理4.1是无偏估计。换句话说,牙齿结果很明显。采样组平均值是整个组平均值,因为组是用简单的随机方法提取的。定理4.2的方差为:以下是完整的示例组示例:例4.11在对一个初中学生零花钱的调查中,对宿舍进行了分组的全部抽样。每个宿舍有M=6名学生

4、。简单随机抽样,提取整个N=315个宿舍中n=8个宿舍。上周所有48名学生的零花钱及相关计算资料见下表。估算牙齿学校学生的平均每周零花钱,并提出95%的信赖区间。8个宿舍48名学生每周零花钱支出额,海损:据了解,估计量分配的估计值如下。所以可信度为95%的信赖区间为98.171.964.34,也就是89.66韩元,106.68韩元,2,因此,如果整个抽样组中的较大者,则整个抽样组将失去准确度。现在使用方差分析表讨论牙齿问题。当组大小相同时,整个样本整体方差分析表,我们将整个样本组与简单随机样本的效率进行比较。假设直接从全部中提取样本容量为nM的简单随机样本,则样本平均值的方差为:但是,如果整个

5、组分为N个大小为M的组,则定义为组内相关系数,并说明同一组内各个单位对之间的相关关系。表达式如下所示:根据组合和平均值的计算,也可以表示为:事实上,可以用前面提到的组内相关系数表示:因此,可以计算同一组采样的设计效果:这是样本组的方差约为简单随机采样方差的两倍,整个样本估计效果与组内相关系数密切相关,因此,为了提高整个采样的效率,如果组内每个单元的值都相同,那么。对于自然形成的组,调整组内的单元是无法控制的值。此时,要减少取样误差,只能增加取样容量。此外,组内相关系数可以表示为组内方差和组间方差,估计为样本统计。示例4.2估计示例4.1中基于宿舍的组内相关系数和设计效果。分析:在示例4.1中,

6、已计算示例组之间的方差,示例组中的方差为:由相关系数的估计设计,总体随机样本的样本量约为2.74倍,牙齿时简单随机样本的样本量为:1,等近似样本,牙齿时不考虑组大小的影响,采样方法与上一节组大小相同,估计方法也相同。也就是说,使用简单、随机采样。总体平均值的估计值为,2,群规模不相等时的估计值为,2,等概述样本,权重估计值为,基本思路为:群规模乘以权重,乘以每个组,计算样本中N个组的总和为平均值。估计公式:如果整个组平均大小未知,则可以使用抽样组,单个单位总数。总计估计量的方差:其无偏估计值为:平均估计值为:加权估计方法与简单估计值相比考虑了组规模,因此估计量分别为无,整体平均为比率估计的形式

7、为:与第三章比率估计值的区别在于辅助变量有偏差。如果采样组数大于N牙齿,则不是,而是组的大小。比率中估计的性质可以忽略,偏小,可以忽略。总量Y的比率估计:的样本估计:的样本估计:4,案例和方法比较,例4.3一个县有33个乡,共726个村,一年作物的总种植面积为30,525亩。目前,我们正在随机抽取10个香土,进行牙齿作物的产量调查(调查数据见下表)。应使用无偏估计和比率估计分别估计整个县的总产量,计算估计量的标准偏差。,10个乡土调查数据,(1)无偏估计(等粗略抽样,简单估计),平均每村产量计算:因此,评价=966.19,的牙齿方法的估计过程并不复杂,但有偏估计。反而增加了。牙齿方法适用于差异

8、不大的全组抽样。(3)将组规模估计为辅助变量,评价:比率估计为辅助变量,估计的差异取决于组平均值的差异。差异比率的差异是稳定的,因此比率估计可以获得比前两种方法更好的估计效果。(4县全部牙齿作物的种植面积均为X=30525亩,采用种植面积作为辅助的估计结果为:评价3360与前几种茄子方法相比,估计误差最小,估计效果最好。即,P118的(6.1)表达式,用于表示组中具有特定特征的单元格的数量。整体比率p的无偏估计。样例的组I具有特定要素单位数的比率。m是每个组的单元格数。估计量的方差为:2,组大小不相等的估计,组大小不相等,如果仍使用简单随机采样提取组,则总体比率的估计值为:根据比率估计的特性,

9、估计测量的方差为:估算公式为:示例6.5 95%可靠性试验结果,估计了牙齿小区女性比例的信区间,并用简单的随机抽样方法进行了比较。整体比率估计案例,25个居民小组数和女性人口数,解决方法:是以集团规模等各种比率估计整体比率的估计值,由于总体未知,所以用样本代替,信任区间如下:使用简单的随机抽样方法从牙齿街区挑选151人,假设调查结果与上表相同,其中女性人数相同。(阿尔伯特爱因斯坦,Northern Exposure(美国电视电视剧),女性)估算值的差异如下:因此,您可以计算设计效果。也就是说,在二次内容的调查中,可以看到整个抽样组的估计效果明显优于简单随机抽样。4.3等概率两步采样,1,多级采

10、样前面提到的整个采样组具有很多优点,但是组内的单位通常具有相似性(显示组内相关系数大于0)。特别是当组更大的时候,人们自然认为没有必要调查组内的所有单位。重新采样组中的单位并调查提取的单位是两阶段采样。同样的道理可以有三阶段抽样、四阶段抽样等,我们统称为多阶段抽样。多级抽样的优点,(1)多级抽样保留了整个抽样组的抽样比较集中、促进调查、降低成本等优点。同时,也避免了对小单位的过度调查造成的浪费。(2)多级抽样不需要准备所有小单位的样品箱。萃取主要单位时,您仅需要建立主要单位的范例方块、萃取的主要单位、次要单位的范例方块等。2,在采样方法和推理原理多阶段采样中,每个阶段的样本可以相同,也可以不同

11、。通常与层次采样、整个采样组、系统采样一起使用。在多阶段抽样中,样品是分阶段进行的,因此在讨论估计量的平均值及其差异时,必须分阶段进行。牙齿操作需要以下特性:对于两阶段采样,固定主要单位时,次要采样的平均值和方差。求一次采样的平均值和方差。,从教材P148来看,上述性质对于多阶段采样,例如,第三阶段采样,例如,第三阶段、第三阶段、等概率第二阶段采样的符号说明,初级单位和初级单位拥有的第二单位数:N,M第一阶段和第二阶段采样的样本数:N,M第一初级单位的j第二阶段记住的话就有。也就是平均。同样,4,主要单位大小相同的次要抽样,第一阶段从全部N个主要单位中的简单随机抽样中提取N个主要单位,第二阶段

12、从提取的主要单位中包含的M个次要单位中提取M个次要单位,简单随机抽样中提取M个次要单位,即接受最终调查的单位。例如,一个新开发的小区拥有同一公寓15个单位的房地产,居民已经纷纷搬进新房,每个单位居住12户居民,为了调查居民家庭装修情况,将在180家具中挑选20户进行调查。下表:表格中的红字是抽签中的房间号码。这里初级单位(建筑物)为15个,初级单位(居民家庭)为12个。首先,从1到15提取初级单位,从15初级单位随机抽取5个单位(分别为1,6,9,12,13次)。然后,从被挑选的初级单位中,从第二个抽样,即每一个提取的5个建筑物中随机挑选4户。这是一个两级抽样,主要单位的大小相同。对于大小相同

13、的两阶段样本的估计量及其性质,(1)总体平均值的估计定理4.5初级单位大小相同的第二阶段样本,两个阶段都是简单随机样本,并且对于每个初级单位,如果第二阶段样本徐璐独立,则对总体平均值的无偏估计值为:总体平均值的估计值为:的无偏估计值如下:例4.4要调查100家四月企业的特定指标,首先提取了100家企业中有5家样品企业的简单随机抽样,调查人员分别在调查月内随机抽取3天作为调查日,要求抽样企业只填写3天的遗属簿。调查结果如下。要根据牙齿数据推算100家企业的牙齿指标总量,并提出95%的信赖区间。把企业解为初级单位,每天看第二单位。在调查月内有30天(即持有30个辅助单位)的牙齿。首先从基本单位中提

14、取n=5的简单随机采样,然后为每个采样的辅助单位提取m=3的简单随机采样。问题,N=100,M=30,n=5,M=3,首先计算采样基本单位的平均值,然后计算方差。5,初级单位大小不同的二次采样,一般初级单位大小不相同。根据初级单位的大小分层后,如果层次中初级单位的大小差异仍然很大,则应使用牙齿部分介绍的方法处理二次抽样问题。初级单位大小不相等时,一般采用不相等的近似样品。,1,符号说明,主要单位总数和主要萃取范例数:n,n,I第一主要单位的次要单位数:I第一主要单位的次要范例数:I第一主要单位的j次要单位观测值:范例中I第一主要单位的j次要单位观测值I第一主要单位指标总和:I第一主要单位第I个主要单位第二个单位之间的方差:第一个单位的简单随机抽样,第二个抽样的每个阶段采用简单随机抽样,并且每个主要单位内第二个单位的抽样徐璐独立,则为2。 总体合计的简单估计如下:可以证明牙齿估计没有偏倚,其方差为:,总计的估计值如下:这是偏估计量,但随着样品量的增加,偏牙齿为零。近似平均平方误差为:的样本估计:表达式,4.4等概率

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论