抽样技术课件 第四章(整群抽样).ppt_第1页
抽样技术课件 第四章(整群抽样).ppt_第2页
抽样技术课件 第四章(整群抽样).ppt_第3页
抽样技术课件 第四章(整群抽样).ppt_第4页
抽样技术课件 第四章(整群抽样).ppt_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1、抽样调查课-小组整体抽样,单位:浙江财经学院数统学院课程3360抽样调查课教师:张,2、小组整体抽样,小组整体抽样的基本概念2、小组规模相等条件下的估计3、小组规模等a .一是通过简单的随机抽样,抽取一定抽样量的住户,例如n=250户进行调查,用简单的估计方法估计全居住区的电话所有率。 b .另一个方法是以一定的方法提取一定数量的居住楼层,例如15栋或20栋,调查这些大楼的各住户,根据调查结果来估计居住区整体的电话所有率。 提出实际问题:5,这两种方法的根本区别在于采样单元不同。 前者以住户为采样单元,后者以居民楼为采样单元。 后者的采样方法称为组整体采样。 6、Def.1一般来说,如果整

2、个单元中所有的小基本单元都能够以某种形式构成小数量、大规模的单元,反过来说,每个“大”单元都由几个“小”单元构成,并且这些“大”单元是主(取样)单元称为小区(cell )的7、定义:整个组的取样是一种取样技术,其将整体分成若干组,以该组作为取样单元,从样本中随机抽出一些组,从而调查所选组的所有基本单元。 此处的分组在这里指的是主单元,并且在整个群组中的采样在其中将整个单元分组成整个群组。 在以前的例子中,住宅楼是组(第一单元),住户是第二单元,住宅楼的采样是住户组整体的采样。整组抽样的定义、8、整组抽样的特点、1 )抽样框架的制作简单、2 )实施方便、节省费用;3 )抽样误差相对大,发挥整组抽

3、样的优点,节省时间和劳力以增加样本量的方式来补充精度的9、分组准则是在提取的组的组内的每个小区中对总方差=组间方差组内方差、组内方差、组间方差、该折衷、组整体采样进行采样,因此在提取的组的组内的每个小区中对组进行采样分组标准:同一组内各单元间的差异大,即组内的方差大,组与组的差异尽可能小,即组间的方差小。 10、组的规模,组的规模是指构成组的单元数。 集团规模比较灵活,规模小,规模大,报价精度差,但省费。 规模小,估价精度高,但费用高。 费用和准确度因实际需要而异。11、群规模相等的群整体取样,一、群规模相等的简档二、符号说明三、整体平均的估计和性质四、估计量方差的估计五、设定修正效果、12、

4、整体中n个一次单元或群的大小(群内二次单元数)相等的情况这就是说,当作为整体存在n个集群并且包含在每个集群中的小区数目等于m时,称为集群规模相等,并且在实际问题中,只要集群的规模相近,就称为集群规模相等。 此时,群的提取一般使用简单随机采样(无返回)。一、群规模相等的概要、13、二、符号说明、14、总体、样本、15、三、总体平均的估计和性质、总体平均的估计是、性质、1 )的不偏不倚的估计(为什么? 根据、18、4、估计方差的估计,19,一种无偏差的估计,其中,在实际问题中,具有某一特性的子单元在总体中所占的比率p的估计,在整个群组中经常使用取样,是方便有效的,且每个群组的大小相等我们已经研究了

5、简单的随机采样和比较复杂的分层采样、不均匀概率采样、整组采样,采样方法的差异会引起估计量精度的差异。 采用比较复杂的采样手段,只是为了提高报价效果。 鉴于一个采样方案的效果如何,一个相对好的方法是在与简单随机采样相同的采样容量下将其精度进行比较。 这就是缓存在1965年提出的设定修正效果(简称design effect,deff=) 3360、Deff=() deff1的情况,表示考虑的采样设定修正的效率比简单的随机采样差;deff1的情况,表示该采样在整个组采样中,先指出如何分割每个组以及如何控制每个组的大小会影响估计精度,这会导致设置纠正效果。 设置校正效应的定义提取具有NM个子单元的总数

6、中容量为NM的简单随机样本,其中具有相同组大小的组的总数的样本的设置校正效应约为以相同样本数目(以子单元为单位)的整组总数的方差,因为样本平均方差为:22 也就是说,整个组的样本量必须是简单随机样本的样本量的倍数,以便获得相同精度。 23、组内相关系数,24,例6.1在某寄宿中学的在校生零钱调查中,以宿舍为组进行了整个组的抽样。 每个宿舍有八个学生。 通过简单的随机抽样,从总共510家宿舍中抽出了n=12家宿舍。 96名学生上周人均零用钱及相关数据如下。 1 )估计平均零花钱,给出其95%的置信区间2 )试着估计群内相关系数和设定修正效果。3 )如果是简单的随机抽样,需要多少样本? 25、I、

7、240、187、162、185、206、197、154、173188.0027.19210、192、184、148 187、166、232、205、263、198、210207.8829.17210 152、224、195、241182.7538.77230、205、187、176、212、253、189、240211.5027.48274、208、1998 222191.1328.29342、294、267 312、267、257 27和可靠性95的置信时段包括: 28、(2)根据之前计算出的样本组间方差,对于29、30、(3)简单随机采样的样本量,组内方差与组总体采样96个样本量相同等概率

8、取样、比率估计4、例如32、总体平均的估计,其中的方差估计可以是等概率取样、简单估计、33、群组平均规模、等概率取样、加权估计、三重估计可用样本组平均规模来代替,36、设总量y的估计为总量估计的另一方程式37、设估计的方差为无偏差地平均估计的方差38、设总量平均估计的方差39、设估计的方差40,的估计分别为41、42,背景:是本年度某作物总栽培面积为30525亩,现采用等概抽样随机抽取10个乡,对全县总产量进行估算,抽样调查资料为个案研究,43、样品乡号、村数Mi、作物总产(乡) yi (万千克) 22.022.830.221.725.331.226.020.533.6、800780100070080110085080012

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论