




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、不同样本轮换方法的比较金勇进栾文英摘要:样本轮换是定期连续性抽样调查中必须面对的一个问题。本文在系统 介绍不同样本轮换方法的基础上,对各种方法的特点进行分析和比较,希望对连 续抽样调查中样本轮换方法的选取有所启示。关键词:样本轮换 子样本轮换 永久随机数轮换随着统计改革的发展,抽样调查成为获取社会政治经济资料的主要方法。对 于经常性的抽样调查(如我国的城市住户调查、农村抽样调查、全国的电视收视 率调查、规模以下工业抽样调查等),样本的合理更新成为保证调查效率、提高 估计精度的重要问题。样本轮换是样本更新最为合理的方法,它是指在定期抽样 调查中,将上期样本的一部分单位抛除,同时用过去未被抽中的一
2、部分单位代替 它们,与上期样本中保留下来的单位拼配成现期样本进行调查估计。周而复始地 重复以上做法,就形成了轮换。样本轮换可以解决固定样本容易产生的“老化” 问题,同时兼顾调查资料的连续性和可比性。样本轮换的具体方法种类繁多,概 括起来可以分为两类:子样本轮换和永久随机数轮换。本文将对这两类方法进行 介绍和讨论,并对其特点进行比较,希望能对连续抽样调查中样本轮换方法的选 取有所启示。一、子样本轮换子样本轮换是传统的轮换模式,一般可分为两种:单水平轮换、不完全单水 平轮换,尤其不完全单水平轮换受到抽样调查专家的普遍关注。两个时期的样 本重叠率取决于样本轮换模式。样本轮换模式是指入选单位保留在样本
3、中的时间 模式,轮换模式因为样本单位保留在样本中的时间长度和时间间隔不同而不同。 单水平轮换与不完全单水平轮换模式的共同特征是样本中的单位都只提供当期 的资料。将这两种轮换模式用a - b - a(m)模式表现出来,即样本单位在样本中保留a个月连续调查,离开样本b个月,然后再回到样本a个月,如此重复m 次。如果b = 0则轮换模式变成“ in - for - m ”模式,即样本单位只在样本中保留m个月,然后离开样本,不再返回,这就是单水平轮换模式;如果b u 0,轮 换保持a -b -a(m),则是不完全单水平轮换。a -b -a(m)模式可以涵盖绝大部分 月度调查的轮换模式。.单水平轮换模式
4、单水平轮换模式一般都用“ in - for - m ”模式来表示,即入选单位在样本中 保留m个月,然后离开样本。这一模式会使s月后样本之间的重叠比率是1 - (s /m )(s = 1,2, m- I)当s = m或s m时,除非m 12,否则一年之后相同 的月份之间没有共同样本(其中m表示入选单位在样本中保留的时间,s表示月 份的间隔时间)。连续调查的重要目的是要了解研究变量随时间变化的情况。对于调查设计来 说这意味着,调查结果不仅对研究变量当期的状况有一个好的估计,同时对随时 间的变化量也要有一个好的估计量。在各国月度劳动力资源调查( Monthly Labour Force Survey
5、s,即MLFSs)中,这两个目标要求设计在连续月份中的样 本要有较高比例的相同样本。如澳大利亚的LFS调查即采用“in- for-8”模式、加拿大劳动力调查采用“in - for - 6”模式等。当前我国农村住户调查也采用单水 平轮换模式,只是略有不同。我国农村住户调查是在轮换调查了若十年之后,在 总体中重抽样本,然后再在新的样本中重新开始轮换。这种方式可以保持样本的 新鲜性,跟上样本框的调整速度,保证样本对总体的代表性。但缺点是不断重抽 样本会增大调查费用,而且会使资料的衔接性变差。.不完全单水平轮换不完全单水平轮换是指在样本中的一些单位在一定时期内保留在样本中,然 后再退出样本一段时期后又
6、重新返回样本一段时期,样本中的单位都只提供当期 的资料。如美国现期人口调查(Current Population Survey,简写为CPS)采用 的484轮换模式,就是每个月的样本都是由8个轮换组组成,每个样本轮换组 在样本中保留4个月,再以后连续的8个月中离开样本,然后又重新归入样本4个 月。该种轮换方法可以用aba(m)模式来表示,即入选单位在样本中保留2 月,然后离开样本b月,而后返回样本a月,或者记作rm - rm-1,即每个轮换组的 一些调查单位被连续调查r个月,下面r个月离开样本,接下来的r个月返回样121本中,这一过程重复m次。美国的现期人口调查使用的是484(8)轮换模式,该
7、模式会使s月以后 相同样本的比率是1-(s/4)(当s = 1,2,3时),当s = 12时,样本中相同单位的比率 是4/8,当s = 9,10,15时,相同样本的比率是4/8-(s-12)/8 ,当s = 4,5,8时 没有相同样本。日本住户调查采用2-10-2 (4)模式,这种模式使相邻的两月 有1 /2的样本单位相同,当s = 12时相同样本的比率仍然是1/2。英国现阶段进行 的季度LFS调查看作月度调查的话就可以大约看成是121 (5)模式,这种模 式是一个月或两个月之内没有相同的样本,当s = 3,6,3m时,相同样本的比率 是1-s/3m。如果m = 5或m 5,相邻两年相同月份的
8、相同样本单位的比率是 1 一 4/m。不完全单水平轮换模式最大的优势在于可以用于对时间趋势的预测,尤其是 在对有周期性波动的时间序列进行预测时,这种优势尤为明显。因此不完全单水 平轮换的aba (m)模式,a、b之和与波动周期相同。也就是说时间序列的 波动周期是年度的话,可采用484、2102、666模式等;如果时间序 列的波动周期是季度的话,可采用121模式。Craig H. McLaren and David G. Steel等人曾在1997年和2000年分别进行过测算,在调查的重点是关注月度变化 时,相邻月份之间要求有较高的重叠率,因而推荐使用重叠率较高的“in-for-8” 模式,此时
9、该模式的效率高于“in-for-6”模式,高于484模式,更高于12 1模式。在季节因素对时间序列有明显的影响时,121 (m)模式是最优选 择,其效率甚至高于每月独立的抽取全新样本的模式。具体轮换模式的选择要根 据研究的目标而具体确定。二、永久随机数法轮换样本永久随机数法(Permanent Random Numbers)在抽样调查中的应用近几 年蓬勃兴起,主要集中在农业调查以及能源调查方面。永久随机数法抽样技术是 一种有序抽样技术。在这一抽样技术中,抽样框的每个单位都被赋予从区间0, 1产生的随机数,并保留下来,不再改变。抽样框的所有单位按照随机数的大小 排序,具有小的随机数的单位将入样。
10、因为随机数被保存下来,因此称之为永久 随机数(PRNs)。永久随机数法强调随机数与抽样单位的唯一确定性。如果有 新抽样单位产生,则随即产生与之相对应的新的随机数,并参与到总体排序中; 如果有旧的单位消亡则将随机数与单位一起从总体中删除。因而能够实现抽样框 的更新。这一过程可以看成将总体总的各单位赋予随机数,均匀分布在0,1之 间,于是可以实现抽样的随机性。Ohlsson (1995)曾详细证明这一过程是随机 抽样。利用永久随机数进行样本轮换主要是基于随机数的永久性,即随机数赋予单 位之后不再改变。永久随机数抽样技术是有序抽样,这种排序实际上是对总体多 主题无关标志排序,所以可以实现多主题抽样。
11、样本轮换在永久随机数抽样技术 里转化为随机数区间的移动。前已述及,永久随机数抽样技术在抽取样本时一般 抽取随机数小的个单位作为样本。同样道理,抽取样本的随机数起点可以不是 0,而是0与1之间的任何一个随机数,原因在于(0,1)区间可以看作一个循 环系统,当选择的终点大于1时,减掉1得到的新随机数就会重新落入(0,1) 区间。这就是永久随机数法样本轮换的基本原理。1.对于等概率抽样,Brewer et al.(1972)给出了利用PRNs进行样本轮换的 方法,只要在抽样的过程中将起点和终点移动一个特定距离即可。要注意的是, 对同一项调查,年度间平移的距离必需为一个常数,否则会破坏样本轮换的一致
12、性。为更形象地阐述样本轮换的原理,下面结合例子予以说明。由20个单位构 成的总体当中,抽取50%的单位作为样本,每年轮换50%。将总体按照永久随 机数排序,可抽取已有总体的前50%样本单位,或者抽取永久随机数小于50% 的单位;此时抽样区间是(0,0.5),样本轮换时,将区间的上下限根据样本轮 换率平移,如轮换50%的样本,则第二年抽取随机数在(0.25,0.75)之间的 样本单位,第三年抽取永久随机数在(0.5, 1.0)的样本单位。抽样及样本轮换 结果如表1所示。表1中表示抽中。由表1不难看出在等概率抽样中,永久随 机数法能有效实现样本轮换。样本单位12345678910永久随机数0.04
13、0.090.140.190.240.290.340.390.440.49第一年第二年第三年样本单位11121314151617181920永久随机数0.540.590.640.690.740.790.840.890.940.99第一年第二年第三年2 .对于不等概率抽样,继续采用上述常数平移的做法会不可避免的将入样 概率小的单位轮换出样本,而保留了入样概率较大的样本。Poisson抽样的规则是如果兀 prn (其中兀为入样概率,prn为永久随机数),则抽中第i个样本 iiii单位。入样概率较大,则大于其对应的永久随机数的可能性要比入样概率较小的 样本单位大。为了减少入样概率对样本轮换的影响,将样
14、本的入样概率引入样本 轮换中。设与前一年样本的重复率为。,新样本的起点是重复率O的函数。定 义新样本的终点如下:l = O)一 . 1时,u = l +兀1i i ii ii i i其中,u=下一年样本抽样区间的高限点,=上面计算所得的抽样区间中下一 年低限点,兀.二下一年第i个PSU的抽样概率,如果l. PRN m时,除非农12,否则一年之 后相同的月份之间没有共同样本。作为月度调查m 12基本上不可能发生。单水 平轮换的弱点在于经过一段时间的轮换之后(比如说不同年份的相同月份之间) 不再有相同的样本。显然这种单水平轮换模式不能得到最优的时间序列趋势,尤 其是有季节变动的时间序列趋势的估计量
15、。对此可以采取一些处理方式,例如先 对时间序列进行平滑,然后通过复合估计量进行调整。不完全单水平轮换恰好可以弥补单水平轮换的这一弱点。不完全单水平轮换 可以使不同年份的相同月份保持一定的重叠样本比重,推而广之,可以使具有周 期波动的经济活动相邻的周期相同的时间段有重叠样本,从而对时间序列的趋势 进行有效的预测,这是单水平轮换以及永久随机数法轮换目前不能够完成的。但 是相对于单水平轮换,不完全单水平轮换操作复杂,并且由于被调查者有一个离 开样本又回到样本的过程,因而不完全单水平轮换在实施过程中更要取得被调查 者的支持和理解。2 .子样本轮换与永久随机数轮换永久随机数法样本轮换采用的是另一种轮换思
16、路,其主要优点在于能有效实 行抽样框的维护。因为随机数与样本单位有唯一确定性,并且随着样本单位的产 生而产生,随着样本单位的消亡而消亡,而且各个样本单位独立存在,在样本轮 换过程中,只要将新增的单位列入到抽样框中,将消亡的单位与其随机数一并删 除,按照前述理论就可以实现样本轮换。需要注意的是,在抽样框发生变动时, 要重新计算样本单位的入样概率,以保证对总体估计的精度和可靠性。子样本轮 换无法实现抽样框的维护。子样本轮换通常是首先确定轮换组,因而新增样本无 法纳入轮换组中,对于消亡的单位,也无法及时从轮换组中剔除。也有人曾提 出对于新增样本单位单独列层以实现抽样框的维护,笔者认为这种做法欠妥,因
17、 为新增样本的具体情况是随机的,无法事先确定,新增样本层的抽样及轮换方法 就无从实现。所以当前实现抽样框维护最为有效的方法就是永久随机数轮换。综上所述,子样本轮换适合总体相对稳定的的抽样调查体系,不完全样本轮 换能有效实现对有周期性波动的时间序列的预测。永久随机数法轮换样本的前提 是在抽样调查体系中引入永久随机数,这是当前绝大多数调查体系所不具备的。 但是永久随机数法不仅能有效地实现抽样框维护和样本轮换,而且能有效实现多 主题调查,并且由于永久随机数法还能解决满足分级管理需要的问题,这对我国 现行体制下的抽样体系有非常重要的意义。在我国连续抽样调查中值得大规模推 广。主要参考文献Cochran
18、, W.G. (1977). Sampling Techniques, third edition.E.E. Gbur and R.L. Sielken, Jr. Texas A&M University Rotation Sampling Design, Proceedings of the Survey Research Methods Section, ASA,1982,522-524.Craig H. McLaren and David G. Steel, University of Wollongong, NSW Australia,The Effect of Different Rotation Patterns on the Sampling Variance of Seasonal and Trend Filters, Proceedings of the Survey Research Methods Section, ASA,1997,790-795.David G. Steel and Craig H.
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小学英语名词变复数知识总结练习
- 影视广告设计的叙事技巧研究试题及答案
- 社会媒体对设计传播的影响试题及答案
- 助理广告师考试案例分享与分析试题及答案
- 梨园医院笔试题目及答案
- 如何在广告设计中实施反馈循环机制试题及答案
- 2024年纺织品检验员考试考生分享经验试题及答案
- 2024年商业美术设计师创意设计考题及答案
- 2024年设计师考试创作思路指导试题及答案
- 国画审美测试题及答案
- 第二章中国体育产业的发展与现状
- 静脉炎的护理 课件
- DB3303T078-2024规模以上工业企业健康评价指标体系
- 特种作业合同协议
- 社工证考试试题及答案
- 2025年云南专升本招生计划
- 汽车营销专业毕业论文
- 2025年中国VOC治理市场深度评估研究报告
- 2025年宽带网络拓展合作协议书
- 教学主管竞聘培训机构
- 《工程勘察设计收费标准》(2002年修订本)
评论
0/150
提交评论