多阶段抽样的精度控制及样本量计算_430e5d92_cfcb_4ec3.pdf_第1页
多阶段抽样的精度控制及样本量计算_430e5d92_cfcb_4ec3.pdf_第2页
多阶段抽样的精度控制及样本量计算_430e5d92_cfcb_4ec3.pdf_第3页
多阶段抽样的精度控制及样本量计算_430e5d92_cfcb_4ec3.pdf_第4页
多阶段抽样的精度控制及样本量计算_430e5d92_cfcb_4ec3.pdf_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

R 0 98220000 0 01370 9926000 00 00550 973300 0000 07400 00000 8655 若人口按如上的比率转移 我们就可以 对另一个或另几个核算期的期未人口存量进 行预测 上表的年龄分组是根据联合国对少年 青年 中年 老年的划分标准而确定的 由此不难发现 上面的矩阵表通过年初 年末人口反映了该地区的人口规模 通过方 阵 X 描述了人口的年龄构成及其变动情况 通过 地区外 描述了人口的出生 死亡 迁 入 迁出 实行了人口静态描述和动态描述 存量描述与流量描述的有机统一 显然 如果我们将人口按职业 文化程 度 性别等标志来分组 或将年龄分组分得再 细一些 则不难编制出新的矩阵表 从而可满 足新的研究的需要 作者简介 李金华 男 1962 年 12 月生 讲师 博士生 中南财经大学统计系综合统计教研室主任 责任编辑 石庆焱 多阶段抽样的精度控制及样本量计算 王文颖 ABSTRACT Several sample sizes are needed to be calculated in the multistage sampling but this issue has been scarely touched upon in the textbooks and theses related to sampling survey This paper has put forward a method which is very useful and easy to deal with in determining the sample sizes of multi stage sampling and solved a difficult problem in the multi stage sampling 一 问题的提出 复杂抽样的样本量计算是比较困难的 各种关于抽样方法的著作或论文通常只给出 了简单抽样的样本量计算公式 对于复杂抽 样的样本量计算只是一般地说可以利用设计 效果系数 Def f 来间接计算 然而 Deff 在 计算多阶段抽样样本量时并不适用 以二阶 段抽样为例 有两个样本量需要计算 即一级 单位样本量和二级单位或最终抽样单位样本 量 利用 Def f 只是在一级样本已定时计算 最终抽样单位的样本量 而采用多阶段抽样 的难点恰好是如何控制一级抽样精度和计算 样本需要量 更进一步说 利用 Def f 计算样 本量的方法只适用于单级或一阶段抽样设 计 不适用于多阶段抽样设计 因为在多阶段 抽样中 Def f 是一变量 它随着前面各阶段 的样本量的变化而变化 我国 村及村以下和城镇合作经营 个体 工业年度抽样调查试点方案 1 采用了多阶 段抽样设计 各省在操作过程首先遇到的难 题是如何确定样本量 尤其是一级单位样本 66 统计研究 Statistical Research 1997 年第 5 期 No 51997 量 此外 由于方案规定以省为总体 而各省 的实际情况差异又比较大 若采用某种小范 围的试验或测算的办法来估算样本量 一方 面工作量非常大 另一方面也不具有普遍意 义 因而非常需要给出一个具有一般意义的 计算样本量方法 以便于实际操作 二 多阶段抽样设计的精度分 解 方差是计算样本量的基础 因此关于如 何计算多阶段抽样设计样本量的讨论也就从 研究多阶段抽样估计量的方差开始 多阶段抽样方差公式随具体抽样设计方 法不同而有所不同 但都可一般地表述为一 阶段单位间方差和一阶段单位内方差两部分 之和 为简单起见 下面假定第一阶段为简单 随机抽样 而其他各阶段采用什么抽样方法 以及有多少个阶段并不加以限制 其估计量 及方差公式可一般地表述如下 设 G 为要估计的目标总量 在第一阶段 采用简单随机抽样时 有 1 G s 是 G 的一个无偏估计量 G s K k k i 1g i 2 v G s 为 G s的方差 V G s的一个无 偏估计量 v G s K 2 1 k K k k 1 k i 1 g i k j 1 g i k 2 k K k i 1 2 i 公式中 K 为一级单位总数 k 为一级样 本单位数 g i为第 i 个一级样本单位的目标 总量 Gi的估计值 2 i为 g i的方差 2 i的估计 量 2 为了方便 令上面方差公式右边的第一 项为v 1 第二项为 v2 则有 v G s v v 1 v 2 为了能分别计算各阶段的样本量 需要 分别控制各阶段的抽样方差或抽样精度 并 在总的抽样精度与各阶段抽样精度间建立起 某种联系 以确保总精度的实现 为此 设估 计量 G s 的允许最大相对误差为 r 则 r tv1 v2 G s 若第二阶段抽样方差为零 则有 r1 tv1 G s 或v1 r1G s t 2 若第一阶段抽样方差为零 则有 r2 tv2 G s 或v2 r2G s t 2 因此 最大相对误差 r 可以表述为 r t r1G s t 2 r2G s t 2 G s 整理此方程我们得到了一个非常有趣 的 类似勾股定理的表达式 r 2 r 2 1 r 2 2 这样我们就得到了一个关于各阶段抽样 精度与总的抽样精度的量化关系 此结果是 很重要的 它意味着我们可以根据实际需要 把总精度合理地分配到各个抽样阶段 并可 在设计过程就进行分配 使每个阶段的精度 都得以控制 并继而计算各阶段的样本需求 量 上述的讨论只是区分了两个阶段 但将 其结果推广到更多的阶段并不困难 例如三 阶段抽样方差 只是将前面方差公式中右边 的第二项 一阶段单位内方差 再分解为第二 阶段单位间方差和第二阶段单位内方差两部 分 因此 沿用上面的思路 不难将其结果推 广到任意个阶段 即 r 2 m i 1 r 2 i 三 各阶段抽样精度的选择 下表给出了 r 分别取值 0 05 0 1 和 0 15 时 r1和 r2的可能取值 67 王文颖 多阶段抽样的精度控制及样本量计算 r1和 r2关系对照表 r 2 r2 1 r 2 2 r 0 05r 0 1r 0 15 r1r2r1r2r1r2 0 010 04900 010 09950 010 1497 0 020 04580 020 09800 020 1487 0 030 04000 030 09540 030 1470 0 040 03000 040 09170 040 1446 0 050 00000 050 08660 050 1414 0 060 08000 060 1375 0 070 07140 070 1327 0 080 06000 080 1269 0 090 04360 090 1200 0 100 00000 100 1118 0 110 1020 0 120 0900 0 130 0748 0 140 0539 0 150 0000 从表中可以看出 在保证总精度的前提 下 我们可比较灵活地选择各阶段的精度 或 是取较高的 r1和较低的 r2 或是取较高的 r2 和较低的 r1 或是取 r1 与 r 2之和的最大值 例如 在总精度为 0 1 时 如果取 r1为 0 06 则 r2为0 08 如果不考虑其他因素 取 r1等 于 r 2是一个很实际的想法 因为此时 r1 与 r 2 之和最大 这种量化后的各阶段精度之间的关系非 常有利于我们在实际工作中根据管理或经费 的状况进行决策 由于将总精度量化地分解 为各阶段的精度 我们就可以分别对各阶段 的抽样方法进行测试 灵活采用各种抽样技 术 分别提高各阶段的抽样精度 从而提高总 的抽样精度 并使整个过程处于一个有效的 控制之中 更为实用的是 哪一阶段的方差难 以控制 可以适当地放松该阶段的精度要求 而通过相对提高其他阶段的精度来实现总的 精度要求 而且 在实际工作中我们通常有一 个预先所希望的一阶段样本规模 这时可以 通过调整r1的取值来实现 四 各阶段样本量的计算 有了上述分解关系和必要各阶段的有关 辅助信息 计算各阶段样本量就比较容易了 只要将各阶段都分别视为一个独立的单级抽 样 并利用相应的样本量计算公式即可 下面 我们以一个第一阶段和第二阶段都采用简单 随机抽样的二阶段抽样作为例子来说明具体 的计算过程 此时 方差公式仍是前面给出的 v G s 但可表述得更为具体 即 v G s K 2 1 k K k k 1 k i 1 g i k j 1 g i k 2 K k k i 1 N 2 i1 ni Ni s 2 2i ni Ni是第 i 个一级样本单位内子单位总 数 ni是第 i 个一级样本单位内子单位样本 数 s 2 2i是第 i 个一级样本单位内各子单位之 间的方差 1 第一阶段样本量计算 利用简单随机 抽样的样本量公式计算第一阶段的样本需要 量 即 k tS1 r1G 2 1 1 K tS1 r1G 2 式中 S1 K i 1 Gi G 2 K 1 S1也可用s1替代 s1 1 k 1 K i 1 g i K j 1 g j k 2 如果第一阶段抽样采用的是分层抽样 只要利用相应的分层抽样样本量计算公式即 可 2 第二阶段样本量计算 上面方差公式 右边第二项 v2 中方括号部分是个条件方差 公式 即在一级样本单位发生条件下的分层 方差计算公式 或者说是以已抽中的一级样 本单位为一个已知总体时的分层抽样方差计 算公式 利用分层抽样时计算样本量的公式 就可以得到 68 统计研究 n k j 1 N 2 js22j j k K v2 K j 1 Nj s22j 式中 j nj n v 2 r2G s t 2 需要注意的是 这里计算 n 的公式中的 求和符号只是对一级样本单位 k 求和 而非 全部一级单位 K v2前面有一系数 k K 这 是与通常的分层抽样样本量计算公式的不同 之处 事实上 如不考虑分层效果 此时可采用 简单随机抽样计算样本量的公式求得 n 五 结束语 本方法的基本思路是将多阶段总目标量 的抽样精度分解为各阶段目标量的抽样精 度 并在总精度与各阶段的精度之间建立了 一种有机的 量化的联系 这不仅使我们可以 工业统计定期抽样调查试点方案 的设计 雷平静 ABSTRACT Based on the practical working experience in the regular industrial statistics pi lot sample survey conducted in recent years the paper has expounded the back ground of the programme for this pilot survey the basic ideas of programme de sign technical characteristics feasibility analysis the problems existed and the way how to improve the programme 一 方案产生的背景 长期以来 我国的工业统计定期报表制 度主要采用全面调查 层层汇总的调查方法 随着经济体制改革的发展 现行工业统计定 期报表制度在执行过程中遇到了以下问题 1 全国定期 月 季度 工业统计综合报 表从县 区 统计局开始汇总有关主管部门和 企业基层报表数据 经过市 地 省 区 市 统计局逐级汇总 最后由国家统计局汇总出 全国的综合数据 县 市统计局的定期统计报 表数据除部分直报企业外 大部分来源于各 个主管部门搜集的综合报表数据 然而 随着 政府部门机构改革的发展 特别是一些工业 主管部门职能转变 精简合并 使有些地方的 主管部门工业统计力量削弱 无力进行月 季 度全面调查 只好采用推算或估算的方 法得出综合统计数据 2 随着经济管理体制改革的发展 政企 公开已成为必然趋势 现在无主管部门的企 业越来越多 这些企业的月 季 度统计报表 只能由政府统计部门自己搜集 但月 季 度 调查时效性较强 要搞全面调查 无论从时间 上还是从人力上都是难以实现的 3 在我国社会主义市场经济发展的过 程中 出现了多种经济成分 多种经济类型 多种经营方式的复杂格局 在新的形势下 经 济结构复杂化和利益主体多元化的问题日益 69 1997 年第5 期 No 51997 统计研究 Statistical Research 利用单级抽样计算样本量的方法分别计算多 阶段抽样中各阶段抽样的样本量 大大简化 了多阶段抽样计算样本量的难度 而且使得 我们在实际工作中可比较灵活地把握各阶段 的精度 并根据实际情况协调各阶段的抽样 精度 从而更为有效地控制整个抽样设计的 精度 参考文献 1 国家统计局 村及村以下和城镇合作经营 个体工业年度抽样调查试点方案 2 孙山泽 抽样调查 作者简介 王文颖 男 42 岁 1986 年毕业于中 国人民大学 获经济学硕士 现任国家统计局企业调 查总队调查设计管理处处长 责任编辑 石庆焱 突出 统计调查中层层汇总上报受到的干扰 因素也日益增多 虚报 瞒报统计数字之风不 断蔓延 一些作为党和政府需要的经济总量 经济结构和经济效益等方面的统计数字面临 着失真的危险 因此 再用老一套的全面调查 方法 已很难得到比较准确的调查数据 也难 以满足各级党和政府部门的需要 上述问题表明 现行工业统计定期报表 制度中沿用的全面调查方法已越来越不适应 我国社会主义市场经济发展的需要 必须进 行改革 1994 年 2 月 国家统计局提出了全 国统计调查方法体系改革的目标 在现行工 业统计定期报表制度中采用抽样调查方法 不仅是我国社会主义市场经济发展的需要 也是我国统计调查方法体系改革的需要 为 此 国家统计局企业调查总队经过调研 测算 和论证 制定了 工业统计定期抽样调查试点 方案 并于 1996 年 11 月开始进行全国范围 的工业统计定期抽样调查试点工作 二 设计的基本思路 设计 试点方案 的基本思路是以目录抽 样技术为基础 采用简便易行的分层对称等 距抽样 或分层简单随机抽样 方法 在提高 抽样效率的同时 满足现行工业统计定期报 表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论