




已阅读5页,还剩51页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章 不等概率抽样 1 本章要点 前面各章介绍的抽样方法都是等概率抽 样,本章则对不等概率抽样方法进行介绍, 具体要求: 熟练掌握不等概率抽样的概念和分类, 了解不等概率抽样的应用意义; 了解放回与不放回不等概率抽样的各种 估计量构造及其方差估计; 能够在实际抽样中运用不等概率方法, 尤其是PPS等常用的方法。 2 第一节 问题的提出 3 简单随机抽样,总体中的每一个单位都有相等 的入样概率,所以属于等概率抽样,在分层随机抽 样中,如果各层的样本单位也是按简单随机抽样抽 取,那么层内也是等概率抽样。等概率抽样的基本 出发点是将总体中的每一个单位看成是平等的。如 果所研究的指标在各个总体单位之间差异不大,简 单随机抽样是简便有效的;如果所研究的指标在各 个总体单位之间的差异较大,简单随机抽样的效果 并不一定好。 一、不等概率抽样的必要性 4 如果这些为数不多,但指标值在总体总值中占较 大份额的大、特大城市,大、特大商场,大型农场, 万吨巨轮,大额账单,在调查中与为数众多,但指标 值在总体总值中只占微小份额的中小城市、中小商场 、 中小农场、小船舶、小额账单一样对待,仍然采取等 概率抽样,显然是不合理的。这些调查指标值占较大 份额的大单位理应在调查中具有较重要的地位,给予 较多的关注,而那些调查指标值占较小份额的中 小单位则处于次要的地位,给予较少的关注。 5 二、不等概率抽样的主要分类 (一)放回不等概率抽样 (二)不放回不等概率抽样 6 (一)放回不等概率抽样 所谓放回不等概率抽样是指,在抽样之前就给总体中每个 单位赋予一个确定的抽取概率,在放回抽样的每一次抽取中, 每个单位被抽中的概率都不变,直到抽够 个样本单位为止。 对于放回不等概率抽样,由于每次抽取总体的分布都不变,所 以各次抽取是相互独立的,因此,无论抽样的实施,还是目标 量的估计及其方差的估计,都特别简单,这是这种抽样方法的 最大优点,从某种意义上讲,抽样调查中的放回抽样主要应用 于不等概率抽样这种特殊的形式;然而由于这种抽样方式是有 放回抽样,而且是不等概率抽样,因此赋予较大抽取概率的单 位不仅入样的机会大,而且被重复抽中的机会也大,这样就会 造成信息的重复浪费,降低抽样的精度和效率。放回不等概率 抽样方法中,最重要也是最常用的是总体中每个单位每次被抽 到的概率与单位的规模大小成比例的抽样。 7 (二)不放回不等概率抽样 不放回不等概率抽样是指,在抽样之前就给总体 中每一个单位赋予一个确定的入样概率,并对每一次 抽取的概率进行精心的设计,以保证在n次不放回抽样 中总体中的每一个单位被抽取的概率之和等于预先赋 予的入样概率。由于每次抽取采用不放回的形式,样 本中不会出现重复的单位,抽样效率比放回形式的高 , 但同时也由于各次抽取相互不独立,所以无论抽样的 实施还是目标量及其方差的估计都比放回形式复杂。 不放回不等概率抽样方法中,最重要最常用的是样本 量固定,总体中每个单位的入样概率与单位的规模大 小严格成比例的抽样。 8 第二节 放回不等概率抽样 9 一、多项抽样与PPS抽样 设总体包含 个单位,在放回抽样的每一次抽取 中,抽到第 个单位的概率为 且 ,按此规定有放回地独立抽取 次,共抽到 个单位(有可能重复),称这样的抽样为多项抽样 。 10 在现实中,总体单位规模 大小往往可以是以低成本得 到的单位的粗略度量,或是研究变量的目测值,他们不仅容易 获得而且与研究变量往往有很高的相关性,这些优点可以极大 地提高抽样估计的精度,所以在抽样实践中,与单位规模大小 成比例的概率抽样受到青睐。记这种度量单位规模大小的指标 为 ,并记 ,则可取: 这时,每个单位在每次抽样中入样的概率与其单位的规模 大小成比例,称这种特殊的多项抽样为放回的与单位规模大小 成比例的概率抽样(sampling with probability proportional to size),简称 抽样。 11 二、实施方法 多项抽样是最简单的不等概率抽样,其实 施方法通常有两种: (一)代码法 (二)希里(lahiri)法 12 (一)代码法 在 抽样中,赋予每个单位与相应 相等的代 码数,将代码数累加得到 ,每次抽取都产生一个 之间的随机数,设为 ,若代码 属于第 个 单位拥有的代码数,则第个 单位入样。重复 次这 样的过程,就可得到由 个单位(存在重复的可能) 组成的 样本。如果在实际中存在 不是整数的 情况,则可以乘以一个倍数,使所有的 都成为整数 。对于一般的多项抽样,总可以找到某个 ,使所 有的 成为整数。每个单位赋予与相应 相等 的代码数,然后进行抽样。 13 (二)希里(lahiri)法 令 ,即 为所有 中的最大值,每 次从 1, 范围内抽取一个随机整数 ,从 1, 范围内抽取一个随机整数m,若 ,则第 个单 位入样;若 ,则按前面的步骤重抽( , ) 。 14 三、汉森赫维茨估计量 设 是按 抽样得到的样本观 测值,与它们相对应 的值和 的取值也自然地记 为小写的 和 。对于总体总值 ,汉森(Hansen)赫维茨(Hurwitz)给出如下估 计量: (6.4) 15 对于 这种特殊形式的不等概率抽样, 的 直观意义是明显的。由于 ,代入(6.4)式, 有 16 汉森赫维茨估计量 具有如下性质:它是总 体总值 的无偏估计,即有 其方差为 若 ,则 是 的无偏估计。 17 n【例6.2】某县农业局要调查全县养猪专业户 全年牲猪的出栏头数,并有全县365个养猪专 业户上年末的牲猪存栏头数,各养猪专业户 的饲养规模相差较大,决定以放回方式按与 各养猪专业户上年末牲猪存栏头数成正比的 概率从中抽取30户进行调查,调查结果见下 表,已知全县养猪专业户上年末牲猪存栏头 数为9542头,试估计该县养猪专业户牲猪年 出栏总头数和估计量抽样标准误差。 18 1 2 3 4 5 6 7 8 9 10 15 23 9 29 8 31 24 29 13 19 75 134 37 152 45 185 133 173 74 87 11 12 13 14 15 16 17 18 19 20 40 32 17 26 11 36 25 5 38 42 258 186 69 156 49 221 145 33 288 304 21 22 23 24 25 26 27 28 29 30 19 26 37 21 7 43 18 30 124 160 215 104 49 336 96 177 注: 表示养猪专业户样本编号, 表示各专业户牲猪上年末存栏头数, 表示 各专业户调查年牲猪出栏头数;其中第2、第19编号的专业户被抽中两次。 某县养猪专业户年牲猪出栏头数调查样本资料 19 解:据题中所给资料 , , (头) 20 第三节 不放回不等概率抽样 21 一、包含概率与 抽样 在不放回不等概率抽样中,不仅总体中每 个单位被包含到样本的概率,即入样概率 起着关键的作用,而且总体中任意 两个单位被包含到样本中的概率 , 即两个单位同时入样的概率也起着重要的作用 , 它们必须是已知的或者说是可以求得的,我们 把前者称为一阶包含概率,后者称为二阶包含 概率。 22 如果抽样设计有固定的样本量,则包含概率 有如下性质 : 1、 2、 3 、 23 如果我们事先对总体中的每一个单位都有一个 度量其规模大小的指标值 ,记 对于固定的样本量 ,若总体中每个单位的入 样概率即一阶包含概率与其规模大小 严格成比例 ,即若有 成立,我们称这种不放回的与 单位规模大小成比例的概率抽样为严格的 抽样 。 24 二、霍维茨汤普森估计量和耶茨 格伦 迪森估计量 (一) 霍维茨汤普森估计量 对于不放回不等概率抽样,霍维茨( Horvitz)和汤普森(Thompson)(1952)提 出如下关于总体总值 的估计量: 25 霍维茨汤普森估计量有如下性质: 1、若 则 是 的无偏估计量,且 它的方差为 2、若 ,则 是 的无偏估计。 26 (二)耶茨格伦迪森估计量 如果 固定, 估计量的方差可以写成下 面的形式: 若 ,则 也是 的无偏估计。(6.22)是由耶茨(Yates) 格伦迪(Grundy)森(Sen)(1953)提出来的。 (6.22 ) 27 需要注意的是,只有当 成立,才能保证 估 计量取非负值;而且相比较来说, 当 固定时,估计量 比估计量 要稳定一些。 28 三、严格 抽样的实施方法 (一) =2的情形 1、布鲁尔(Brewer)方法(1963) 2、德宾(Durbin)方法(1967) 29 1、布鲁尔(Brewer)方法 该方法要求对总体中的每一个 ,都满足 , 即总体(或层)中的最大单位必须小于全部单位大小 总和的1/2,否则可将此特大单位作为必调查的单位处 理。两个样本单位的抽取方法是:第一个单位按与 成比例的概率抽取,记第一个被抽出的单位 为 ;第二个单位按与 成比例的概率在剩下的 个单位中抽取。 30 布鲁尔方法的包含概率为: 31 2、德宾(Durbin)方法 两个样本单位仍然用逐个抽取法抽取。第 一个样本单位以 概率抽取,设入样 的单位是 ,第二个样本单位在余下的 个 单位中,以正比于 的概率抽取。 令 32 于是可以计算 和 : 33 (二) 2的情形 1、水野方法 2、布鲁尔方法 3、拉奥桑福特方法 34 1、水野方法 水野法也是一种逐个抽取方法,关键是第 一个样本单位的设置和抽取,它以概率 抽取第一个样本单位;第一个单位抽取之 后,在余下 的单位中,再采用无放回等概 率的方法抽取剩下 个单位。这种方法要求 总体中的单位大小差异不能太大,如果相差过 大,可以通过适当的分层加以解决。 35 总体中,只要对每个 ,有 就可保证这种方法是严格的 抽样 。 对于水野方法,它的一阶和二阶包含概率 分别为: 36 2、布鲁尔方法 它依然采取逐个抽取方式,是 布鲁尔 方法在 情形下的推广。令所有的 , 设定第一个样本单位以与 成比例的概率抽取。余下的 单位按与 成比例的概率从当时尚未入样的单位中每次抽取一个, 。这种方法也是严格的 抽样 37 3、拉奥桑福特方法 这种方法是,设所有的 ,先以概率 在总体中进行一次不等概率抽样, 抽出第一个样本单位,然后以与 成比例的概率有放回地抽取余下的 个单位。 一旦有单位被重复抽中,则放弃所有已抽到的单 位进行重抽,直到抽中的 个单位不相同为止。 38 四、非严格的 抽样的实施方法 非严格的 抽样,具体说就是指:样 本量 可以不固定,允许为随机变量;可以不 是严格不放回的;允许一阶包含概率 与总 体单位的规模大小近似成比例。 (一)耶茨格伦迪方法 (二)拉奥哈特利柯克伦方法(1962) (三)泊松(Poisson)抽样 39 (一)耶茨格伦迪方法 耶茨格伦迪方法是逐个抽取法,这种方法能保 证每次都以未入样的单位的规模大小成比例的概率抽 取,即第一个样本单位按 的概率抽取,设第 个单 位入样;第二个样本单位按 的概率在余下的 个单位中抽取,设第 个单位入样;第三个样 本单位按 的概率在剩下的 个单位 中抽取;以此类推,直到抽够 个单位为止。 40 设 为按抽中顺序排列的样本单位的指 标值,相应的 值为 ,令 则拉奇估计量为: 它是总体总值 的无偏估计量。 41 其方差 的无偏估计量为 42 (二)拉奥哈特利柯克伦方法 拉奥哈特利柯克伦方法又称为随机组 抽选法。 抽取一个样本量为 的样本,总体 被 随机地分成 个两两不相交的子组 即是 用不放回简单随机抽样方法从中 抽 取, 是用不放回简单随机抽样方法从 中抽取,以此类推。各组中的单位数 可以事先选定,而且最好等于 或 , 其中 为 的整数部分, 为总体单位 总数。 43 设 为第 个组的相对规模大小的总的度量 , 则该组中的第 个单位被抽中的概率为 。 每个组只抽一个样本单位。记第 个组抽得的 单位指标值为 ,相应的 值为 。拉奥、 哈特利和柯克伦(1962年)在戴伦纽斯(1953年) 的基础上作了推广,给出总体总值的估 计量及其方差和方差估计量。 44 估计量: 是总体总值 的无偏估计量,其中 为第 组的总值 的无偏估计。 估计量 的方差为 : 它的无偏估计为: 45 (三)泊松(Poisson)抽样 泊松抽样是一种事先不能确定样本量,但 是能满足 要求的严格不放回 抽样方法。泊松抽样设计的实施方法是,对总 体中的每一个单位赋予一个入样概率 ,即设 定一个常数 ,有 且有 ,若 ,则取 。 , 为总体第 个单位大小的度量, 。 46 令 为从均匀分布0,1抽取的独立 随机数,如果 ,则总体的第 个单位入样 , 否则,不入样。 泊松抽样的总体总值 的一个无偏估计为 47 的方差为 它的一个无偏估计为 在泊松抽样中,样本量 是随机变量,其均值为 其方差为 48 泊松抽样每次的样本量 事先不能确定,极端的情 形是可能总体中没有一个单位被抽中,也可能所有的 单位都被抽中,这种由于样本量的不确定会增大估计 量的方差。一个可替代的估计量为 其中 其近似方差为 49 0.22390.2514 0.15480.0573 0.04870.1022 0.06760.0981 编号为奇数的习题答案 6.1假设对某个总体,事先给定每个单位的与规 模成比例的比值 ,如下表,试用代码法抽 出一个n=3的 样本。 表1 总体单位规模比值 50 6.1解:令 ,则
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 人力资源管理师专项培训与职业资格认证协议
- 软件开发企业员工入职软件知识产权保护劳动合同
- 跨国汽车维修企业场地租赁及市场拓展合同
- 离婚诉状模板定制与婚姻家庭法律援助合同
- 老字号酒庄酿酒大师傅技艺传承聘用合同
- 研发中心建设资金借款合同范本
- 非全日制定向兼职人员招聘协议
- 高端人才薪酬保密及保密协议
- 文化创意商业街商铺租赁与知识产权保护合同
- 股东企业战略发展规划协议书
- 2025至2030中国牙科手机消耗行业项目调研及市场前景预测评估报告
- NBT 11551-2024 煤矿巷道TBM法施工及验收标准
- 口腔瓷贴面诊疗沟通指南
- 山东安全管理人员大考试题库
- 2025-2030冲牙器行业市场深度调研及发展趋势与投资前景预测研究报告
- 70华诞主题班会课件
- 建筑抗震设计规程(下)DB62T3055-2020
- 商品赠品协议书范本
- 工伤事故赔偿协议书范本
- 2025-2030中国稀土催化材料行业市场发展现状及发展趋势与投资前景研究报告
- 运费补充合同协议
评论
0/150
提交评论