喀什师范学院笔记 抽样调查的原理与方法 第六章 整群抽样.ppt_第1页
喀什师范学院笔记 抽样调查的原理与方法 第六章 整群抽样.ppt_第2页
喀什师范学院笔记 抽样调查的原理与方法 第六章 整群抽样.ppt_第3页
喀什师范学院笔记 抽样调查的原理与方法 第六章 整群抽样.ppt_第4页
喀什师范学院笔记 抽样调查的原理与方法 第六章 整群抽样.ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章给出了整组抽样,第二章的要点,本章给出了整组抽样的定义,讨论了组大小相等、组大小不同的整组抽样方法和与之相符的估计量、估计量的方差和方差的估计量。 具体要求:掌握组大小相等的情况对组进行简单的随机抽样简单估计量无偏差、方差及方差无偏差的估计,了解组内方差、组间方差概念及对组整体采样精度的影响,掌握组划分原则。 掌握群大小不同时符合单纯随机抽样的单纯估计量、比率估计量及符合采样的汉森赫维茨估计量及其性质。 掌握估计整体比例的集团整体的抽样方法以及简单估计量、比率估计量。 3、第一节抽样方法、第一节、整群抽样及其实施理由如下:整体由a个一次抽样针织面料构成,以某种方式在整体中抽出a个一次抽样

2、用户针织面料,对抽出的一次抽样用户针织面料不进行抽样观测而进行全部调查,就能对该抽样方法进行整群抽样实施理由:一是调查用针织面料的必要信息不足,不能直接实施制作采样框的概率采样,由调查用针织面料构成的组是既有的组,或者容易划分组,制作组采样框非常之二是调查的第三,对由某个特殊结构的组构成的整体执行组整体的采样大大提高了精度。 4、第一节抽样方法、二、全组采样的特征全组采样估计量的精度(估计量方差)与组的划分直接相关。 在许多情况下,由于组内的调查单位指标值或多或少具有一定的正相关性,所以在调查单位样本量相同的条件下,组整体的采样精度不像直接对调查单位进行的简单的随机抽样那样高。 但是,组整体的

3、抽样调查用户针织面料相对集中,平均单位的调查费用少,因此可以适当地扩大组整体的采样量,为了提高组整体的采样精度,需要按划分确定调查费用比较三、组的划分原则组一个是如何定义组的构成,另一个是如何确定组的规模。 对于第一问题,基本起点是组的配置尽可能增加组整体样本估计量的精确度。 对于第二个问题,组规模的选择取决于精度和费用的平衡,组规模大,调查费用比较节约,但精度低,组规模小,精度高,但费用多,应该在两者之间折衷。 此外,还考虑了采样实施的组织控制等。 5、对第二节群大小相等的整个组进行采样,另一方面,符号及目标量记载第一组第一调查单位调查指标值I1、2、a、j1、2、m,分别是整体第I组的修正

4、值及平均值,分别是整体修正值及组平均的整体平均值,进行调查、6、第二节群大小相等的整个组的采样,对于a个组样本,记载第I组样本的观测值,在I=1、2、a、(7.1 )实际问题中调查的目标量通常和。7、第二节群大小相等的整个群的抽样,二、由于估计量及其性质只有常数AM不同,只要研究的估计量及其性质即可,的估计量及其性质是容易得到的结果。 作为没有偏颇的估计,其方差(7.2 )的没有偏颇的估计为(7.3 )的情况下的没有偏颇的估计分别为,8,第二节群的大小相等的整个组的采样,【例71】某个居住区为600欧元针织面料,各个用户针织面料现在,以用户针织面料为小组进行全组抽样,随机提取15欧元针织面料,

5、调查每周食品支出费用,调查结果及各用户针织面料的样本平均值和标准离差如表71所示的表71 15欧元针织面料每周的食品消费支出资料求出该居住区平均每周的食品支出费用,其信任水平给予95置信区间9、对第二节群的大小相等的整个组进行采样,解: a=600 a=15=0.25 m 10210.4162.247622.474.0462.011的可靠水平为95的置信区间为210.411.962.011。10、第二节群大小相等的全群采样、三、全群采样效率分析及群划分原则,(7.2 )全群采样估计量的方差仅与群间方差有关。 与群内分散无关。 对调查单位直接随机采样时,(7.4) (7.4 )显示,在相同的调查

6、单位采样量aM下,只有在群间方差小于整体方差时,群整体采样才优于简单随机抽样。11、第二节群的大小相等的全群采样实际上在整体方差与群内方差、群间方差之间存在下述关系: (7.5)由于对于固定总体来说是常数,所以群内方差变大(或变小)则群间方差必然变小(或变大)。 整群抽样对群随机抽样,在抽出的群内全面调查调查针织面料,所以群内全面调查不存在抽样误差,只对群抽样产生抽样误差。 由此可知,组整体的采样估计量的方差仅与组间差无关,另外,当组内差扩大时,组间差必然缩小,组整体的采样效率提高。 因此,组的划分原则是尽量增大组内的差异,尽量减小组间的差异。 12、第二节群的大小相等的整个群的抽样,对于例7

7、1,在居民小区内直接对住户以简单随机抽样抽出150户进行调查,当把表71的数据看作抽样量为150的简单随机抽样时, 的估计分别出现的方差和标准离差估计比简单随机抽样高,是因为用户针织面料内住户的食品消费支出的差整体上大,其标准离差最小的达到了22.84,最大的达到了43.69,但用户针织面料平均消费支出的差相对小,其标准差为、13、 四是因为在第二节群的大小相等的全群采样中,群间方差被估计为小于总体方差;以及四是引入群内相关系数的概念,以研究群全体采样估计量的方差和群内调查用针织面料的类似性之间的关系。 组内相关系数(7.6)被校正(7.7) (7.8)、14、第二节组的大小定义为相等的组整体

8、的采样,因为是在a大的情况下将(7.9)用(7.5)置换为和并代入(7.8)的固定常数,所以(7.10 ) (7.5)a对于来自样本的大时的估计是、15、第二节群大小相等的整个群采样,并且根据(7.9 )的估计是(7.11 )考虑整个群采样估计量的方差与群内相关系数之间的关系,所以是(7.8 )当以简单随机抽样从整个直接提取aM个调查用户针织面料时,由于平均样本方差为、16,所以在第二节群中的大小相等的全群采样,全群采样的设定校正效果是(7.14) (7.14 ),以调查用户针织面料的相同样本量,对于示例71, 根据表71中的数据在(7.11 )中校正的设置校正效果的估计值意味着在居民食品消费

9、支出调查中对整个组进行采样以实现相同精度的样本量大约是简单随机抽样的样本量的0.609倍。 在例子71中,整群抽样调查了15欧元针织面料的修订150户,所以为了实现相同精度,简单随机抽样应该调查1500.609246户。 17、第三节研究大小不同的全群采样,本节研究群大小不同的全群采样,研究各种采样和估计方法的特点。 一、符号及目标量为了便于讨论,相应变更上一节的符号。 总体由a个组组成,第一组包含一个调查用针织面料,即总体包含调查用针织面料的总数,作为第一组,第二调查用针织面料指标值。=1,2,a;=1、2、分别是整体第一组的校正值和平均值,分别是整体的校正值和每组的平均值,、18、第三节组

10、的大小不同的全组的采样是每个调查单位的平均值。 以某种方法从a个组抽出a个组作为样本,记录第一组的样本观测值、=1、2、a,对实际问题有意义的是和估计。 和只有一个数不同,为了方便有时讨论,有时讨论,由此得到另一个关联结果不容易。19、第三节群大小不同的全群采样、二、简单随机抽样提取群、使用简单估计量将a群作为简单随机抽样提取,表示第群的采样和,根据简单随机抽样简单估计量的定义和性质,综合修正值的简单估计量是(7.15 )无偏差的估计,其方差为() 的一个无偏差的估计是(7.17 )、20、第三节群的大小不同的全群采样,由此获得的无偏差的估计量、估计量的方差和无偏差的估计是(7.18 ),其中

11、总群的平均量值是(7.16)(7.19 )、(7) 在实际问题中,每个组的规模的差大(即差异大)、组的平均值的差小(即差异小),组的校正值之间必然差大,该情况下,简单估计量的精度低。21、第三节群尺寸不同的整个组采样、三、以简单随机抽样提取组,采用比率估计量对组采用简单随机抽样的情况下,如果各组尺寸的差较大,则为了提高估计精度,组的大小为辅助变量结构比率估计量。 以整体比率的方式,根据(5.2 )的比率估计量偏向于(7.21 ),并且根据(5.5 )的分散根据(7.22 )的(7.23 ),根据(22 ),由此难得的比率估计量、估计量的分散性及其估计是(7.24 )、(7.25 )、(7.26

12、 )、(7.26 ) 在简单随机抽样中,使用比率估计量进行推定时不知道,推定时必须知道。 (7.22 )和的比率估计量的分散主要依赖于群平均的差异。23、第三节群大小不同的整个组的采样,在很多实际问题上差异不大,即几乎有正比例关系,此时比率估计量的精度高。四、通过聚苯硫醚纤维采样提取组,使用汉森赫维兹估计量,在组大小不同的整个组的采样中,为了提高精度,采用了按照与组大小成比例的概率的刷新采样即聚苯硫醚纤维采样,汉森赫维兹估计量在a个a组中进行a次独立采样、每次提取都提取第2组的概率,是整体的校正值的汉森赫维兹估计量是(7.27 )、24、第3节组的大小不同的组整体的采样,有偏差其方差是(7.2

13、8 ) 由从此往后获得的无偏差估计量、估计量的方差和其无偏差估计是(7.30)(7.31 )、的(7.28)(7.31 )指示,以及的汉森赫维茨估计量的方差主要取决于群平均的差。 在许多实际问题中差异不大,所以使用聚苯硫醚纤维采样的汉森-赫维兹估计量可以得到较高的精度。 例72个县有614个村,全县小麦播种面积408256亩。 现在用抽样调查估算全县小麦的平均亩产。 为便于调查,表72显示了随机抽取的15个村的资料,以便以村为组进行全组抽样。26、第三节群大小不同的全群抽样、表72个抽样村调查数据、27、第三节群大小不同的全群抽样、1.15个村以简单随机抽样抽样,采用简单估计量=406542.67的比率估计量为(7.21)(7.23、27 第三节群大小不同的全群抽样,3.15村按播种面积成比例概率抽样,采用汉森赫维茨估计

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论