抽样调查第4章分层抽样ppt课件_第1页
抽样调查第4章分层抽样ppt课件_第2页
抽样调查第4章分层抽样ppt课件_第3页
抽样调查第4章分层抽样ppt课件_第4页
抽样调查第4章分层抽样ppt课件_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第四章 分层抽样4.1 估值法(一)4.2 估值法(二)组合比估计和回归估计4.3 样本量的分配4.4 与简单随机抽样之比较4.5 如何适当分层4.6 后分层估计和定额抽样.分层抽样的提法估值法(一)4.1 估值法(一).分层抽样的提法分层抽样的步骤分层: 抽样:从每层抽取一个样本构成总的样本采用分层抽样的理由可同时对子总体进展参数估计 便于组织实施,可根据各层特点采用不同抽样方式 可使样本在总体中分布均匀,从而具有更好代表性 适当分层可提高参数估计的精度 (Stratified sampling).分层抽样的提法分层抽样的问题如何分层 如何确定各层样本量 如何估值 记号.估 值 法(一).估

2、 值 法(一).估 值 法(一).估 值 法(一)例1 调查某地域居民的奶制品消费支出,以居民户为抽样单元.根据经济收入程度将居民划分为4层,每层抽取样本量为10的简单随机样本,调查数据如下表,试估计该地域居民奶制品的月消费总支出及其置信度为95%的置信区间.层居民总户数样本户奶制品月消费支出yij(元)1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025.例2 对某地域的居民拥有家庭电脑的情况进展调查,以居民为

3、抽样单位,根据收入程度将居民户划分为4层,每层按简单随机抽样抽取10户。调查数据如表。估计该地域居民拥有家庭电脑的比例及抽样规范误。估 值 法(一).例3 知某公司普通职员及高级管理人员刚进入公司时的工资总额分别为5523965元、2541660元,欲经过抽样调查估计当前该公司职员的工资总额Y。抽样按照普通职员与高管层进展分层随机抽取。普通职员共390人,抽取15人;高管层共84人,抽取10名。调查数据如表。给出Y的分别比估计量,估计其精度估 值 法(一).练习1 为调查某地域住户的平均家庭成员数,将该地去分为城市和乡村2层,每层按照简单随机抽样抽取10户。调查数据如表。估计该地域住户的平均家

4、庭成员数及其95%的置信区间。估 值 法(一).组合比估计4.2 组合比估计和回归估计组合回归估计.组合比估计 有辅助变量X用于估值分析的,先分别对各层进展简单估计,再用比估值法获得目的目的量的估计组合比估计的含义(Ratio combined).组合比估计定理4.2.1 对分层抽样的组合比估计,有估值定理.组合比估计例3续:给出Y的组合比估计量,估计其精度,与分别比估计进展比较.组合比估计分别比估计与组合比估计的比较.分别回归估计分别回归估计.组合回归估计组合回归估计.组合回归估计.组合回归估计分别回归估计与组合回归估计的比较.比估计与回归估计小结当Y与X高度相关时,采用比估计和回归估计都是

5、有效的。在选择估计方法时,有以下原那么:1由于分别估计分别比或者分别回归估计要求各层的样本量都比较大,所以当某些层的样本量不够大时,建议采用结合估计。2当回归系数需求由样本进展估计时,回归估计是有偏的,尤其当样本量较小的时候,采取结合比估计更好。3假设各层的样本量都比较大,每层的比估计或回归估计有效,此时用分别比估计,方差更小。4假设各层的样本量不大,各层的Ri差别较小,采用结合估计。5假设各层的Ri之间的差别不是太大,而且并不是每层的样本量都相当大,采用结合估计。6假设各层的回归系数都接近于1,那么可采用差估计。.例3续 知某公司普通职员及高级管理人员刚进入公司时的工资总额分别为552396

6、5元、2541660元,欲经过抽样调查估计当前该公司职员的工资总额Y。抽样按照普通职员与高管层进展分层随机抽取。普通职员共390人,抽取15人;高管层共84人,抽取10名。调查数据如表。给出Y的分别回归估计量、结合回归估计以及差估计,同时估计其精度。估 值 法(一).等额样本量按比例分配4.3 样本量的分配奈曼最优分配思索费用的最优分配.等额样本量各层的样本量相等特点:实施方便,便于管理例1 对各乡收入数据,采用分层抽样,各层采用简单随机抽样,方案抽取8个乡,按照以下样本量分配方式,确定各层的样本量(1)等额分配(2)按比例分配(3)Neyman最优分配.按比例分配假设总体总值或均值的一个无偏

7、估计量可以表示成样本总值或均值的常数倍,这种估计量称为自加权估计量(proportional allocation)适用于Ni知而其他信息很少的情形.奈曼(Neyman)最优分配.思索费用的最优分配.例 某市有甲、乙两个地域,现要进展家庭收入的调查。令n=500,知甲地域共有20000户居民,乙地域共有50000户居民;甲地域和乙地域居民收入规范差估计分别为s1=2500,s2=2000;同时对甲地和乙地每户的平均抽样费用之比为2:3,请分别计算出甲地和乙地进展比例分配、普通最优分配思索费用要素以及奈曼最优分配的样本量。.分层抽样的精度层权误差4.4 与简单随机抽样之比较.分层抽样的精度=+.

8、层 权 误 差.例 题 与 练 习3.011.21013109121333.910.7121289131022.011.0131110129111654321jK.分层的思绪D-H方法4.5 如何适当分层.分层的思绪最小.假设采用奈曼最优分配,忽略抽样比,那么使最小.D-H 方 法Y的概率密度函数V的近似表达式.D-H 方 法适当的分层界限为一常数,到达最小值.D-H 方 法例1 以某地域2001年企业出口数据中截取的904个企业构成的总体为例,阐明分层的操作程序.练习 表列出了美国13435家银行组成的总体内银行贷款中工业贷款占的百分数的频数分布.将13435家银行分为5层.分层时普通只能调

9、查与Y相关的辅助变量,很少用到Y本身,因此分层界限值无需非常精细用辅助变量分层时,辅助变量引起的误差会使分层过细失去意义,阅历阐明运用五或六个层是适宜的.后分层估计定额抽样4.6 后分层估计和定额抽样.后分层估计后分层估计的背景要调查某地域居民对某一问题的意向,以年龄为辅助变量分层要调查某校学生每月的话费支出,以家庭收入程度为辅助变量分层现实有些情况下,短少层内抽样框,无法实施分层抽样,此时可采用后分层估计后分层估计的含义 对总体实施不分层简单随机抽样,在调查中明确每个样本单元属于哪个层,将全部单元在调查后按分层变量分入各层,按分层抽样估值.后分层估计估值定理后分层估计的精度低于按比例分层估计的精度,但当n很大时,两者精度差别不大.后分层估计例 某地市对载货汽车进展调查,调查目的量为当月全地市发生的总运量Y.对总共19730辆货车抽取一个178辆车的样本,由于单车运量与车核定标识吨位(X)亲密相关,为提高精度,对样本采用后分层,相关数据如表.估计Y及该估计的精度.采用后分层应留意“事后层数目不宜多.定 额 抽 样定额抽样的含义适用于有辅助变量用于分层而按此辅助变量分层抽样不现实的情况按分层比例抽取样本量:抽样过程中简单随机抽样与典型抽样

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论