版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第三章 分层随机抽样 第一节 分层随机抽样的定义、运用场所以及符号第二节 估计量及其性质第三节 样本量的分配原那么第四节 样本量确实定第五节 分层抽样的假设干问题.第一节 引 言一、定义在抽样之前,先将总体N个单元划分成L个互不反复的子总体,每个子总体称为层,它们的大小分别为 ,这个层合起来就是整个总体 ,然后,在每个层中分别独立地进展抽样,这种抽样就是分层抽样,所得到的样本称为分层样本。假设每层都是独立按照简单随机抽样进展,那么称为分层随机抽样 不重不漏.作用分层抽样的抽样效率较高,也就是说分层抽样的估计精度较高。这是由于分层抽样估计量的方差只和层内方差有关,和层间方差无关。分层抽样不仅能对
2、总体目的进展推算,而且能对各层目的进展推算。层内抽样方法可以不同,而且便于抽样任务的组织。.二、分层原那么:总体中的每一个单元一定属于并且只属于某一个层,而不能够同时属于两个层或不属于任何一个层。1.估计:层内单元具有一样性质,通常按调查对象的不同类型进展划分。2.精度:尽能够使层内单元的目的值相近,层间单元的差别尽能够大,从而到达提高抽样估计精度的目的。3.估计和精度:既按类型、又按层内单元目的值相近的原那么进展多重分层,同时到达实现估计类值以及提高估计精度的目的。4.实施:抽样组织实施的方便,通常按行政管理机构设置进展分层。.例题例如,对全国范围汽车运输的抽样调查,调查目的不仅要推算全国货
3、运汽车完成的运量,还要推算不同经济成分国有、集体、个体汽车完成的运量。为组织的方便,首先将货运汽车总体按省分层,由各省运输管理部门担任省内的调查任务。各省再将省内拥有的汽车按经济成分分层。为提高抽样效率,再对汽车按吨位分层。例如,某高校正学生在宿舍运用电脑的情况进展调查,根据阅历,本科生和研讨生拥有电脑的情况差别较大。因此,在抽样前对学生按本科生和研讨生进展分层是有必要的。.三、符号阐明 (关于第h层的记号 )层号 单元总数样本单元数第 个单元的值层权抽样比总体均值样本均值总体方差样本方差.第二节 估 计 量一、对总体均值的估计分层样本,总体均值 的估计分层随机样本,总体均值 的简单估计 .估
4、计量的性质 性质1:对于普通的分层抽样,假设 是 的无偏估计 ,那么 是 的无偏估计。 的方差为:只需对各层估计无偏,那么总体估计也无偏。各层可以采用不同的抽样方法,只需相应的估计量是无偏的,那么对总体的推算也是无偏的。.证明性质1 由于对每一层有 因此, 估计量的方差 由于各层是独立抽取的,因此上式第二项中的协方差全为0,从而有 . 性质2:对于分层随机抽样, 是 的无偏估计, 的方差为: .证明性质2: 对于分层随机抽样,各层独立进展简单随机抽样,对每一层有 因此,由性质1,有 由第二章性质2,得 因此 . 性质3:对于分层随机抽样, 的一个无偏估计为: .证明性质3: 对于分层随机抽样,
5、各层独立进展简单随机抽样,由第二章性质3,得 的无偏估计为: 因此, 的一个无偏估计为: .二、对总体总量的估计 总体总量 的估计为: 假设得到的是分层随机样本,那么总体总量的简单估计为: .2.估计量的性质性质4:对于普通的分层抽样,假设是 的无偏估计,那么 是 的无偏估计。 的方差为:.性质5:对于分层随机抽样, 的方差为:.性质6:对于分层随机抽样, 的一个无偏估计为: .例3.1 调查某地域的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入程度将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据单位:元,要估计该地域居民奶制品年消费总支出及估计的规范差。层居民户总
6、数样本户奶制品年消费支出1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025. 三、对总体比例的估计 总体比例P的估计为: 估计量的性质 性质7:对于普通的分层抽样,假设 是 的无偏估计 ,那么 是 的无偏估计。 的方差为:.性质8:对于分层随机抽样, 是 的无偏估计,因此 的方差为: . 性质9:对于分层随机抽样, 的一个无偏估计为:.例3.2 在例3.1的调查中,同时调查了居民户拥有家庭电脑的情况,获得如下数
7、据单位:台,要估计该地域居民拥有家庭电脑的比例及估计的规范差。层居民户总数样本户拥有家庭电脑情况12345678910120000010001002400010000001037501100001010415001000000000.解:由上表可得, 根据前面对各层层权 及抽样比 的计算结果,可得各层估计量的方差: 因此,该地域居民拥有家庭电脑比例的估计为: 估计量的方差为: 估计量的规范差为: .第三节 样本量在各层的分配 确定样本量:总的样本量,各层样本量估计量的方差不仅与各层的方差有关,还和各层所分配的样本量有关。实践任务中有不同的分配方法,可以按各层单元数占总体单元数的比例分配,也可以
8、采用使估计量总方差到达最小、费用最小。 .【例3.1】调查某地域的居民奶制品年消费支出,以居民户为抽样单元,根据经济及收入程度将居民户划分为4层,每层按简单随机抽样抽取10户,调查获得如下数据单位:元,要估计该地域居民奶制品年消费总支出及估计的规范差。.层居民户总数权数方差常数分配与权数成比例与正比12000.071624103324000.142166106737500.268205101123415000.5319310207.层居民户总数权数规范差常数分配与权数成比例与方差成比例与正比120000.220100604940230000.3301009011090350000.534100
9、150141170估计方差3.863.093.113.一、比例分配 按各层单元数占总体单元数的比例,也就是按各层的层权进展分配.对于分层随机抽样,这时总体均值的估计是自加权.总体中的任一个单元,不论它在哪一个层,都以同样的概率入样,因此按比例分配的分层随机样本,估计量的方式特别简单。这种样本也称为自加权的样本。总体比例的估计是 .二、最优分配 一最优分配在分层随机抽样中,如何将样本量分配到各层,使得总费用给定的条件下,估计量的方差到达最小,或给定估计量方差的条件下,使总费用最小,能满足这个条件的样本量分配就是最优分配。.对一切层成立时, 到达极小 常数.简单线性费用函数,总费用由此得出下面的行
10、为准那么,假设某一层单元数较多内部差别较大费用比较省那么对这一层的样本量要多分配一些。.二Neyman内曼分配假设每层抽样的费用一样,最优分配可简化为这种分配称为Neyman分配。这时, 到达最小。 .例3.3 续例3.1,假设样本量仍为40,那么按比例分配和Neyman分配时,各层的样本量应为多少?按比例分配时,各层的样本量为: .对于Neyman分配, .某些层要求大于100%抽样时的修正 按最优分配时,有时抽样比f较大,某个层的 又比较大,那么能够出现按最优分配计算的这个层的样本量 超越 的情况。实践任务中,假设第 k 层出现这种情况,最优分配是对这个层进展100%的抽样,即取 ,然后,
11、将剩下的样本量 按最优分配分到各层。 .第四节 样本量确实定 令 当方差 给定时 .当按比例分配时, 实践任务中,n的计算可以分为两步,先计算:然后进展修正: .当按Neyman分配时, .例3.4 续例3.1,假设要求在95%置信度下,相对误差不超越10%,那么按比例分配和Neyman分配时,总样本量分别为多少? =267 .当按Neyman分配时: .二、最优分配需求思索费用时给定V时.给定C时.三、总体参数为P的情形 当方差给定时,假设 都比较大,使得 ,那么总样本量为 一按比例分配.二Neyman分配计算样本量之前,需求对 作预估计。.例3.5 续例3.2,假设要求在95%置信度下,绝
12、对误差不超越5%,那么按比例分配和Neyman分配时,总样本量分别为多少?按比例分配时:.Neyman分配时:.第五节 分层时的假设干问题 一、抽样效果分析通常分层抽样比简单随机抽样的精度要高.对于固定样本量的情况,假设 相对1可以忽略假设各层均值差别越大,那么采用按比例分配的方式较好;而当各层的规范差相差很大时,那么最优分配更好。在调查多个目的变量时,按比例分配的分层抽样能够更好些。.二、层的划分一最优分层按调查目的量进展分层当然是最好的,但我们在调查之前并不知道的值,因此,分层只能是经过与高度相关的辅助目的来进展。累积平方根法:戴伦纽斯(Dalenius)与霍捷斯(Hodges)提出的,它
13、的做法是将分层变量例如分布的累积平方根进展等分来获得最优分层, .例3.6 某地域电信部门在对利用上网的居民家庭安装ADSL志愿进展调查时,以辖区内最近三个月有上网支出的居民用户为总体上网费为0.02元/分钟,并预备按上网费支出记为进展分层,试确定各层的分点。.范围频数累计0565328255.5934255.593451089240298.7306554.3241101536128190.0737744.3977152077525278.43311022.831202562407249.81272.645253024591156.81521429.46304024586221.7476165
14、1.20840509582.43411789.642506015761177.54441967.18660708099127.27142094.45770805676106.54582201.0038090345383.102352284.10690100425692.26052376.3661001501246111.62442487.9915020080089.442722577.43320025036560.415232637.84825030090302667.8483003503518.708292686.55735040057.0710682693.6284004501210.95
15、4452704.58245078.36662712.949不等距67862034.最终累计频数是2712.949,假设取层数为4,那么应每隔2712.949/4=678.237分一层,因此分点应该使得累计 最接近678.237、7.474、2034.712,即较合理的分层是70。.二层数确实定由于要保证每个层有样本单元,因此层数不能超越样本量n,假设要给出估计量方差的无偏估计,那么每层至少两个样本单元,那么层数不能超越n/2。.层数的添加确实能提高估计精度 以最简单的情形为例,是区间 上的均匀分布,那么总体方差 ,样本量为 的简单随机抽样简单估计量的方差为 。将总体分成大小一样的 层,并按比例
16、分配样本量,即 那么 .除非 与 的相关系数 ,层数普通不超越6为宜。.三、事后分层 实践任务中没有层的抽样框总体特别大来不及事先分层几个变量都适宜于分层,要进展事先的交叉分层比较困难,并且我们并不需求交叉分层后每个子层的估计,如需求按年龄分层的结果,还需求按受教育程度分层的结果,但并不需求这两个目的的交叉结果。 出现离群值提高估计精度.运用事后分层技术时,还应留意事后层不宜太多。简单随机样本,事后分层落到第层的样本量hnh固定并都大于0的条件下n足够大时,为无偏估计.第一项就是按比例分配分层抽样估计量的方差,第二项表示因事后分层而非事先按比例分配分层引起的方差添加量。只需样本量足够大,事后分层的精度与按比例分配事先分层的精度相当。 . 假设样本是按某一个辅助目的分层后抽取的,只需这个事先分层抽样是严厉按比例分配进展的,那么这个样本是自加权的,总体中每个单元被抽中的概率一样,我们可以将这个样本看作简单随机样本,分别对其它目的进展事后分层估计。 .例3.7 某高校欲了解在校学生用于课外进修如各种考证辅导班、外语辅导班等
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工伤事故分析报告
- 论文研究目的该怎么写
- 届毕业论文选题之欧阳歌谷创编-图文
- 论文的学术评语范文4
- 上海工程技术大学 本科毕业设计(论文)规范写作模板(目录) 20251212修
- 毕业生论文指导老师评语
- 哈尔滨商业大学毕业论文排版标准的具体设置(权限版)
- 学位论文写作与规范
- 如何写教育教学论文(史上最详细的攻略)
- 信息检索自我评价
- 2024-2025学年年七年级数学人教版下册专题整合复习卷第八章 二元一次方程组测试 西城区单元测试(含答案)
- 水箱清洗与保养方案
- 脓毒性休克的护理
- 衣食住行见证改革开放时代变迁-(修订)
- 期中测试卷-2024-2025学年统编版语文五年级上册
- 《课时把关练》英语选择性必修第三册RJUNIT 5 Part IV Writing 写作专练含答案
- 素养立意的义务教育化学学业水平考试试题研究
- 2024年全国职业院校技能大赛中职组(婴幼儿保育赛项)考试题库-上(单选题)
- 足疗技师免责协议书
- 延长石油招聘笔试试题
- 《城市雕塑工程技术规程》JGJT 399-2016
评论
0/150
提交评论