




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§3.1引言一、定义先将总体N个单元划分成L个互不重复的子总体,每个子总体称为层,它们的大小分别为
然后,在每个层中独立地进行抽样,称为分层抽样.二、作用分层抽样在实际工作中应用的非常广泛,主要是因为它具有其它抽样方法所没有的特点:1.分层抽样的抽样效率较高,也就是说,分层抽样的估计精度较高。2.分层抽样不仅能对总体指标进行推算,而且能对各层指标进行推算。3.层内抽样方法可以不同,而且便于抽样工作的组织。三、使用场合在对分层进行具体划分时,通常考虑如下原则:1.层内单元具有相同性质,通常按调查对象的不同类型进行划分。2.尽可能使层内单元的标志值相近,层间单元的差异尽可能大。3.既按类型又按层内单元标志值相近的原则进行多重分层,同时达到实现估计类值以及提高估计精度的目的。4.抽样组织实施的方便,通常按行政管理机构设置进行分层。四、符号说明我们用下标h表示层号(h=1,2,……,L)。关于第h层的记号如下:单元总数:样本单元数:第i个单元标志值(观察值):单元权数:总体均值:第L层总体方差:抽样比:样本均值:第L层样本方差:§3.2简单估计量及其性质一、总体均值的估计1.估计量的定义总体均值的估计:=如果得到的是分层随机样本,则总体均值的简单估计为:2.估计量的性质性质一
对于一般的分层抽样,如果是的无偏估计(h=1,2,……,L),则是的无偏估计。的方差为:V()=值得注意的是:只要对各层估计是无偏的,则对总体的估计也是无偏的。
因此,各层可以采用不同的抽样方法,只要相应的估计量是无偏的,则对整体的推算也是无偏的。性质一的证明:由于对每一层有因此性质二
对于分层简单随机抽样,是的无偏估计,的方差为:性质二二的证证明:若各层独立立进行简单单随机抽样样,对每一层有有由第二章性性质二得因此性质三对于分层随随机抽样,的无偏估计为:性质三的证证明:对于分层随随机抽样,各层独立进进行简单随机抽抽样,由第二章性性质三,得因此,的一个无偏偏估计为:二、总体总总量的估计计1.估计量的定定义总体总量Y的估计为:如果得到的的是分层随随机样本,则总体总量量Y的简单估计计为:2.估计量的性性质由于与只差一个常数,因此,与具有相同的性质质。性质一
对于一般的分层随机抽样,如果是的无偏估计,则是的无偏估计,的方差为:性质二
对于分层随机抽样,的方差为:==性质三
对于分层随机抽样,的无偏估计为:【例3.1】
调查某地区的居民奶制品年消费支出,以居民户为调查单元,根据经济及收入水平将居民户划分为4层,每层按简单随机抽样抽出10户,调查获得如下数据(单位:元)估计该地区居民奶制品年消费总支出及估计的标准差。(数据见下下表)样本户奶制制品年消费费支出层居民户总数样本户奶制品年消费支出(元)1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025由上表,N=2850,各层的层权及抽样比为:),4,3,2,1(,10==hnh各层样本均均值及样本本方差为:同理有因此,估计奶制品品年消费总总支出为::估计量方差差及标准差差的样本估估计三、总体比比例的估计计1.估计量的定定义总体比例P的估计为::2.估计量的性性质如果定义第i个单元具有所考虑的特征;其他。(i=1,2,…,N)则对总体比比例的估计计类似对总总体均值的的估计,这这时,与具有同样的性质。的无偏估计((h=1,2,…,L),则性质一
对于一般的分层随机抽样,如果是P的无偏估计。的方差为::性质二
对于分层随机抽样,是P的无偏估计。证明:注意到及因而的方差为:性质三
对于分层随机抽样,的无偏估计为V()【例3.2】在例3.1的调查中,,同时调查查了居民拥拥有家庭电电脑的情况况,获得如如下数据((单位:台台),如表表3.2。估计该地地区居民拥拥有家庭电电脑的比例例及估计的的标准差。。(数据见下下表)样本户拥有有家庭电脑脑情况层居民户总数样本户拥有家庭电脑情况12345678910120000010001002400010000001037501100001010415001000000000表3.2解:由上表可得得该地区居民民拥有家庭庭电脑比例例的估计为为:估计量的方方差为:§3.3比率估计量量及其性质质将比率估计计的思想和和技术用于于分层随机机样本时,,对总体参数的的估计有两两种途径::一种是对每每层样本分分别考虑比比估计量,,然后对各各层的比估估计量进行行加权平均均,此时所得的的估计量称称为分别估计(separateratioestimator);另一种是对对比率的分分子、分母母分别加权权计算出分分层估计量量,然后用用对应的估估计量来构构造比估计计,这样所所得的估计计量称为联合比估计计(combinedratioestimator).1.分别比率估估计总体均值总体总量的分层比率估计为:总体均值:总体总量:层权L:层数为的比率估计,为比率估计比率估计量量的方差:式中,分别为第i层指标Y,X的方差及相关系数.分别比率估估计量要求求每一层的的样本量都比较大,否则,偏倚可能比比较大.2.联合比率估估计(combinedratioestimator)总体体均均值值::总体体总总量量::式中:表示的无偏估计;表示的无偏估计.均方误差为:3.分别别比比率率估估计计量量与与联联合合比比率率估估计计量量的的比比较较一般般而而言言,,分分别别比比率率估估计计量量的的方方差差小小于于联联合合比比率率估估计计量量的的方方差差。。但但当当每每层层的的样样本本量量不不太太大大时时,,还还是是采采用用联联合合比比率率估估计计量量更更可可靠靠些些,,因因为为这这时时分分别别比比率率估估计计量量的的偏偏倚倚很很大大,,从从而而使使总总的的均均方方误误差差增增大大。。实际使用时,,如果各层的的样本量都较较大,且有理理由认为各层层的比率Rh差异较大,则则分别比率估估计优于联合合比率估计。。当各层的样样本量不大,,或各层比率率Rh差异很小,则则联合比率估估计更好些。。【例4.4】某市1996年对950家港口生产单单位完成的吞吐量进行了了调查,1997年欲对全市港港口生产单位位完成的吞吐吐量进行调查查。对港口生生产单位按非非国有(h=1)和国有(h=2)分为两层,单单位数分别为为800家和150家,分别在两两层中调查了了10家和15家港口生产单单位,调查数据如下下表,试计算算1997年全市港口生生产单位完成成的吞吐量。。1997年国有和非国有企业调调查数据如下页页ixiyiixiyi19580149553022202102210320335938433604964120117423040051771805600651625325861000880730234977005608332286811001230927221597208231013797103103901147846512817650139191160141160107015735698(将上述数据计计算的中间结结果列于P77的表中)1.按分别比率估估计量估计2.按联合比率估估计量估计按联合比率估估计量估计比按分别别比率估计量估计要好一一些!三、分别比率率估计与联合合比率估计的的比较具体情况分析析参看教材P87§3.4回归估计量及及其性质与比估计相似似,将回归估估计的思想和和技术用于分分层随机抽样样时,同样有有两种方法::一种是对每层层样本分别求求取回归估计计量,然后对对各层的回归归估计量进行行加权平均,,此时所得的的估计量称为分别回归估计计(separateregressionestimator);另一种是对两两个变量先分分别计算出分分层简单估计计量然后再对对它们的分层层简单估计量量来构造回归归估计,这时时所得的估计计量称为联合回归估计计(combinedregressionestimator).1.分别回归估计计(separateregressionestimator)总体均值的估计:总体总量的估计:当各层的回归归系数为事先先给定的常数数时,分别回归估计计量是无偏的的。其方差为:其中是第h层的回归系数并且当时,达到最小,即通常未知,可用回归系数作为的估计:注意(1)分别回归估计量是有偏的,但当每一层的样本量都很大时,估计的偏倚可以忽略,其方差近似为:(2)这里是子总体的回归系数,是子总体样本的回归系数,前者是未知的,后者是可知的。方差的样本估计值为:式中,分别回归估计计量要求每一一层的样本量量都较大,如果这个条件得得不到满足,则分别回归估估计量的偏倚倚可能很大,这时,采用联合回归归估计量更好好些。2.联合回归估计计(combinedregressionestimator)总体均值的估计:总体总量的估计:式中,分别为的分层估计。是无偏的,其方差为:并且,只要β取时,达到最小。当回归系数未知时,取β为的样本估计:这时,联合回归估计量是有偏的,但当样本量n较大时,估计的偏倚可以忽略,其方差近似为:方差的样本估计为:分别回归估计计与联合回归归估计的比较较当回归系数设设定时,分别回归估计计优于联合回归估计计;当回归系数由由样本估计时时,如果各层的样样本量不太小,采用分别回归估计计为宜.否则,采用联合回归归估计为好!!【例4.6】(续例4.4)利用回归估计量估计该市港口生产单位1997年完成的吞吐量。解:样本回归系数数:h=1,非国有h=2,国有1.070170.856402则按分别回归估计计量估计:(见P85)按联合回归估计量估估计:(见教材P86)从本题看,联合回归估计计量比分别回回归估计量要要优一些!分别比率估计计、联合比率率估计、分别别回归估计和联合回回归估计的比比较(参看教材P96.【【例3.3】)比率估计与回回归估计总结结:在分层随机抽抽样中,当有有辅助变量信信息可以利用时,我们可可以采用分别别比率估计、、联合比率估估计、分别回归估计计以及联合回回归估计方法法。在选用这这些估计量时,要要注意以下几几个问题:1、比估计是有有偏估计量,,当各层样本本量都较大时时两种比估计都都近似无偏;;当某些层的的样本量不够够大,而总样样本量量较大大时,,联合合比率率估计计近似似无偏偏。2、在回回归估估计中中,若若事先先设定定回归归系数数,其其估计计量无偏;;若用用样本本回归归系数数作为为回归归估计计系数数,其其估计计量有偏偏,但但在大大样本本情况况下近近似无无偏。。3、当主主要变变量Y和辅助助变量量X高度相相关时时,比比率估估计和回回归估估计都都是有有效的的,且且能大大幅度度地提提高估估计精精度。。§3.3样本量量在各各层的的分配配对于分分层抽抽样,,当总总的样样本量量一定定时,,还需需研究究各层层应该该分配配多少少样本本量的的问题题,因因为对对总体体推算算时,,估计计量的的方差差与各各层的的方差差有关关,还还与各各层所所分配配的样样本量量有关关。一、比例分分配这里的的比例例分配配指的的是按按各层层单元元数占占总体体单元元数的的比例例,也也就是是按各各层的的层权权进行行分配配,这这时对于分层抽样,这时总体均值的估计是:总体比比例P的估计计是::这是因因为总总体中中的人人一单单元,,不管管它在在哪一一层,,以同同样的的概率率入样样,因因此按比例例分配配的分分层随随机样样本,,估计计量的的形式式特别别简单单。这这种样样本也也称为为自加加权的的样本本。二、最优分分配1.最优分分配如果我我们考考虑简简单线线性费费用函函数,总费用用则最优分分配是是:证明:作拉格格朗日日函数数,求条件件极值值:解得:由此得得出下下面的的准则则:如果某某一层层单元元数较较多,,内部部差异异较大大,费费用比比较省,则对这这一层层的样样本量量要多多分配配些,,2.Neyman(内曼)分配对于分分层随随机样样本,作为特特例,如果每每一层层的费用相同,即时,最优分配可简化为:这种分配称为Neyman分配.这时,达到最小。【例3.3】续例3.1如果样本量仍为n=40,则按比例分配和Neyman分配时,各层的样本量应为多少?(见#17)解:按比例例分配配时,各层的的样本本量为为:即各层层的样样本量量分别别为3,6,11,20.对于Neyman分配,根据前前面计计算所所得的的各层层权数和和方差差,得到:因此,按Neyman分配时时,各各层应应分配配的样样本量量为::即各层层的样样本量量分别别为3,7,23,,7.【例3.5】某市有甲、乙两个地区,现进行家庭收入的调查。令n=500,已知甲地区共有20000户居民,乙地区共有50000户居民;甲地区居民和乙地区居民年收入标准差估计分别为;同时对甲地和乙地每户的平均抽样费用之比为2:3,请分别计算出甲地和乙地进行比例分配、一般最优分配(考虑费用因素)以及内曼分配(不考虑费用因素)的样本量。【解】根据已已知的的数据据,通通过计计算整整理可可得下表表:h1200000.285725002713.2857505.07632500000.7143200031428.5714823.7861总计700001.0000---------2141.85711328.8624关于样样本量量分配配的计计算(1)比例分配。(2)一般般最优优分配配(3)内曼曼分配配结果比比较,,对比上上面三三组结结果可可以发发现:●一般最最优分分配在在乙地地所抽抽取的的样本本量是是最小小的。。这是因因为一一般最最优分分配考考虑了了费用用问题题,在在乙地地抽样样的单单位平平均费费用较较高,,所以以最优优的原原则应应是适适当增增加甲甲地的的样本本量,,减少少乙地地的样样本量量。●一般般最优优分配配和内内曼分分配在在甲地地的样样本量量都比比比例例分配配大,,这是是因为为甲地地总体体的方方差较较大。。为了了保证证估计计量方方差小小,子子总体体方差差大的的就要要多抽抽些样样本,,否则则就要要少抽抽样本本。3.某些层层要求求大于于100%抽样时时的修修正又比较大,则可能按最优分配计算的这个层的样按最优分配时,可能抽样比较大,某个层的本量超过的情况.若出现现这种种情况况,则对该该层进进行不不100%的抽样样,即§3.4样本量量的确确定(1)一般般公式式令其中已经选定,于是当方差V给定时时,有有得到确定样本量的一般公式为:令则(2)若按比例分配:将代入上式可得(3))内曼曼分配配:将代代入上上面两两式可可得::(4)最优分配:将代入上式可得:即d:绝对误误差;;r:相对对误差差;t:标准正正态分分布的的双侧侧α分位数数;这时,,样本本量的的一般般形式式可以以表示示为::如果估估计精精度是是以误误差限限的形形式给给出下面将将分别别给出出比例例分配配、内内曼分分配和和最优分配配时的的样本本量分分配形形式::(1)若按比例分配:将代入上式可得(2)当按按Neyman分配时时,(3)最优分配时:将代入上式可得:[例3.4](续例例3.1)如果果要求求在95%置信度度下,,相对对误差差不超超过10%,则按按比例例分配配和Neyman分配时时,总总样本本量分分别为为多少少?解:当当按比比例分分配时时:由前面面的计计算结结果,,可以以得到到各层层的Whs2h。在95%置信度度时,,对应应的t=1.96,又因此得得到由此可以得到对进行修正,得到修正后的n2.最优分配需需要考虑费费用时的情情形在最优分配时时,如果考虑费用为为简单线性性函数则由式(3.21)有:当方差V给定时,代入式(3.24)得到样本量量为:§3.5分层时的若若干问题1.抽样效果分分析对于固定样本量的情况,如果相对于1可以忽略,则式中,分别为分层随机抽样最优分配、分层随机抽抽样按比例例分配以及简单随机抽样简单估计的的方差。二、层的划划分既然分层抽抽样比简单单随机抽样样效率高,,那么如何何构造层,构构造多少层层,才能使使分层抽样样发挥其效效率高的特点呢??这就涉及最最优分层和和确定层数数的问题。。(一)最优优分层为了提高抽样效率,按调查目标量进行分层当然是最好的,但我们在调查前并不知道的值,因此分层只能通过与高度相关的辅助指标来进行.(见P56)(二)层的确定当分层是按按自然层或或单元类型型划分时,层数是自然然的,但当遇到上上述运用累累积平方根根法进行分分层时,就存在层数数问题。在实际工作作中,层数数一般不超超过六层。。虽然增加加层数可以以提高估计计精度,但但在总费用用一定的条条件下增加加层数必然然导致降低低样本量,,这时就要要考虑增加加层数而降降低样本量量在精度上上是否合算算。三、事后分分层我们一般在在抽样之前前将总体中的的所有单元元分好层,但在实际工工作中,有时没有层的抽抽样框,或总体特别别大来不及及事先分层层等原因.这时我们又又想采用分分层抽样,就可以采用用事后分层层.事后分层要要注意的问问题(1)要求我们可可以通过某某种途径知知道各层的层大小小或层权;(2)层权与实际际情况不能能相差太大大,否则不可能提高高精度;(3)事后分层的的层数不宜宜太多.
事后分层的具体实施办法先采用简单随机抽样的方法从总体中抽取一个样本量为n的样本,然后对样本中的单元按某种特征进行分层。假设在容量为n的样本中,落入第h层的样本单元数为,有,则此时对总体均值的事后分层估计为:这里,下标“pst”表示事后分层;代表落入第h层的第i个样本单元的指标值。理论上,只要n充分大,事事后分层估估计量是无无偏的。且且它的方差差有如下性性质:由上式可以以看出,第第一项就是是按比例分分配分层抽抽样估计量量的方差,,第二项表表示因事后后分层而非非事先按比比例分配分分层引起的的方差增加加量。由此此看出,只只要样本量量足够大,,事后分层层的精度与与比例分配配事先分层层的精度相相当。
事后分层均值估计量的方差,可以用下面的式子来估计:其中例3.7某高校欲了了解在校学学生用于
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云计算时代的软件测试新模式试题及答案
- 2025年公共政策数据分析技术试题及答案
- 系统梳理2025年数据库考试试题及答案内容
- 2025年信息系统考试的实践经验试题及答案
- 软件测试工程师考试复习计划
- 全面备战2025年计算机三级数据库考试的试题及答案
- 智能变色窗用复合材料行业深度调研及发展项目商业计划书
- 物联网智能零售解决方案行业跨境出海项目商业计划书
- 民间传说故事馆行业跨境出海项目商业计划书
- 民间工艺博物馆行业深度调研及发展项目商业计划书
- 国家开放大学2025年春《形势与政策》形考任务1-5和大作业参考答案
- 安全生产 规章制度和安全操作规程
- 工人下班免责协议书
- 美术有趣的课件
- 大理石知识培训课件
- 2025年福建省厦门市中考数学二检试卷
- 《拥抱健康拒绝烟草》课件
- 济南幼儿师范高等专科学校招聘真题2024
- 鼻咽癌口腔炎护理查房
- 创业扶持政策对数字化转型的影响研究试题及答案
- 疗休养协议格式合同
评论
0/150
提交评论