版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
§4.1引言
一、概念在实际工作中,如果除了调查的目标量以外,还有其他指标的信息,称这些指标为辅助变量,(auxiliaryariable)。人们总希望利用辅助变量与目标量之间的关系来提高估计的精度。这就是本章所要介绍的方法(不是抽样方法,而是估计方法)。通常使用的方法是:利用调查指标与辅助变量之间的关系构造比率估计量和回归估计量。例如,要调查家庭教育支出,则家庭的总支出就是辅助变量,家庭用于教育的支出占总支出的比重就构成了比率估计量。二、应用条件
(1)比率估计、回归估计需要用到辅助变量的总体均值或总体总量;(2)如果辅助变量的总体均值或总体总量未知又要利用比率估计或回归估计,则可采用二重抽样的方法;(3)比率估计是有偏估计,因此需要有足够的样本量才能保证估计的有效。三、符号说明设调查指标为,辅助变量为总体总量:总体均值:总体方差:样本均值:样本方差:总体协方差:样本协方差:总体相关系数:样本相关系数:§4.2比率估计一、简单随机抽样下的比率估计1.定义比率估计量(ratioestimator)又称比估计对于简单随机抽样,总体均值和总体总量Y的比率估计为:总体比率:总体比率估计量:2.比估计的性质简单随机抽样比率估计是有偏的,其偏倚的阶为,当样本量n较大时,估计量的偏倚趋于零.因此,比率估计是渐近无偏的.性质1
对于简单随机抽样比率估计,当样本量n较大时,是渐近无偏的.即的方差为:或式中分别为Y,X的总体方差和总体协方差;分别为Y,X的样本方差和样本协方差.可通过估计.【例4.1】对以下假设的总体(N=6),用简单随机抽样抽取n=2的样本,比较简单随机抽样比率估计及简单估计的性质。i123456均值XiYi011331151882910464.518解:对这个总体,我们列出所有可能的个样本,以比较简单估计与比率估计的性质。i样本简单估计()比率估计()1234567891011121314151,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.5181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.75由此,可以算出:
由计算结果可以看出:
简单估计是无偏的,而比率估计是有偏的。简单估计量的方差远远大于比例估计量的方差,比率估计的偏倚不大,其均方误差也比简单估计的方差小得多。因此,对这个总体,比率估计比简单估计的效率高。【例4.2】某县在对船舶调查月完成的货运量进行调查时,对运管部门登记的船舶台帐进行整理后获得注册船舶2860艘,载重吨位154626吨。从2860艘船舶中抽取一个n=10的简单随机样本,调查得到样本船舶调查月完成的货运量及其载重吨位如表(单位:吨),要推算该县船舶调查月完成的货运量。ii1234578015001005376600100505010206789102170182314501581370120150802050解:已知:N=2860,n=10,X=154626由表可得因此,对该县船舶在调查月完成货运量的比率估计为:方差的估计为:=2.10617×标准差的估计为:如果用简单估计对货运量进行估计,则由此,得到比率估计量设计效应为:对于本问题,比率估计量比简单估计量的效率高!3.消除比率估计偏倚的方法
由于比率估计是有偏估计,在小样本时,其偏倚不能忽略.则需要通过改善估计量或改变抽样方法使比率估计成为无偏估计.1.无偏的比率估计量第一种:Hartley--Ross估计量式中第二种:Mickey估计量其中,分别是在n个样本数据中去掉第i个样本数据后剩下的n-1个样本数据的平均值.二、分层随机抽样下的比率估计1.分别比率估计总体均值总体总量的分层比率估计(separateRatioestimator)为:总体均值:总体总量:层权L:层数为的比率估计,为比率估计比率估计量的方差:式中,分别为第i层指标Y,X的方差及相关系数.
分别比率估计量要求每一层的样本量都比较大,否则,偏倚可能比较大.2.联合比率估计(combinedratioestimator)总体均值:总体总量:式中:表示的无偏估计;表示的无偏估计.均方误差为:3.分别比率估计量与联合比率估计量的比较一般而言,分别比率估计量的方差小于联合比率估计量的方差。但当每层的样本量不太大时,还是采用联合比率估计量更可靠些,因为这时分别比率估计量的偏倚很大,从而使总的均方误差增大。实际使用时,如果各层的样本量都较大,且有理由认为各层的比率Rh差异较大,则分别比率估计优于联合比率估计。当各层的样本量不大,或各层比率Rh差异很小,则联合比率估计更好些。【例4.4】
某市1996年对950家港口生产单位完成的吞吐量进行了调查,1997年欲对全市港口生产单位完成的吞吐量进行调查。对港口生产单位按非国有(h=1)和国有(h=2)分为两层,单位数分别为800家和150家,分别在两层中调查了10家和15家港口生产单位,调查数据如下表,试计算1997年全市港口生产单位完成的吞吐量。1997年国有和非国有企业调查数据如下页ixiyiixiyi19580149553022202102210320335938433604964120117423040051771805600651625325861000880730234977005608332286811001230927221597208231013797103103901147846512817650139191160141160107015735698(将上述数据计算的中间结果列于P77的表中)1.按分别比率估计量估计2.按联合比率估计量估计
按联合比率估计量估计比按分别比率估计量估计要好一些!三、比率估计的效率1.与简单估计的比较简单估计量是无偏的,而比率估计量是渐近无偏的.因此,这里只比较当n比较大的情形.由以前的讨论可知:由此看出,比率估计量优于简单估计量的条件是:有当2.比率估计成为最优线性估计的条件⑴与的关系是过原点的直线;⑵对这条直线的方差与成比例。比率估计量优于简单估计量。特别当时,,这里,§4.3回归估计一、回归估计的定义对于简单随机抽样,总体均值和总体总量的回归估计量(regressionestimatior)的定义为:式中,是样本均值;为事先设定的一个常数如果β=0,则回归估计量就是简单估计量;如果则回归估计量就是比率估计量。二、为常数的情形当回归系数为事先给定的常数时,或以前为相同目的进行的调查所得到的对的样本回归系数稳定在某个数值上,取最近一次调查所得的作为设定值。性质2对于简单随机抽样回归估计量,作为及Y的回归估计,都是无偏的。即的方差分别为:式中,分别是Y,X的总体方差和总体协方差;分别是Y,X的样本方差和样本协方差。的样本估计量为:当取总体回归系数达到最小,即时,式中,为总体相关系数。三、β为样本回归系数的情形如果β需要通过样本来确定,很自然地,我们会想到用总体回归系数的最小二乘估计,也就是样本回归系数:这时简单随机抽样回归估计量是有偏的。但当样本量n充分大时,估计量的偏倚趋于零。因此,类似比率估计量,回归估计量也是渐近无偏的。且有的一个近似估计为:【例4.5】(续P72的例4.2)利用回归估计量推算该县船舶调查月完成的货运量.解:根据例4.2中的计算结果可得样本回归系数:从而因此,该县船舶调查月完成的货运量的回归估计为:为了估计,先计算回归残差方差:所以●与例4.2的结果比较,对于本问题回归估计优于比率估计,而比率估计又优于简单估计;
●回归估计优于比率估计的原因是回归直线没有通过原点。
●比较上述估计量的优劣,一般是通过比较它们的均方误差或方差大小来进行。简单估计量、比率估计量、回归估计量的比较简单估计量:比率估计量回归估计量由此可以看出:2.比率估计量优于简单估计量的条件是:3.回归估计量优于比率估计量的条件是:即回归估计量总是优于比率估计量.1.回归估计量总是优于简单估计量,除非即一般而言有四、分层随机抽样下的回归估计1.分别回归估计(separateregressionestimator)总体均值的估计:总体总量的估计:
当各层的回归系数为事先给定的常数时,分别回归估计量是无偏的。其方差为:其中是第h层的回归系数并且当时,达到最小,即通常未知,可用回归系数作为的估计:注意(1)分别回归估计量是有偏的,但当每一层的样本量都很大时,估计的偏倚可以忽略,其方差近似为:(2)这里是子总体的回归系数,是子总体样本的回归系数,前者是未知的,后者是可知的。方差的样本估计值为:式中,
分别回归估计量要求每一层的样本量都较大,如果这个条件得不到满足,则分别回归估计量的偏倚可能很大,这时,采用联合回归估计量更好些。2.联合回归估计(combinedregressionestimator)总体均值的估计:总体总量的估计:式中,分别为的分层估计。是无偏的,其方差为:并且,只要β取时,达到最小。当回归系数未知时,取β为的样本估计:这时,联合回归估计量是有偏的,但当样本量n较大时,估计的偏倚可以忽略,其方差近似为:方差的样本估计为:3.分别回归估计与联合回归估计的比较当回归系数设定时,分别回归估计优于联合回归估计当回归系数由样本估计时,如果各层的样本量不太小,采用分别回归估计为宜.否则,采用联合回归估计为好.【例4.6】(续例4.4)利用回归估计量估计该市港口生产单位1997年完成的吞吐量。解:样本回归系数:h=1,非国有h=2,国有1.070170.856402则按分别回归估计量估计:(见P85)按联合回归估计量估计:(见教材P86)
从本题看,联合回归估计量比分别回归估计量要优一些!§4.4差值估计如果调查时所用的辅助变量为目标量最近的普查结果,或者回归估计的回归系数接近于己于1这时可以采用差值估计(differenceestimayor)。总体均值的差值估计为:式中性质3作为β=1的回归估计量,的无偏估计,其方差为:将的样本估计值代入上式,就可得到的样本估计.【例4.7】(续例4.4)利用差值估计量估计该市港口生产单位1997年完成的吞吐量,并与前面的估计量及精度进行比较.解:由于辅助变量是上年的普查资料,且样本回归系数接近于1,因此可以采用差值估计.
下面比较本例所用的五个估计量,看看它们的优劣,其具体数据如下表:估计方法总量估计标准差估计变异系数分别比率估计272536.69588.480.035182联合比率估计271956.19289.440.034158分别回归估计270556.39480.110.035039联合回归估计271753.49238.960.033998差值估计271910.09269.110.034089结果分析1.本题中,五种估计量的精度非常接近,联合回归估计量稍好些;2.对于简单随机抽样,简单估计、差值估计是无偏的,比率估计、回归估计是渐进无偏的;3.当样本量较小时,比率估计、回归估计的偏倚是不能忽视的;4.当辅助变量为调查指标的最近普查值时,可以考虑使用差值估计。本章小结(1)在实际工作中,人们使用比率估计量和回归估计量主要是利用辅助变量提高估计效率.(2)比率估计量和回归估计量都是有偏的,但当样本量足够大时,其偏倚可以忽略.(3)如果辅助变量的总体总量或总体均值未知,则要采用二阶段抽样,以解决辅助变量信息不足的问题.本章作业(1)熟悉本章附录的证明;(2)思考书后习题1,习题2,;(3)在作业本上完成书后习题3,习题4,习题5;(第四章结束)9、春去春又回,新桃换旧符。在那桃花盛开的地方,在这醉人芬芳的季节,愿你生活像春天一样阳光,心情像桃花一样美丽,日子像桃子一样甜蜜。2月-252月-25Monday,February24,202510、人的志向通常和他们的能力成正比例。19:22:2119:22:2119:222/24/20257:22:21PM11、夫学须志也,才须学也,非学无以广才,非志无以成学。2月-2519:22:2119:22Feb-2524-Feb-2512、越是无能的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026四川达州宣汉县妇幼保健院招募见习人员24人笔试参考题库及答案详解
- 2026襄阳市第六人民医院(襄州区人民医院)招聘编制备案制高层次紧缺人才(22名医生)笔试参考题库及答案详解
- 2026年西安雁塔日化医院招聘(24人)笔试备考试题及答案详解
- 2026广西南宁市第三人民医院招聘14人备考题库及一套答案详解
- 2026年临床儿科理论知识考核试题题库及答案
- 2026辽宁省能源产业控股集团集采中心有限公司招聘5人笔试备考题库及答案详解
- 2026年武汉大学同仁医院医护人员招聘笔试备考试题及答案详解
- 2026浙江金华金东区面向区外选调在职教师6人备考题库及一套答案详解
- 2026浙江杭州西湖区茶文化研究会招聘工作人员1人备考题库参考答案详解
- 2026-2027广东河源市龙川县消防救援大队法律顾问服务选聘备考题库参考答案详解
- DB42∕T609-2010 湖北省主要造林树种苗木质量分级
- 五年级下册语文1-8单元习作范文寒假积累素材
- 八年级培训机构家长会
- 文言文关联教材专练05-统编版选择性必修下册【教考衔接专题】(解析版)
- 统编版四年级语文上册21古诗三首 出塞 课件
- 《变电站电气主接线》课件
- DIN 16742-2013中文+英文标准
- 检测行业成本分析
- 交叉线岔检查(接触网技能培训课件)
- 人造石墨负极材料生产工艺技术规范
- 智源(园丁)小区五期建设项目竣工环境保护验收调查表
评论
0/150
提交评论