版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、4.1 引 言 一、概念在实践任务中,假设除了调查的目的量以外,还有其他目的的信息,称这些目的为辅助变量,auxiliaryariable)。人们总希望利用辅助变量与目的量之间的关系来提高估计的精度。这就是本章所要引见的方法(不是抽样方法,而是估计方法)。.通常运用的方法是:利用调查目的与辅助变量之间的关系构造比率估计量和回归估计量。例如,要调查家庭教育支出,那么家庭的总支出就是辅助变量,家庭用于教育的支出占总支出的比重就构成了比率估计量。.二、运用条件 (1)比率估计、回归估计需求用到辅助变量的总体均值或总体总量;2假设辅助变量的总体均值或总体总量未知又要利用比率估计或回归估计,那么可采用二
2、重抽样的方法;3比率估计是有偏估计,因此需求有足够的样本量才干保证估计的有效。.三、符号阐明设调查目的为,辅助变量为总体总量:总体均值:总体方差:.样本均值:样本方差:总体协方差:样本协方差:总体相关系数:样本相关系数:.4.2 比率估计一、简单随机抽样下的比率估计1.定义 比率估计量ratio estimator)又称比估计对于简单随机抽样,总体均值和总体总量Y 的比率估计为:总体比率:总体比率估计量:.2.比估计的性质简单随机抽样比率估计是有偏的,其偏倚的阶为,当样本量 n 较大时,估计量的偏倚趋于零.因此,比率估计是渐近无偏的.性质1 对于简单随机抽样比率估计,当样本量n 较大时,是渐近
3、无偏的.即的方差为:.或式中分别为 Y ,X 的总体方差和总体协方差;分别为 Y ,X 的样本方差和样本协方差.可经过估计.【例4.1】对以下假设的总体N=6,用简单随机抽样抽取 n=2 的样本,比较简单随机抽样比率估计及简单估计的性质。i123456均值XiYi011331151882910464.518解:对这个总体,我们列出一切能够的个样本,以比较简单估计与比率估计的性质。. i 样本简单估计( )比率估计( )1234567891011121314151,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.
4、516.024.514.520.028.523.532.037.5181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.75.由此,可以算出:. 由计算结果可以看出: 简单估计是无偏的,而比率估计是有偏的。简单估计量的方差远远大于比例估计量的方差,比率估计的偏倚不大,其均方误差也比简单估计的方差小得多。因此,对这个总体,比率估计比简单估计的效率高。.【例4.2】某县在对船舶调查月完成的货运量进展调查时,对运管部门登记的船舶台帐进展整理后获得注册船舶2860艘,载重吨位154626吨。从2860艘船舶中抽
5、取一个n=10的简单随机样本,调查得到样本船舶调查月完成的货运量及其载重吨位如表单位:吨,要推算该县船舶调查月完成的货运量。. i i1234578015001005376600100505010206789102170182314501581370120150802050解:知:N=2860, n=10, X=154626 由表可得.因此,对该县船舶在调查月完成货运量的比率估计为:方差的估计为:=2.10617.规范差的估计为:假设用简单估计对货运量进展估计,那么由此,得到比率估计量设计效应为:对于本问题,比率估计量比简单估计量的效率高!.3.消除比率估计偏倚的方法 由于比率估计是有偏估计,
6、在小样本时,其偏倚不能忽略.那么需求经过改善估计量或改动抽样方法使比率估计成为无偏估计.1.无偏的比率估计量第一种: Hartley-Ross估计量式中.第二种: Mickey估计量其中 , 分别是在n个样本数据中去掉第i个样本数据后剩下的n-1个样本数据的平均值.二、分层随机抽样下的比率估计1.分别比率估计总体均值总体总量的分层比率估计(separate Ratio estimator)为:总体均值:总体总量:层权L: 层数为的比率估计,为比率估计.比率估计量的方差:式中,分别为第 i层目的Y,X的方差及相关系数. 分别比率估计量要求每一层的样本量都比较大,否那么,偏倚能够比较大.2.结合比
7、率估计(combined ratio estimator)总体均值:总体总量:式中:表示的无偏估计;表示的无偏估计.均方误差为:.3.分别比率估计量与结合比率估计量的比较普通而言,分别比率估计量的方差小于结合比率估计量的方差。但当每层的样本量不太大时,还是采用结合比率估计量更可靠些,由于这时分别比率估计量的偏倚很大,从而使总的均方误差增大。实践运用时,假设各层的样本量都较大,且有理由以为各层的比率Rh差别较大,那么分别比率估计优于结合比率估计。当各层的样本量不大,或各层比率Rh差别很小,那么结合比率估计更好些。.【例4.4】 某市1996年对950家港口消费单位完成的吞吐量进展了调查,1997
8、年欲对全市港口消费单位完成的吞吐量进展调查。对港口消费单位按非国有(h=1)和国有h=2)分为两层,单位数分别为800家和150家,分别在两层中调查了10家和15家港口消费单位,调查数据如下表,试计算1997年全市港口消费单位完成的吞吐量。1997年国有和非国有企业调查数据如下页.ixiyiixiyi19580149553022202102210320335938433604964120117423040051771805600651625325861000880730234977005608332286811001230927221597208231013797103103901147846
9、512817650139191160141160107015735698.(将上述数据计算的中间结果列于P77的表中)1.按分别比率估计量估计.2.按结合比率估计量估计 按结合比率估计量估计比按分别比率估计量估计要好一些!.三、比率估计的效率1.与简单估计的比较简单估计量是无偏的,而比率估计量是渐近无偏的.因此,这里只比较当 n 比较大的情形.由以前的讨论可知:由此看出,比率估计量优于简单估计量的条件是:有当.2.比率估计成为最优线性估计的条件与的关系是过原点的直线;对这条直线的方差与成比例。比率估计量优于简单估计量。特别当时,这里,.4.3 回归估计一、回归估计的定义对于简单随机抽样,总体均
10、值和总体总量的回归估计量regression estimatior)的定义为:式中,是样本均值;为事先设定的一个常数假设=0,那么回归估计量就是简单估计量;假设那么回归估计量就是比率估计量。.二、为常数的情形当回归系数为事先给定的常数时,或以前为一样目的进展的调查所得到的对的样本回归系数稳定在某个数值上,取最近一次调查所得的作为设定值。性质2 对于简单随机抽样回归估计量,作为及Y 的回归估计,都是无偏的。即的方差分别为:.式中,分别是Y,X的总体方差和总体协方差;分别是Y,X的样本方差和样本协方差。的样本估计量为:.当取总体回归系数到达最小,即时,式中,为总体相关系数。.三、为样本回归系数的情
11、形假设需求经过样本来确定,很自然地,我们会想到用总体回归系数的最小二乘估计,也就是样本回归系数:这时简单随机抽样回归估计量是有偏的。但当样本量n充分大时,估计量的偏倚趋于零。因此,类似比率估计量,回归估计量也是渐近无偏的。.且有的一个近似估计为:.【例4.5】(续P72的例4.2)利用回归估计量推算该县船舶调查月完成的货运量.解:根据例4.2中的计算结果可得样本回归系数:从而.因此,该县船舶调查月完成的货运量的回归估计为:为了估计 ,先计算回归残差方差:所以. 与例4.2的结果比较,对于本问题回归估计优于比率估计,而比率估计又优于简单估计; 回归估计优于比率估计的缘由是回归直线没有经过原点。
12、比较上述估计量的优劣,普通是经过比较它们的均方误差或方差大小来进展。. 简单估计量、比率估计量、回归估计量的比较简单估计量:比率估计量回归估计量.由此可以看出:2.比率估计量优于简单估计量的条件是:3.回归估计量优于比率估计量的条件是:即回归估计量总是优于比率估计量.1.回归估计量总是优于简单估计量,除非即普通而言有.四、分层随机抽样下的回归估计1.分别回归估计(separate regression estimator)总体均值的估计:总体总量的估计:. 当各层的回归系数为事先给定的常数时,分别回归估计量是无偏的。其方差为:其中 是第h层的回归系数.并且当时,到达最小,即通常未知,可用回归系
13、数作为的估计:.注 意 1分别回归估计量是有偏的,但当每一层的样本量 都很大时,估计的偏倚可以忽略,其方差近似为:2这里 是子总体的回归系数, 是子总体样本的回归系数,前者是未知的,后者是可知的。.方差的样本估计值为:式中, 分别回归估计量要求每一层的样本量都较大,如果这个条件得不到满足,那么分别回归估计量的偏倚能够很大,这时,采用结合回归估计量更好些。.2.结合回归估计(combined regression estimator)总体均值的估计:总体总量的估计:式中,分别为的分层估计。是无偏的,其方差为:.并且,只需取时,到达最小。当回归系数未知时,取为的样本估计:这时,结合回归估计量是有偏
14、的,但当样本量n较大时,估计的偏倚可以忽略,其方差近似为:.方差的样本估计为:3.分别回归估计与结合回归估计的比较当回归系数设定时,分别回归估计优于结合回归估计当回归系数由样本估计时,假设各层的样本量不太小,采用分别回归估计为宜.否那么,采用结合回归估计为好.【例4.6】续例4.4利用回归估计量估计该市港口消费单位1997年完成的吞吐量。解:样本回归系数:h=1,非国有h=2,国有1.070170.856402那么按分别回归估计量估计:见P85.按结合回归估计量估计:(见教材P86 从此题看,结合回归估计量比分别回归估计量要优一些!.4.4 差值估计假设调查时所用的辅助变量为目的量最近的普查结
15、果,或者回归估计的回归系数接近于己于1这时可以采用差值估计(difference estimayor)。总体均值的差值估计为:式中.性质3 作为=1的回归估计量,的无偏估计,其方差为:将的样本估计值代入上式,就可得到 的样本估计.【例4.7】(续例4.4)利用差值估计量估计该市港口消费单位1997年完成的吞吐量,并与前面的估计量及精度进展比较.解:由于辅助变量是上年的普查资料,且样本回归系数接近于1,因此可以采用差值估计. 下面比较本例所用的五个估计量,看看它们的优劣,其详细数据如下表:.估计方法总量估计标准差估计变异系数分别比率估计272536.69588.480.035182联合比率估计271956.19289.440.034158分别回归估计270556.39480.110.035039联合回归估计271753.49238.960.033998差值估计271910.09269.110.034089.结果分析1.此题中,五种估计量的精度非常接近,结合回归估计量稍好些;2.对于简单随机抽样,简单估计、差值估计是无偏的,比率估计、回归估计是渐进无偏的;3.当样
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中职(软件与信息服务)软件需求分析阶段测试试题及答案
- 2025年中职会计学(会计教育心理学)试题及答案
- 2025年中职(动物繁殖技术)畜禽人工授精实操阶段测试题及答案
- 2025年大学智能设备运行与维护(智能系统调试)试题及答案
- 2025年大学美术(美术批评)试题及答案
- 2025年高职(应用化工技术)应用化工进阶阶段测试试题及答案
- 2025年中职网络技术(网络设备进阶调试)试题及答案
- 2025年高职第四学年(工程造价咨询)咨询实务阶段测试题及答案
- 2025年中职民俗学(民俗学概论)试题及答案
- 2025年高职铁道运输(铁路客运调度)试题及答案
- 鹤壁供热管理办法
- 01 华为采购管理架构(20P)
- 糖尿病逆转与综合管理案例分享
- 工行信息安全管理办法
- 娱乐场所安全管理规定与措施
- 化学●广西卷丨2024年广西普通高中学业水平选择性考试高考化学真题试卷及答案
- 人卫基础护理学第七版试题及答案
- 烟草物流寄递管理制度
- 被打和解协议书范本
- 《糖尿病合并高血压患者管理指南(2025版)》解读
- 养老院敬老院流动资产管理制度
评论
0/150
提交评论