比估计与回归估计_第1页
比估计与回归估计_第2页
比估计与回归估计_第3页
比估计与回归估计_第4页
比估计与回归估计_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、12 一、比估计综述一、比估计综述 比估计是依据调查变量与辅助变量间的比率比估计是依据调查变量与辅助变量间的比率来对总体有关参数进行估计和推断。通常简称比来对总体有关参数进行估计和推断。通常简称比估计。估计。 同简单估计相比,比估计具有以下特点:同简单估计相比,比估计具有以下特点: (1)(1)在比估计中,除调查变量外,还需要了在比估计中,除调查变量外,还需要了解与调查变量有关的辅助变量,并且要求辅助变解与调查变量有关的辅助变量,并且要求辅助变量的总体均值或总体总和必须事先已知。量的总体均值或总体总和必须事先已知。 (2)(2)比估计方法,对抽样调查单元是有条件比估计方法,对抽样调查单元是有条

2、件的,通常是用组成总体的最基层单位为调查单元。的,通常是用组成总体的最基层单位为调查单元。3 (3) (3)比估计只适用于有限总体,因为只有有限比估计只适用于有限总体,因为只有有限总体才可能计算出为比估计所需要的辅助变量的总总体才可能计算出为比估计所需要的辅助变量的总体总和与总体均值。体总和与总体均值。 (4) (4)当每个单元的调查变量与辅助变量的比例当每个单元的调查变量与辅助变量的比例( (一般要求为正比例一般要求为正比例) )十分稳定,且变异很小时,比十分稳定,且变异很小时,比估计就具有十分精确的估计效果,只要抽取少量的估计就具有十分精确的估计效果,只要抽取少量的样本单元,就可得到满意的

3、结论。样本单元,就可得到满意的结论。 (5) (5)在比估计时,出于估计精度方面的要求,在比估计时,出于估计精度方面的要求,选择辅助变量时,须与调查变量的关系愈密切愈好,选择辅助变量时,须与调查变量的关系愈密切愈好,至少要求相关系数在至少要求相关系数在1/21/2以上。以上。4 在实际工作中,为了充分发挥比估计的优越在实际工作中,为了充分发挥比估计的优越性,在应用比估计时应考虑两条:性,在应用比估计时应考虑两条: 一是选与调查变量有较密切的正相关关系的一是选与调查变量有较密切的正相关关系的变量作为辅助变量。因为如果辅助变量与调查变变量作为辅助变量。因为如果辅助变量与调查变量的关系不密切,各自独

4、立变化,则对比估计起量的关系不密切,各自独立变化,则对比估计起不了应有的辅助作用。不了应有的辅助作用。 二是样本容量要比较大。因为比估计是有偏二是样本容量要比较大。因为比估计是有偏倚的,只有当样本容量倚的,只有当样本容量n n比较大时,其偏倚才能比比较大时,其偏倚才能比较小,比估计才更加有效。较小,比估计才更加有效。5 设总体有设总体有N N个单元,对每个单元考虑两个指标个单元,对每个单元考虑两个指标y y和和x x。抽取容量为。抽取容量为n n的简单随机样本,则总体比率的简单随机样本,则总体比率R R的估计量为:的估计量为:其中:其中: , , 分别为指标分别为指标 与与 的样的样本和。本和

5、。二、总体比率的估计二、总体比率的估计 ,xyxyRniiyy1niixx1iyix6 比率估计是有偏的,但当样本量比率估计是有偏的,但当样本量n n增大时,增大时,偏倚逐渐趋于零。偏倚逐渐趋于零。 所以,当所以,当n n增大时,增大时, , 为为R的近似的近似无偏估计量,其方差为无偏估计量,其方差为RRE)(R)2(11)(1)(2222122yxxyNiiiRSSRSXnfNRxyXnfRV)2(12222xyxySSRSRSXnf7 当总体方差未知时,可用样本方差替代,以当总体方差未知时,可用样本方差替代,以估计方差。此时估计方差。此时)2(11)(1)(22221221yxxyNiii

6、sRsRsXnfnxRyXnfRV未知时)XnxRyxnfRVniii(1)(1)(1222)2(12222yxxysRsRsxnf8 前面两章所讨论的估计量只是利用了调查变前面两章所讨论的估计量只是利用了调查变量的信息,这样的估计量称为简单估计量。当调量的信息,这样的估计量称为简单估计量。当调查变量和辅助变量具有正相关关系时,为了利用查变量和辅助变量具有正相关关系时,为了利用辅助变量的信息,可以构造总体均值或总和的比辅助变量的信息,可以构造总体均值或总和的比估计量。在简单随机抽样中,总体均值和总体总估计量。在简单随机抽样中,总体均值和总体总和的比估计量分别为:和的比估计量分别为:其中其中 或

7、或 必须已知。必须已知。三、总体均值和总和的比估计三、总体均值和总和的比估计XRXxyXxyYRNYXRXxyXxyYRRXX9当当n n充分大时充分大时即即 与与 分别是分别是 与与 的近似无偏估计。的近似无偏估计。其方差估计量为:其方差估计量为: YYER)(YYER)(RYRYYY)2(11)(1)(22212yxxyniiiRsRsRsnfnxRynfYV)()(2RRYVNYV10 对简单随机抽样,若对简单随机抽样,若n n足够大,则当足够大,则当 时,有时,有 其中其中 分别为总体中分别为总体中x x与与y y的变异系数。的变异系数。四、比估计量与简单估计量的比较四、比估计量与简单

8、估计量的比较yxyxCCYSXS2121)()(yVYVRXSCxxYSCyy11 特别当特别当 ( (例如当例如当x x是是y y的前期数据的前期数据时有这种可能时有这种可能) )时,只要时,只要1/21/2,比估计量就比简,比估计量就比简单估计量更为精确。对一般问题,可先作一试点单估计量更为精确。对一般问题,可先作一试点调查,估计出调查,估计出的值,再判断作出选择比估计量的值,再判断作出选择比估计量或是简单估计量。或是简单估计量。 所以,我们的一个基本结论为:利用比估计提所以,我们的一个基本结论为:利用比估计提高抽样效果的条件是高抽样效果的条件是1/21/2。yxCC 12 估计总体比率时

9、如果允许估计总体比率时如果允许 的最大方差为的最大方差为V V,当,当n n大时,大时, 可得:可得: 将将 代入上式,则得:代入上式,则得: 五、样本容量的确定五、样本容量的确定221dSXnfVVXNSVXSndd22221VNSVSNndd1222R2NVV 13 一、各层分别比估计一、各层分别比估计 各层分别比估计是先对各层分别进行比估计,各层分别比估计是先对各层分别进行比估计,然后按层权加权平均,以得出总体参数的估计,然后按层权加权平均,以得出总体参数的估计,即:即:LhRhhRSYWYLhhhhXxyN1LhRhLhhhRSYXxyYh14 在分层随机抽样中,若每层的样本量在分层随

10、机抽样中,若每层的样本量 都都较大,则较大,则 为为Y Y的近似无偏估计。其方差为:的近似无偏估计。其方差为: 当各层的总体方差未知时,可用相应的样本当各层的总体方差未知时,可用相应的样本方差代替。由此得到方差的估计量:方差代替。由此得到方差的估计量: hnRSY)2()1 ()(2222xhyhhhxhhyhhhLhhRSSSRSRSnfNYV)2()1 ()(2222xhyhhhxhhyhhhLhhRSssrRsRsnfNYV15 联合比估计是先按分层随机抽样公式估计联合比估计是先按分层随机抽样公式估计Y Y和和X X: 然后用这两个量的比及已知的然后用这两个量的比及已知的X X对对Y Y

11、作估计:作估计: 其中:其中:二、联合比估计二、联合比估计 LhhhstyNYLhhhstxNXXRYcRCststcXYR16联合比估计联合比估计 只需要已知只需要已知X X,而无需已知每层,而无需已知每层的的 。此时:。此时:分层随机抽样中,若总样本量分层随机抽样中,若总样本量n n较大,则较大,则 与与 分分别为别为Y Y与与 的近似无偏估计,其方差为的近似无偏估计,其方差为RCYhXXRYcRCRCYRCYY)2()1 ()(2222xhyhhxhyhhhLhhRCSSRSRSnfNYV)2()1 ()(2222xhyhhxhyhhhLhhRCSSRSRSnfWYV17 从偏倚的角度看

12、,各层分别比估计量从偏倚的角度看,各层分别比估计量 的偏的偏倚较大,从方差的角度看,除了各层比率倚较大,从方差的角度看,除了各层比率 均相均相等时,等时, 外,一般只要各层的样本外,一般只要各层的样本量均较大时,各层比估计更加有效,即有:量均较大时,各层比估计更加有效,即有: 因此因此, ,当当 均大时均大时, ,用分别比估计量用分别比估计量 ,否则,否则,用联合比估计量用联合比估计量 较好。较好。三、各层分别比估计量与联合比估计量的比较三、各层分别比估计量与联合比估计量的比较 RSYhR)()(RCRSYVYV)()(RSRCYVYVhnRSYRCY18 一、回归估计概述一、回归估计概述 回

13、归估计就是根据样本各单元调查变量与辅回归估计就是根据样本各单元调查变量与辅助变量间的关系构造回归方程,并据回归系数对助变量间的关系构造回归方程,并据回归系数对总体有关参数进行估计。总体有关参数进行估计。 如果在回归估计中只有一个辅助变量,则所如果在回归估计中只有一个辅助变量,则所进行的估计称为一元回归估计,若同时采用多个进行的估计称为一元回归估计,若同时采用多个辅助变量综合进行估计,则称为多元回归估计。辅助变量综合进行估计,则称为多元回归估计。19 回归估计的回归估计的主要特点主要特点有:有: 回归估计充分利用了有关的辅助变量资料以有回归估计充分利用了有关的辅助变量资料以有效地提高估计的精度;

14、效地提高估计的精度; 回归估计中要求辅助变量的总体均值或总和事回归估计中要求辅助变量的总体均值或总和事先已知;先已知; 回归估计一般只适用于有限总体,因为只有有回归估计一般只适用于有限总体,因为只有有限总体才可能计算出辅助变量的总体均值和总和;限总体才可能计算出辅助变量的总体均值和总和;回归估计量一般优于比估计量和简单估计量。回归估计量一般优于比估计量和简单估计量。20 二、回归估计量的一般形式二、回归估计量的一般形式 对于简单随机抽样,总体均值与总和对于简单随机抽样,总体均值与总和Y Y的线的线性回归估计量定义为:性回归估计量定义为:)()(XxyxXyYlrlrlrYNY 1.1.为设定的

15、常数为设定的常数( (如如) )时的情形时的情形 回归估计量则为:回归估计量则为: 在简单随机抽样中,在简单随机抽样中, 是是 的无偏估计量。其方的无偏估计量。其方差为:差为: )()(XxByxXByYlrlrlrYNY 1)()(1)(12NXxBYynfYVNiiilr)2(1222yxxyBSSBSnflrYY22为为 的无偏估计量的无偏估计量. . 当当 时,时, 的方差达到极小,且的方差达到极小,且1)()(1)(12nxxByynfYVniiilr)2(1222yxxyBssBsnf )(lrYVxyxyxNiiNiiiSSSSXxXxYyB2121)()()1 (1)(22mi

16、nylrSnfYVlrY232 2、需从样本计算时的情形需从样本计算时的情形 当当需从样本计算时,受前面确定的最佳值的需从样本计算时,受前面确定的最佳值的思路的启发,思路的启发,的一个有效估计应是总体回归系数的一个有效估计应是总体回归系数的最小二乘估计,也即取的最小二乘估计,也即取为样本回归系数。为样本回归系数。此时总体均值的回归估计量为此时总体均值的回归估计量为 此时是有偏的。此时是有偏的。niiniiixxxxyyb121)()()()(XxbyxXbyylr24当很大时,有当很大时,有由于由于1 1,故,故 (时,时,取等号取等号) )。三、回归估计量与简单估计量及比估计量的比较三、回归

17、估计量与简单估计量及比估计量的比较)1 (1)(22ylrSnfYV)2()1 ()(222xyxyRSSRSRSnfYV21)(ySnfyV)()(yVYVlr25而而 因此因此 .(B=R.(B=R时,取等号时,取等号) ) 可见可见, ,在大样本时,回归估计量的精度要好于在大样本时,回归估计量的精度要好于简单估计量和比估计量。简单估计量和比估计量。)2(1)()(2222xxyylrRSRSSRSnfYVYV221()1()0yxxfSRSnfSBRn)()(RlrYVYVBack26 一、各层分别回归估计一、各层分别回归估计 先对每层分别进行回归估计先对每层分别进行回归估计 然后按层权

18、加权平均,得总体平均数的估计量然后按层权加权平均,得总体平均数的估计量为:为: 当各层的理论回归系数当各层的理论回归系数 之间有较大差异时,之间有较大差异时,考虑用此法。考虑用此法。已知)hhhhhlrhXxXyY()(LhlrhhlrsYWYh27 联合回归估计是先对及作分层估计,即得到联合回归估计是先对及作分层估计,即得到估计量估计量 和和 ,然后用这两个估计量构造,然后用这两个估计量构造 回回归估计量归估计量则则 与与 的联合回归估计分别为的联合回归估计分别为 hhhstyWyhhhstxWx)()(YlrcststlrclrcststlrcXXYyNYxXyystystxYYY二、联合

19、回归估计二、联合回归估计28 (一)当(一)当 事先设定时,它们都是无偏的,事先设定时,它们都是无偏的,且且它在它在 取下式取下式 时达到极小值:时达到极小值:)2()1 ()(2222xhyxhhyhhhhlrcSSSnfWyVhhxhhhhhyxhhhcnSfWnSfWB222)1 ()1 (222min)1 ()(hhxhhhhlrcBSnfWyVhyhhhhxhyhxhhxhhhhxhxyhhxhhhhSnfWSSSSnfWSSSnfW2222222222222)1 ()1 ()()1 (30令令 即即 是是 各层回归系数的加权平均值。各层回归系数的加权平均值。22)1 (xhhhhh

20、SnfWaLhhLhhhcxhxyhhaBaBSSB2cBhB31 为比较分别回归估计与联合回归估计,做最为比较分别回归估计与联合回归估计,做最小方差差值:小方差差值:上式表明:对最优的上式表明:对最优的 与与 的设定,分别回的设定,分别回归估计优于联合回归估计,尤其是当各层回归系归估计优于联合回归估计,尤其是当各层回归系数相差大时,分别回归估计效果更为显著。数相差大时,分别回归估计效果更为显著。minmin222()()()()0lrclrshhhchhhchVyVya BaBaBBh32 (二)当(二)当 必须从样本估计时,我们取必须从样本估计时,我们取 的的样本估计:样本估计:hnihhihhhhhnihhihhihhhhchhxxnnfWxxyynnfWb12212)()1()1 ()()1()1 (cB33 如果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论