




已阅读5页,还剩14页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Chap5比估计与回归估计教学要求:重难点:引语:(请学生回顾)前面介绍过的目标量有四个类型:总体均值、总体总量、总体比例、两个指标的总数或均值的比值,在简单随机抽样和分层抽样中讨论的目标都是前三类,且它们本质上是一类,相互之间可类推。本章讨论第四类目标量比值的估计,这是第一个问题。比如服装消费支出占总支出的比值,在校儿童对全体儿童的比重。其次前面所用的估计量是简单估计,它只涉及所估计的指标本身。如果有另一个与关系密切(比例关系或线性回归关系)的指标可作为辅助变量,来构造另一类估计量,即比估计量或回归估计量,来提高估计精度,这是第二问题。如调查每月每户平均消费,消费通常与每户人口数密切相关,可用每户人口数作为辅助变量,先估计每月每户平均消费与每户人口数的比值,然后利用已知的每户平均人口,就可得到每月每户平均消费的估计值。由于这两个问题之间存在密切的内在关系,因此放在这一章节一起讨论。 5.1比估计1. 基本概念考虑到有两个指标量和,不妨将总体记为,对应样本为,如果要估计的是总体比值,则总体比值可用样本的比值 进行估计,该估计量称为比值估计量当调查指标仅为,为辅助变量时,在或已知时,和可用分别进行估计,称为比(比率)估计量这三者通称为比估计量,它们之间只相差一个常数,相互之间可推导,研究时只选择一个即可2. 性质我们知道简单估计量是无偏估计,其均值误差等于其方差但对于比估计量却不具有无偏性,而是渐近无偏其均值误差与方差有差异,但偏倚不大可证:对于简单随机抽样,当n很大时,简要证明: 当n很大时,代入上式分母中,有所以,当n很大时此时对每个总体单元,令,对每个样本单元有,则其总体均值和样本均值分别为因而所以,当n很大时此方差的估计量可采用或说明:这两个方差估计量很难比较谁优谁劣,对不同总体有不同结论。类推可得:对于简单随机抽样,当n很大时,, , ,【例1】(冯例5.3) 交通运输统计中有三个重要的指标,即运量、周转量与平均运距,其中平均运距是总周转量除以运量所得的商。为估计公路载货汽车的平均运距,在总体中用简单随机抽样抽取32辆货车,记录每辆车在一个月内的运量xi (单位吨)与周转量yi (单位吨公里),如P130表5.3所示,试估计平均运距R并给它的90%的置信区间。解:,故平均运距的估计值为为求方差估计值,令f1,R的90%的置信区间为3. 比估计与简单估计的比较简单估计法以样本均值估计总体均值,比估计以估计,两者的估计方差为由于样本方差和样本协方差是总体方差和总体协方差的无偏估计,所以的一个近似估计是即 其中是指标与的总体相关系数 比估计优于简单估计的条件是 (*)其中:,分别是总体Xi和Yi的变异系数.*式说明在估计时,如果有与指标相关系数较大的辅助指标,而且的变异系数比较小,则用比估计法的有利的即的变异系数与的变异系数相当,当相关系数大于时,比估计比简单估计更优5.回归估计有效运用比估计的一个前提是与辅助变量X基本上成(正)比例关系,即 Yi 对Xi的回归直线通过原点。若Yi 对Xi的回归直线不通过原点,为了进一步提高精度,则应使用回归估计。对于简单随机抽样,总体均值和总量的(线性)回归估计量定义为:其中是样本均值,可以是:(1)事先设定的常数;(2)从样本中计算得到的某一特定统计量,如样本回归系数。下面例举几种回归估计的特殊情况。(1)当时的回归估计量称为差估计量(difference estimator) : (2)当时,即为简单估计量。(3)当时,则 即比估计量。 我们知道简单估计是无偏估计,而比估计是渐近无偏的,也就是说为设定常数与 为某一统计量对回归估计在性质上有很大的不同,下面分别进行讨论。为设定常数 令是设定常数,易证回归估计量 是的无偏估计。求它的方差时,可视为 的样本均值,所以可用简单估计量的方差公式:由于样本方差和样本协方差是总体方差和总体协方差的无偏估计,因此的一个无偏估计是的不同取值会影响值,若取值合理,就小,否则就大。若要 最小,则 最小。对 求导,则 ,即为对的总体回归系数时,取得最小值为样本回归系数 对的总体回归系数一般是未知的,自然人们常用其样本回归系数b,估计,此时总体均值的回归估计为可以证明,当n大时,以估计是近似无偏的;其均方误差近似为 理论上的最小值,即 此式中的可用以下样本残差方差进行估计: 所以的一个近似估计式为回归估计与简单估计和比估计的比较 将回归估计( 为样本回归系数b时)与比估计及简单估计的方差作大样本比较。(1)当样本量n大时,回归估计的方差为而简单估计的方差 而 ,故有 也就是说,在大样本下,回归估计优于简单估计,除非,两者效果才一样。(2)对于比估计,我们知道当n大时,它的方差近似为回归估计量优于比估计量的条件为:注:上述结论是在大样本时得到的,当n不太大时,还要考虑到回归估计及比估计的偏倚。实际上,小样本时,回归估计的偏倚有可能比比估计的大,因此就总的均方误差而言,并不是总是回归估计最小。结论:()小样本时,比估计可能比回归估计更优()大样本时,除非B=R,否则回归估计优于比估计。经验作法(孙教材):当辅助变量的变异系数与指标的变异系数之比在之间时,而两者相关系数时,采用回归估计比采用简单估计或比估计有较高的精度【例2】某系统共有N=687个单位,为预计当年全系统的工资总量,用简单随机抽样抽取一个n=26个单位的样本,下表是这些单位当年击伤一年工资总额数。已知上一年全系统工资总额为70523.16万元。试采用比估计和回归估计法( 取样本回归系数b)估计当年全系统的工资总额及估计的近似标准差。解:,方法:比估计作为比较,的简单估计量为比估计的设计效应方法:回归估计法样本回归系数为求方差估计,先求样本残差方差回归估计法的设计效应可见,回归估计法与比估计的设计效应非常接近(因为B与R的估计值非常相近),精度都比简单估计高5.3分层比估计回顾:l 在分层抽样一章中讲过定理:总体均值的估计用各层均值的估计加权平均得到,即。和该定理的推论:对分层简单随机样本,若各层均值采用简单估计,则总体均值分层简单估计为l 前节比估计的思想是用样本的比值估计总体比值,即,总体均值的比估计是若将比估计的思想和技术用于分层随机样本,有两种可行的方法:l 一种是先对每一层使用比估计,然后进行加权平均,得到整个总体的估计量的比估计,这种方法称为分别比估计;l 另一种是对两个指标和各自都作分层简单估计(即推论的作法),然后用它们构造比估计,这种方法称为联合比估计(或组合比估计)。、分别比估计(separate ratio estimator)对分层简单随机样本,若各层均值采用比估计,则总体均值的分别比估计定义为由于当每一层的样本量都比较大时,各层的比估计是近似无偏的,所以也是近似无偏的。且其均方误差近似为该方差的一个近似无偏估计为、联合比估计(combined ratio estimator)对分层简单随机样本,先求两个指标和的总体均值的分层简单估计:则总体均值的联合比估计定义为其中当总样本量n比较大时,是近似无偏的,且其均方误差近似为的一个近似估计为注意:这个式中的是总体比而不是分别比估计相应公式中的层i.,其它一样。3.两种比估计的比较(适用场合):先比较两者的方差:注意式中在比估计适用的场合都比较小,如当与关系是通过原点的一条直线时(完全正相关),。由此可得结论:()当每层的时,两种比估计效果一样。()每一层的样本量都比较大,每层的与相关系数较大,且相差较大时,分别比估计优于联合比估计。()分别比估计要求每一层的样本量都比较大,因此仅当层数较多,而各层样本量不够大时,才采用联合比估计。5.分层回归估计与比估计情形一样,对于分层随机样本,也有两种形式的回归估计,一种是先对每一层使用回归估计,然后进行加权平均,得到整个总体的估计量的回归估计,这种方法称为分别回归估计;另一种是对两个指标和各自都作分层简单估计,然后用它们构造回归估计,这种方法称为联合回归估计(或组合回归估计)。分别回归估计(separate regression estimator) 对分层随机样本,总体均值的分别回归估计定义为()当h为事先取定的值时,该估计量为无偏估计量,且其方差为该方差是的多元函数,可证当h取时,达最小值()当h不能事先取定时,通常取为从样本中计算得到的此时当各层的样本量nh很大时,以估计是近似无偏的;其方差近似为理论上的最小值,即 它的一个近似估计为 式中样本残差方差.联合回归估计(combined regression estimator)对分层随机样本,先求两个指标的总体均值的分层简单估计: 则总体均值的联合回归估计定义为()当事先取定时,该估计量为无偏估计量,且其方差为该方差是的一元函数,可证当取时,达最小值()当不能事先取定时,通常取为从样本中计算得到的 b此时当总样本量n很大时,以估计是近似无偏的;其方差近似为理论上的最小值,即它的一个近似估计为 3.两种回归估计的比较(适用场合):分别回归估计的最小方差为 .联合回归估计的最小方差式中注:上式中只需 代入 得恒成立由此可知:()当每层的时,两种回归估计效果一样。()每一层的样本量都比较大,每层的与相关系数较大,且相差较大时,分别回归估计优于联合回归估计。()分别回归估计要求每一层的样本量都比较大,因此仅当层数较多,而各层样本量不够大时,才采用联合回归估计。【例】(冯例.)已知某市年年底中央直属单位()专业技术人员总数人,市属单位()专业技术人员总数人,欲通过抽样调查,估计年年底全市专业技术人员的总数抽样按中直单位与市直单位分层随机抽取,前者抽n1=15个单位,后者抽n2=个单位,数据如下表。中直单位(i=1)市直单位(i=2)jxijyijjxijyij121522418794210821110212313236757143596243823934141751801895657702663267768388756617208227881282884245998101938421021722810148165112158220113904291231833412971041345746113103107142342481428429015465472151251251667471417357385182182341981986820146162对上述数据按分别比估计、联合比估计、分别回归估计、联合回归估计四种方法对年年底全市专业技术人员的总数作出估计,并给出各估计量的精度。解:先将样本数据计算得到的中间结果列如下表:中直单位(h=1)市直单位(h=2)Nh152035Wh0.0990462220.9009537780.0592592590.049185668Xh75650315612391262560.3703704257.0130293550.6666667249.6532.0666667233.6298594.23816136678154296.56842290611.166757708.410531.0349580251.068493151bh1.0271567031.06283715998.0326205433.25450918()分别比估计()联合比估计(3) 分别回归估计(4) 联合回归估计与分层简单估计进行比较:估计方法估计值估计值的标准差分别比估计415521607联合比估计4154331675分别回归估计415331160联合回归估计415381672分层简单估计380848.869814.635.5各种估计量的比较与选择(小结)比估计与简单估计的比较:在有辅助变量时,若的变异系数与的变异系数相当,且相关系数大于时,比估计比简单估计更优回归估计与简单估计的比较:在大样本下,除非相关系数,否则回归估计优于简单估计 比估计与回归估计的比较:在大样本下,除非与的总体回归系数B=R,否则回归估计优于比估计小样本时,考虑总的偏差,比估计可能比回归估计更优分别估计与联合估计的比较:l 对分层抽样,当每一层的样本量都比较大,每层的与相关系数较大,且或相差较大时,分别估计优于联合估计,无论是比估计还是回归估计。l 对分层抽样,仅当层数较多,而各层样本量不够大时,才采用联合回归估计。作业: 5.4(1)要求用比估计和回归估计两种方法 5.9实践题:利用上次实验中收集的本班学生的身高、体重数据,试选择本章所介绍的比估计或回归估
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 车展端午节活动策划方案
- 管工进场考试题及答案
- 歌剧赏析考试题及答案
- 高考试题及答案物理
- 技术转移成效见证承诺书(3篇)
- 员工绩效考核评估报告标准化模板
- 费县中考试题及答案
- 班主任老师演讲稿:感恩的心(8篇)
- 环保话题的讨论与思考议文周记7篇
- (正式版)DB15∕T 3404.4-2024 《全民所有自然资源资产清查技术指南 第4部分:草原资源》
- 仓库货物运送管理制度
- 《思想道德与法治》课件-第一节 人生观是对人生的总的看法
- 颈深间隙感染诊疗与管理
- 安徽科技馆笔试题目及答案
- 厂房分割租赁协议书
- 会计中级职称《财务管理》电子书
- 无人机教员聘用协议书
- 足球教练员的职业素养与道德规范
- 产地证培训讲义
- 《南京理工大学化工》课件
- 养殖场远程视频监控解决方案
评论
0/150
提交评论