第五章比率估计与回归估计.ppt_第1页
第五章比率估计与回归估计.ppt_第2页
第五章比率估计与回归估计.ppt_第3页
第五章比率估计与回归估计.ppt_第4页
第五章比率估计与回归估计.ppt_第5页
免费预览已结束,剩余30页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第五章比率估计与回归估计 2 本章要点 本章讨论了简单随机抽样和分层随机抽样下比率估计量和回归估计量的构造及性质 要求 掌握总体比率 比率估计量及回归估计量的概念 了解比率估计量 回归估计量的偏倚 方差及方差的估计量 掌握应用比率估计量及回归估计量的条件 3 第一节问题的提出 在许多实际问题中常常涉及两个调查变量 指标 Y和X 对于包含个抽样单元的总体除了对总体信息进行估计外 常常要估计总体比率R 总体比率在形式上总是表现为两个变量总值或均值之比 在涉及两个变量的抽样调查中 有两种情况需要应用比率估计量 一种情况是利用双变量样本对总体比率进行估计需应用比率估计量 此时两个变量均为调查变量 另一种情况是一个变量为调查变量 另一个变量表现为与调查变量有密切关系的辅助变量 在对调查变量总体总值 总体均值等目标量进行估计时 利用已知的辅助变量信息构造比率估计量可以改进估计的精度 基于这种考虑利用已知的辅助变量信息构造比率估计量就可使估计精度加以改进 4 第二节比率估计 一 比率估计量设对有两个调查变量Y和X的总体进行简单随机抽样 分别以y x表示样本总值 以表示样本均值 以为样本比率 用作为总体比率R的估计称为的比率估计 比率估计量除了使用调查变量样本信息外 还要使用辅助变量总体信息与样本信息 而且是非线性估计量 这类估计量称为复杂估计量 由于比率估计量使用的信息比简单估计量多 因而有可能比简单估计量有更高的精度 同时由于比率估计量是非线性估计量 因而对其性质的研究比对简单估计量要复杂得多 5 二 比率估计量的偏倚与均方误差比率估计量是有偏估计量 但当样本量增大时其偏倚将趋于零 理论上可以证明 分别为的近似无偏估计量 而且对于比率估计量 其方差主要取决于与之间的差异 当时 估计量方差将很小 换言之 比率估计量将有很高的精度 这告诉我们 只有当两个变量大致成正比例关系时 应用比率估计量才能使估计精度有较大改进 6 三 比率估计量方差的估计与置信区间对于一般的n 比率估计量呈右偏分布 只有当n 30 0 1 0 1这些条件同时满足时才能直接用正态分布构造置信区间 R的置信区间为 其中是标准正态分布的上 2分位点 0 1 类似可得 Y的置信区间 7 案例一 8 解答过程 9 案例二 10 解答过程 11 四 比率估计量优于简单估计量的条件定量分析计算表明 并非任何情况下比率估计量都优于简单估计量 只有当调查变量与辅助变量有较高的正相关性时比率估计量才能使估计精度有较大提高 若 则只需当 0 5时比率估计量就比简单估计量精度高 12 五 多元比率估计对于调查变量Y 若有p个具有正相关性的辅助变量则可构造多元比率估计 设是的基于第k个辅助变量的比率估计 则的多元比率估计量为 其中是相应变量的样本总值 是辅助变量总体均值 是适当选取的权 满足 利用拉格朗日乘数法可计算得此时最小方差为 13 案例三 14 解答过程 15 六 乘积估计当辅助变量X与调查变量Y呈负相关关系时 不能应用比率估计而应改用乘积估计乘积估计优于简单估计的条件是 此时 在实际问题中与调查变量呈负相关的变量很少见 因此乘积估计应用极为有限 16 第三节回归估计 一 定义在简单随机抽样下 总体均值和总体总值Y的回归估计量定义为 其中 分别为调查变量 辅助变量的样本均值 是辅助变量的总体均值 称为回归系数 17 二 为设定常数情形设是设定常数 取 则回归估计量是的无偏估计量 其方差为当时达最小值 18 三 取样本回归系数情形若 需根据样本确定 一个合理的选择是取 为样本回归系数此时的回归估计量为一复杂估计量 不再具有无偏性 19 四 回归估计与比率估计及简单估计的大样本比较对于大的样本量 总有这就是说在大样本下回归估计总是优于简单估计 仅在 0时两者效果相同 的充分必要条件为这等价于因此除非Y关于X的总体回归系数B R 否则回归估计总是优于比率估计 仅在B R时两者效果相同 20 案例四 21 解答过程 1 22 解答过程 2 23 解答过程 3 24 第四节分层比率估计与分层回归估计 一 分别比率估计与联合比率估计 一 分别比率估计 25 二 联合比率估计 26 二分别回归估计与联合回归估计 一 分别回归估计 27 二 联合回归估计 28 三 各种估计量的比较 对分层随机抽样在有辅助变量可利用时 为提高估计精度可以采用分别比率估计 联合比率估计 分别回归估计 联合回归估计等多种形式的估计量 因此自然存在一个问题 即如何对这些估计量进行比较 由以上各种估计量的构造可以知道 分别比率估计和分别回归估计必须使用总体各层的辅助变量均值或总值的信息 而联合比率估计和联合回归估计不要求使用总体各层的辅助变量信息 只要求使用总体的辅助变量均值或总值X的信息 分别估计量比联合估计量对总体信息的使用更详细一些 因此 当各层样本量都比较大时 分别比率估计精度比联合比率估计高 分别回归估计精度比联合回归估计高 但是各层样本量较小时 分别比率估计 分别回归估计将有较大偏倚 从而均方误差比较大 此时如果总样本量比较大 则采用联合比率估计 联合回归估计更好一些 29 案例五 30 解答过程 1 相邻两年产量之间存在较高的正相关性 因此对今年平均亩产进行估计时以去年产量为辅助变量构造分层比率估计和分层回归估计是适宜的 此处 1 分别比率估计 31 解答过程 2 2 联合比率估计 32 解答过程 3 3 分别回归估计 33 解答过程 4 4 联合回归估计以上结果表明不论是比率估计还是回归估计 总有分别估计量优于联合估计量 不论是分别估计量还是联合估计量 总有回归估计优于比率估计 34 编号为奇数的习题答案 5 1 2000 36 1 0 95 t 1 96 0 018

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论