版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
计量经济学概要
的标准误关于β1的假设检验β1的置信区间X为二值变量时的回归异方差和同方差OLS的有效性与t分布5-2本章学习的目标和步骤:总体回归线的斜率是我们感兴趣的未知参数。现有样本数据,但存在抽样的不确定性。关于斜率参数的统计推断,通过下面的五步进行:描述我们感兴趣的总体参数构造该总体参数的估计量推知估计量的抽样分布(需要某些假设)。据中心极限定理,在大样本情况下,抽样分布将是正态分布。用该估计量的样本标准差去近似该估计量的标准误(SE)。用SE去构建t统计量(用以假设检验)和置信区间。5-3
,衡量了X对Y的边际效应(因果效应)最小二乘估计量为估计量:为了得到大样本下的
分布,需要作以下假设:最小二乘假设:E(u|X=x)=0.(Xi,Yi),i=1,…,n,独立同分布.不太可能出小异常值
(E(X4)<∞,E(Y4)<∞.5-4
的抽样分布最小二乘的假设下,n
较大时,的近似分布为
,其中
vi=(Xi–μX)ui
5-5的假设检验及标准误(5.1节)首先提出诸如β1=0的假设,利用数据进行分析,最后判断原假设是否正确。一般设定
原假设和双边备择假设:H0:β1=β1,0
备择H1:β1
≠
β1,0(其中β1,0
是原假设下的假设值)。
原假设和单边备择假设:H0:β1=β1,0
备择H1:β1<β1,05-6一般方法:构建t统计量,计算p值(或比较标准正态分布N(0,1)的临界值)一般地:
t=
其中,估计量的SE是估计量方差的平方根Y的均值检验:t=β1的检验,
t=
其中SE()=抽样分布方差估计量的平方根5-7SE()的公式
回顾方差的表达式(n较大时):
,其中vi=(Xi–μX)ui.上式中存在总体未知参数和,为此利用样本数据给出相应估计:
其中.5-8此公式看起来很复杂:实际上化繁为简。分子是var(v)的估计,,分母是[var(X)]2的估计。为什么自由度调整为n-2?因为两个参数β0和β1
已被估计出来了。SE()可由计量软件直接计算。5-9小结:检验
H0:β1=β1,0vsH1:β1
≠
β1,0,构建t统计量
若|t|>1.96,5%水平下拒绝原假设P值是事件
{Pr[|t|>|tact|}的概率,即标准正态分布|tact|处以外的尾部面积;若P值小于5%,在5%的显著水平下拒绝原假设该步骤依赖于大样本下近似于正态分布,当n大于50时,样本足够大以至于近似结果出色
5-10例:测试成绩与学生教师比的关(加州的数据)估计回归线:由回归软件得出的标准误:
SE(
)=10.4 SE(
)=0.52检验β1
是否等于0的假设检验:
1%的双边显著水平是2.58,故可在1%的显著水平下拒绝原假设或者,也可计算出p值5-11大样本下,近似标准正态分布的t统计量,当|tact|=4.38时,p值为0.00001(10–5)5-12β1的置信区间(教材5.2节)参数在95%的置信水平下的置信区间,等价为:5%显著水平假设检验中不能拒绝的集合重复抽样中,抽取的样本中有95%的样本构造的置信区间包含了参数的真值因为β1的t统计量在大样本下近似为N(0,1)标准正态分布,95%的置信区间与样本均值的置信区间类似β195%的置信区间={±1.96×SE()}5-13测试成绩与学生教师比的估计回归线:SE()=10.4SE()=0.52
的95%置信区间:
以下两种陈述式等价的(为什么?)β1=0没有落在95%的置信区间内5%显著水平下拒绝假设β1=05-14回归结果的标准写法:
把标准误写在被估计系数下方的括号号内该表达式提供的信息:估计回归线为
的标准误为10.4的标准误为0.52R2为0.051;回归的标准误为18.65-15(10.4)(0.52)OLS回归:读取
STATA结果5-16(10.4)(0.52)关于β0
及β1统计推断小结估计:
和OLS估计量
大样本下,,的分布近似正态分布检验:H0:β1=β1,0
备择
β1
≠
β1,0(β1,0H0假设下
β1
的真值)t=(–β1,0)/SE()P值
=标准正态分布tact外的面积(n较大时)置信区间:95%的置信区间是{±1.96×SE()}5%置信水平下不能拒绝的β1值集合真值包含在95%的所有样本的置信区间内5-17X为二值变量时的回归(教材5.3节)回归变量是二值变量时:若班级规模小,则X=1,反之X=0若性别为女性,则X=1,反之X=0若采用实验性药物,则X=1,反之X=0
二值变量称为虚拟变量
目前为止,β1称为斜率,但若X为二值变量时,则不合理。那么该如何解释二值变量?5-18二值回归变量的系数解释
Yi=β0+β1Xi+ui,其中,X为二值变量
(Xi=0or1):当
Xi=0,Yi=β0+ui
Yi的均值为
β0即,
E(Yi|Xi=0)=β0
当Xi=1,Yi=β0+β1+ui
Yi
的均值为β0+β1即,
E(Yi|Xi=1)=β0+β1
故:
β1=E(Yi|Xi=1)–E(Yi|Xi=0)=总体均值之差5-19例:
令
OLS回归:=650.0+7.4×D(1.3)(1.8)总体均值表:
均值差: =657.4–650.0=7.4标准误:5-20班级规模平均成绩()标准差(sY)样本容量小(STR>20)657.419.4238大(STR≥20)650.017.9182小结:X(0/1)为二值变量时的回归Yi=β0+β1Xi+ui
β0为当X=0时Y的均值β0+β1
为当X=1时Y的均值β1为两种情况下总体均值差,X=1减X=0SE()的解释不变t统计量,置信区间构建不变这是处理均值差分析的另一方法(也是简便的方法)当有增加的回归变量(接下来的内容)时,该回归方程尤其有用5-21异方差及同方差,同方差时的标准误(教材5.4节)概念同方差理论计算标准误的意义同方差和异方差的定义:
若是若给定X的情况下,u的条件分布的方差不依赖于X,则u为同方差,反之则为异方差。5-22例:二值变量下的异方差和同方差(即均值的比较)X=1和X=0的两组u方差不一样时的标准误X=1和X=0的两组u方差一样时的标准误其中(教材,3.6节)sp
为“σ2的合并估计量”(当=时)5-23异方差(如图)E(u|X=x)=0(u
满足最小二乘假设
#1)u的方差依赖于
X5-24来自劳动经济学的一个真实数据的例子:平均每小时收入与受教育年限的关系(数据来源:当前的人口调查):异方差还是同方差?5-25班级规模数据:
异方差还是同方差?5-26目前,假设u是同方差的回顾最小二乘的三个假设:E(u|X=x)=0(Xi,Yi),i=1,…,n,独立同分布不太可能出现异常值异方差与同方差的区别在于var(u|X=x)是否与x相关.在不能明确证据表明是误差同方差的情况下,一般默认为异方差.5-27假使实际中误差同方差会怎么样?可以证明OLS估计量是所有线性估计量中方差最小的。即将讨论的Gauss-Markovtheorem说明了这一点
的方差公式及OLS标准误的简化:
若var(ui|Xi=x)=,则(一般公式)=(u
为同方差下的简化形式)
注:var()与var(X)成反比:X
分布的越分散则关于的信息越多–之前讨论过,现在可以从公式中看得更清楚5-28与同方差情况下的方差对应,还有同方差下的标准误:
同方差下的标准误公式:
但需注意的是除非误差真的是同方差的,否则该公式无效。
5-29现有
的两个标准误公式同方差标准误
–当且仅当误差同方差时有效。常用标准误–与前不同,习惯称其为异方差稳健标准误,因为不论误差是否是异方差,该统计推断都是有效的。同方差标准误主要优点在于公式简化。但缺陷是当且仅当误差同方差时才有效。5-30实际意义…
的同方差标准误与异方差稳健标准误不同–因此一般来说,使用不同的标准误公式得到不同结果。同方差标准误是回归软件的默认设置—有时是唯一设置(如Excel)。为了得到常规的异方差稳健标准误,需要重置设置。如果没有重置设置,而事实上存在异方差情况,所得标准误(以及t统计量和置信区间)是不对的—典型地,同方差SEs会很小。5-31STATA中的异方差稳健标准误5-32结论:
不管误差是同方差还是异方差,只要采用异方差稳健标准误都会有效。在误差存在异方差时,如果错误的使用采用同方差标准误公式,则标准误将是无效的(因为若存在异方差,则的同方差标准误的统计量不满足一致性)。当n较大时,在同方差的特殊情况下,两个公式的结果吻合。因此,需始终采用异方差稳健标准误公式。5-33关于OLS的一些理论基础(教材5.5节)已经得到的结论:OLS是无偏的,一致的;可用异方差稳健标准误公式;可构建置信区间及假设检验。此外,采用OLS的另一个充分理由是其使用的广泛性。实际上,OLS是一种最常使用回归分析语言,若使用其他的估计量来分析回归模型,你需要额外的解释。5-34你或许依然想知道…这就是使用OLS的理由吗?有没有其他更好的估计量呢?比如有更小方差的估计量?此外,我们以前经常用到的t分布又将扮演什么角色呢?为了回答这些问题—我们需要作出比最小二乘更加严格的一些假设。5-35最小二乘假设的扩展:在最小二乘的三个假设基础上,多出两个假设:E(u|X=x)=0.(Xi,Yi),i=1,…,n,独立同分布不太可能出现异常值(E(Y4)<∞,E(X4)<∞).u
是同方差u
服从N(0,σ2)假设4和5非常严格–因此实际操作中应用较少。然而,若作出这些假设,则会简化某些数学计算,并且得到一些很好的结果。接下来我们讨论OLS的有效性问题。5-36OLS的有效性(I):Gauss-Markov定理在扩展后的最小二乘假设1-4的前提下(三个基本假设,加上一个同方差假设),OLS估计量在所有诸如Y1,…,Yn的线性条件无偏类估计中方差最小。这就是Gauss-Markov定理。
说明GM定理的证明在教材附录5.2中。5-37Gauss-Markov定理:
是一个线性估计量,即可表示为Y1,…,Yn的线性函数:
其中
.G-M定理说明在所有可能的
{wi}选择中,OLS的权重使得
var()的方差最小。5-38OLS的有效性(II)在最小二乘五条假设下(包括u服从正态分布),在所有满足一致性的估计量(关于Y1,…,Yn
的线性或非线性函数)中,有最小方差(当
n--›∞时)这是一个惊人的结论——即,若(作为对LSA1-3
的补充)误差是同方差的并且服从正态分布,则
OLS是所有满足一致性原则的估计量中最好的估计量。因为非一致性的估计量并不是最好的选择,若拓展的最小二乘假设满足,则OLS即为所得的估计量中最好的一个(该结论的证明超出本教材范围,在研究生教材中会有证明)。5-39OLS的一些不足1.GM定理的假设条件太严格:同方差的的前提通常并不满足(同方差是特例)该结论仅限于线性估计量–众多估计量中的一小部分(多出现于一阶矩中)
2.令人信服的最优结果(上述“第II部分”)要求误差满足同方差的正态分布,可是在实际应用中很难满足(考虑每小时的工资数据!)5-40OLS的局限,
ctd.
OLS相比于其他估计量,对异常值更为敏感。在估计总体均值的例子中,若存在较大的异常值,则中位数优于异常值–此时,中位数的方差小于OLS估计量方差。类似地,在回归中,存在异常值时,其他估计量将比OLS更有效(方差更小))。一个此类型的估计量就是最小绝对变差估计量(LAD):实际上,OLS被用于所有的回归分析中。5-41u是同方差并服从正态分布的推论:t分布(5.6节)回顾五个最小二乘假设:E(u|X=x)=0.(Xi,Yi),i=1,…,n,独立同分布不太可能出现异常值
(E(Y4)<∞,E
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026安居管家岗位面试题及答案
- 2026艾灸比赛面试题及答案
- 锅炉现场岗位安全生产责任制培训
- 护士安全生产责任制培训
- 2025年区块链溯源提升供应链运营效率
- 2026福建中考语文作文考前专项练习(题目+范文)
- 浙江省宁波市奉化区2024-2025学年七年级下学期期末考试英语试题(含答案)
- 宜城生鲜分拣阶段检测卷
- 2025年房地产估价师考试《房地产估价原理与方法》备考试题及答案
- 文书模板-资产调拨单
- 2026年安徽省体育彩票管理中心编外聘用人员公开招聘11名考试参考题库及答案解析
- 2026重庆物流集团数字科技有限公司招聘3人笔试历年参考题库附带答案详解
- 2026年滨州国有资本投资运营集团有限公司公开招聘国有企业工作人员(15名)笔试参考题库及答案解析
- 2026广西能汇投资集团有限公司校园招聘笔试参考题库及答案解析
- 河南省顶级名校2026届高三年级5月押题导向卷(一)历史试卷(含答案及解析)
- 开封市汽车产业投资有限公司、开封市文心科教投资发展有限公司招聘笔试题库2026
- 2026年安全生产月活动宣贯培训课件
- 衡阳县岣嵝峰林场招聘社区网格员考试试题附答案详解
- 市政起重吊装施工方案(3篇)
- DB-T29-1-2026 天津市居住建筑节能设计标准
- 视频监控系统技术规范书
评论
0/150
提交评论