高级计量经济学_第1页
高级计量经济学_第2页
高级计量经济学_第3页
高级计量经济学_第4页
高级计量经济学_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章回归分析与模型设定 回归分析 RegressionAnalysis 一种最常用的统计分析工具 用来分析一个变量关于其他变量的依赖关系 X与Y间的回归关系可用来研究X对Y的影响 或用X来预测Y 一 总体均值与样本均值HowtofindtherelationshipbetweenXandY 理论上应寻找总体回归函数 PRF 即在给定X时 Y的条件均值的函数 Y x E Y X F X 2 1回归分析 问题的引入egressionAnalysis Introduction 但我们往往只能得到样本数据 因此自然想到用样本均值来估计总体均值 并寻找样本回归函数 SRF mY x f X PRF SRF X Y WehopetheSRFisagoodestimateofthePRF Table2 1JointfrequencydistributionofX incomeandY savingrate Asimpleillustration howtofindthesamplemean 表2 1是1960年美国1027个家庭关于收入与储蓄率的联合频率分布 p xi yj theproportionofthe1027familieswhoreportedthecombination X xiandY yj TheconditionalmeanofYgivenX xiis mY X ConditionalmeanfunctionofYonX Fig2 1 同样地 如果可获得总体数据 我们就可得到给出X值时Y的总体条件均值 populationconditionalmeans xi yi jointfrequenciesofthepopulation xi j xi yi marginalfrequenciesofX yj xi xi yi xi conditionalfrequenciesofYgivenX X ixi xi populationmeanofX Y X jyi yj xi populationconditionalmeanofYgivenX Y x E Y X F X mY x f X Question howtogetf x 如果经济理论表明 Y x X但表2 1显示mY X并非一条直线 我们是保持mY X的原样呢 还是对样本的mY X通过一条直线来平滑 m Y X a bX 如果用平滑线 如何寻找该直线 用平滑线估计总体均值 要比样本均值估计效果更好吗 如果经济理论表明 Y X X 如何寻找该曲线 curve 平滑的样本曲线m Y X仍能告知有关 Y X的相关信息吗 二 条件分布 假设 X Y 的联合概率密度函数 jointprobabilitydensityfunction pdf 为f x y 则X的边际密度函数 marginalpdf fX x f x y dyY在X x的条件密度函数 conditionalpdf fY X y x f x y fX x 条件pdffY X y x 完全描述了Y对X的依赖关系 已知条件pdf 可计算 条件期望 Theconditionalmean 条件方差 Theconditionalvariance 条件偏度 Theconditionalskewness 条件峰度 Theconditionalkurtosis 2 2回归分析RegressionAnalysis WhatstatisticalpropertiesdoesE Y X process 一 回归函数及其性质 定义 RegressionFunction 称条件期望E Y X 为Y关于X的回归函数 regressionfunction Lemma Lawofiteratedexpectation E E Y X E Y 例 设Y 工资 X 1 女性 andX 0 男性 则E Y X 1 女性员工平均工资E Y X 0 男性员工平均工资 E E Y X P X 1 E Y X 1 P X 0 E Y X 0 全体平均工资 E Y Question WhyisE Y X importantfromastatisticalPerspective 假设我们希望使用X的函数g X 来预测Y 且使用均方误 MeanSquareError MSE 准则来评估g X 逼近Y的程度 则均方误准则 MSEcriterion 下的最优预测就是条件期望E Y X 定义 MSE Themeansquareerroroffunctiong X usedtopridictYisdefinedasMSE g E Y g X 2 记g0 X E Y X 则MSE g E Y g X 2 E Y g0 X g0 X g X 2 E Y g0 X 2 E g0 X g X 2 2E Y g0 X g0 X g X E Y g0 X 2 E g0 X g X 2 方差 偏误2方差测度了Y对其期望真实误差 trueerror 偏误2 0 且g X g0 X 时等号成立 因此 选择g X E Y X 可使MSE g 达到极小 证明 使用方差与偏误平方分解技术 Theorem RegressionIdentity 给定E Y X 总有如下等价式 Y E Y X Y E Y X 这里 称为回归扰动项 regressiondisturbance 且满足E X 0 证明 定义 Y E Y X 则E X E Y E Y X X E Y X E Y X 0 二 回归函数的等价形式 注意 a 回归函数E Y X 可用来通过X的信息预测Y的均值 b E X 0意味着回归误差 不包含X的任何可用来预测Y的信息 换言之 所有可用来预测Y期望值的信息都完全包含在E Y X 之中 条件E X 0对模型参数经济含义的解释至关重要 crucial c E X 0意味着E E E X 0且E X E E X X E XE X E X 0 0 d 可能存在E X 0但Var X 是X的函数 如果Var X 2 0 称 是条件同方差的 conditionalhomoskedasticity 否则 如果Var X 2 X 称存在条件异方差 conditionalheteroskedastisity 注意 计量经济方法往往视是否存在条件异方差而有所不同 Example 设Y 0 1 2 X 其中X与 相互独立 且E 0 Var 2 求E Y X 及Var Y X E Y X 0 E 1 2 X X E X 0 1X 2XE X E X 0 1X 2X 0 0 0 1XVar Y X E Y E Y X 2 X E 0 1 2 X 0 1X 2 X E 2 X 2 X E 2X 1 2 2 X 1 2X 2E 2 X 1 2X 2 2 注意 该例解释了为什么 的条件方差可能依赖X 事实上 上述过程可写为Y 0 1X 其中 1 2X 易知E Y X 0 1X 1 2X E X 0 1XVar Y X 1 2X 2Var X 1 2X 2 2 2 3线性回归模型LinearRegressionModeling 但总起来看 回归函数E Y X 的函数形式未知 Question HowtomodelE Y X 一 建立条件期望E Y X 的模型 总地说来 有 种最基本的方法 a 非参数法 Nonparametricapproach b 参数法 Parametricapproach 在经典计量经济学中 我们只关注参数方法 ByrestrictingtheclassoffunctionsF wesolvetheMSE minimizationproblem 特别地 我们通常只用一簇线性函数 linearfunctions 来近似g0 X 当然 可以用类似的方法来建立g0 X 的非线性回归模型 Nonlinearregressionmodels 对该簇函数 函数形式已知为线性 未知的是 k 1 1向量 注意 1 这里函数簇A的主要特征是g X X 关于 是线性的 关于X可以是非线性的 如g X 0 1X 2X2或g X 0 1lnX 2 关于参数 的取值没有约束 证明 求解最小化问题 根据一阶偏导为零的条件 设 满足上述一阶条件 则 E X Y X 0E XY E XX 0E XY E XX E XX 1E XY 注意 a 条件E Y2 保征E Y X 存在 b 非奇异矩阵 保证解 存在 c 一般地 最佳线性最小二乘预测值 thebestlinearLSpredictor g X X E Y X Question Whatistheinterpretationfor 在一元线性回归g X X 中 0 1 X 1 X1 Slope Intercept Why 验证 于是 由于 则 而 于是 可通过求解minE Y 0 1X1 2的方法解出 0 1 Definition LinearRegressionModel ThespecificationY X u Rk 1iscalledalinearregressionmodel whereuisthemodelregressiondisturbanceorregressionerror 注意 线性回归模型 linearregressionmodel 是人为定义的 因此 该模型可能没有包括真正的回归函数 regressionfunction g0 X E Y X 二 线性回归模型 Theorem 对线性回归模型Y X u以 代表最佳线性最小二乘解 bestlinearleastsquareapproximationcoefficient 则 当且仅当如下正交条件成立 E Xu 0 Proof 记u Y X 如果 则E Xu E XY E XX E XY E XX E XX 1E XY 0如果E Xu 0 则E Xu E XY E XX 0于是 E XX 1E XY 注意 1 无论E Y X 是否线性 我们总可以写出线性回归模型Y X u 并设定E Xu 0 以使 2 当X中包含有截距项时 如X1 1 E Xu 0就意味着E u 0 Why 3 E Xu 0与E u X 0不能等同 有E u X 0就有E Xu 0 但反之不成立 例如 设u 1 X与 为相互独立且服从标准正态分布N 0 1 的两随机变量 则E u X 1E Xu E X 1 E X E X E X E 0 4 当E u 0时 E Xu Cov X u Why 2 4模型的正确设定CorrectModelSpecification 对于被解释变量Y 最好的代表就是其条件期望E Y X 因此 线性模型中模型的正确设定就是关于条件期望的正确设定 Whatisthecharacterizationforcorrectmodelspecificationinmean Definition CorrectModelSpecificationinMean 线性回归模型Y X u Rk 1称为是关于E Y X 正确设定的 如果存在 0 Rk 1使得E Y X X 0 注意 1 如果对所有的 Rk 1 都有E Y X X 则认为该线性模型没有关于E Y X 正确设定 misspecified 2 如果一个线性模型是正确设定的 则参数 0称为是 真实参数 trueparameter 3 经济理论不能保证E Y X 的函数形式关于X是线性的 因此当解释参数的经济含义时应慎重 Theorem 如果线性模型Y X u关于E Y X 正确设定 则 a 存在 0使Y X 0 其中E X 0 b E X 0 c 0 注意 1 结论 a 意味着E Y X X 0 2 结论 c 意味着 在正交性条件下 最佳线性最小二乘近似解 beatlinearLSapproximationcoefficient 等于参数的真实值 0 b 由 a 知E X 0 从而易推出E X 0 c 由 b 知对模型Y X 0 成立正交性条件 因此 0 Proof a 由线性模型正确设定的定义 存在 0 Rk 1 使得E Y X X 0 另一方面 Y总可以写成Y E Y X 其中E X 0 结合该两方面 a 得证 Question WhathappensifthelinearregressionmodelY X uWhereE Xu 0 ismisspecifiedforE Y X Inotherwords whathappensifE Xu 0butE u X 0 ANS E Y X X E u X X 例 假设有如下真实的收入 消费关系Y 1 1 2 X1 1 4 X12 1 其中X与 相互独立且服从标准正态分布N 0 1 1 计算 条件均值E Y X1 Y关于X1的边际效应 d dx1 E Y X1 如果设定如下线性回归模型Y 0 1X1 u X u这里X 1 X1 2 寻找最佳最小二乘近似解 3 记u Y X 计算E

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论