已阅读5页,还剩34页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,第二章回归分析与模型设定,GeneralRegressionAnalysisandModelSpecification,.,回归分析(RegressionAnalysis):一种最常用的统计分析工具,用来分析一个变量关于其他变量的依赖关系。X与Y间的回归关系可用来研究X对Y的影响,或用X来预测Y。,一、总体均值与样本均值HowtofindtherelationshipbetweenXandY?理论上应寻找总体回归函数(PRF),即在给定X时,Y的条件均值的函数:Y|x=E(Y|X)=F(X),2.1回归分析:问题的引入egressionAnalysis:Introduction,.,但我们往往只能得到样本数据。因此自然想到用样本均值来估计总体均值,并寻找样本回归函数(SRF):mY|x=f(X),PRF,SRF,X,Y,WehopetheSRFisagoodestimateofthePRF.,.,Table2.1JointfrequencydistributionofX=incomeandY=savingrate,Asimpleillustration:howtofindthesamplemean,表2.1是1960年美国1027个家庭关于收入与储蓄率的联合频率分布.p(xi,yj)=theproportionofthe1027familieswhoreportedthecombination(X=xiandY=yj).,.,TheconditionalmeanofYgivenX=xiis,mY|X,ConditionalmeanfunctionofYonX,Fig2.1,.,同样地,如果可获得总体数据,我们就可得到给出X值时Y的总体条件均值(populationconditionalmeans),(xi,yi)=jointfrequenciesofthepopulation(xi)=j(xi,yi)=marginalfrequenciesofX(yj|xi)=(xi,yi)/(xi)=conditionalfrequenciesofYgivenXX=ixi(xi)=populationmeanofXY|X=jyi(yj|xi)=populationconditionalmeanofYgivenX,Y|x=E(Y|X)=F(X),mY|x=f(X),.,Question:howtogetf(x)?,如果经济理论表明:Y|x=+X但表2.1显示mY|X并非一条直线-我们是保持mY|X的原样呢?还是对样本的mY|X通过一条直线来平滑:m*Y|X=a+bX,-如果用平滑线,如何寻找该直线?-用平滑线估计总体均值,要比样本均值估计效果更好吗?,如果经济理论表明:Y|X=X-如何寻找该曲线(curve)?平滑的样本曲线m*Y|X仍能告知有关Y|X的相关信息吗?,.,二、条件分布,假设(X,Y)的联合概率密度函数(jointprobabilitydensityfunction,pdf)为f(x,y),则X的边际密度函数(marginalpdf):fX(x)=f(x,y)dyY在X=x的条件密度函数(conditionalpdf):fY|X(y|x)=f(x,y)/fX(x),条件pdffY|X(y|x)完全描述了Y对X的依赖关系。,.,已知条件pdf,可计算:,条件期望(Theconditionalmean),条件方差(Theconditionalvariance),条件偏度(Theconditionalskewness),条件峰度(Theconditionalkurtosis),.,2.2回归分析RegressionAnalysis,WhatstatisticalpropertiesdoesE(Y|X)process?,一、回归函数及其性质,定义RegressionFunction:称条件期望E(Y|X)为Y关于X的回归函数(regressionfunction)。,LemmaLawofiteratedexpectation:EE(Y|X)=E(Y),例:设Y=工资,X=1(女性)andX=0(男性),则E(Y|X=1)=女性员工平均工资E(Y|X=0)=男性员工平均工资,.,EE(Y|X)=P(X=1)E(Y|X=1)+P(X=0)E(Y|X=0)=全体平均工资=E(Y),Question:WhyisE(Y|X)importantfromastatisticalPerspective?假设我们希望使用X的函数g(X)来预测Y,且使用均方误(MeanSquareError,MSE)准则来评估g(X)逼近Y的程度.则均方误准则(MSEcriterion)下的最优预测就是条件期望E(Y|X).。,.,定义MSE:Themeansquareerroroffunctiong(X)usedtopridictYisdefinedasMSE(g)=EY-g(X)2,.,记g0(X)=E(Y|X)则MSE(g)=EY-g(X)2=EY-g0(X)+g0(X)-g(X)2=EY-g0(X)2+Eg0(X)-g(X)2+2EY-g0(X)g0(X)-g(X)=EY-g0(X)2+Eg0(X)-g(X)2=方差+偏误2方差测度了Y对其期望真实误差(trueerror)。偏误20,且g(X)=g0(X)时等号成立.因此,选择g(X)=E(Y|X)可使MSE(g)达到极小。,证明:使用方差与偏误平方分解技术,.,TheoremRegressionIdentity:给定E(Y|X),总有如下等价式:Y=E(Y|X)+=Y-E(Y|X)这里称为回归扰动项(regressiondisturbance)且满足E(|X)=0,证明:定义=Y-E(Y|X),则E(|X)=EY-E(Y|X)|X=E(Y|X)E(Y|X)=0,二、回归函数的等价形式,.,注意:,(a)回归函数E(Y|X)可用来通过X的信息预测Y的均值;(b)E(|X)=0意味着回归误差不包含X的任何可用来预测Y的信息。换言之,所有可用来预测Y期望值的信息都完全包含在E(Y|X)之中。条件E(|X)=0对模型参数经济含义的解释至关重要(crucial)。,.,(c)E(|X)=0意味着E()=EE(|X)=0且E(X)=EE(X|X)=EXE(|X)=EX0=0,(d)可能存在E(|X)=0但Var(|X)是X的函数。如果Var(|X)=20,称是条件同方差的(conditionalhomoskedasticity).否则,如果Var(|X)=2(X),称存在条件异方差(conditionalheteroskedastisity),注意:计量经济方法往往视是否存在条件异方差而有所不同。,.,Example:设Y=0+(1+2)X+其中X与相互独立,且E()=0,Var()=2。求E(Y|X)及Var(Y|X).,E(Y|X)=0+E(1+2)X|X+E(|X)=0+1X+2XE(|X)+E(|X)=0+1X+2X0+0=0+1XVar(Y|X)=EY-E(Y|X)2|X=E0+(1+2)X+-(0+1X)2|X=E(2X+)2|X=E(2X+1)22|X=(1+2X)2E(2|X)=(1+2X)22,.,注意:,该例解释了为什么的条件方差可能依赖X。事实上,上述过程可写为Y=0+1X+其中=(1+2X)易知E(Y|X)=0+1X+(1+2X)E(|X)=0+1XVar(Y|X)=(1+2X)2Var(|X)=(1+2X)22,.,2.3线性回归模型LinearRegressionModeling,但总起来看,回归函数E(Y|X)的函数形式未知。,Question:HowtomodelE(Y|X)?,.,一、建立条件期望E(Y|X)的模型,总地说来,有种最基本的方法:(a)非参数法(Nonparametricapproach)(b)参数法(Parametricapproach),在经典计量经济学中,我们只关注参数方法:ByrestrictingtheclassoffunctionsF,wesolvetheMSE-minimizationproblem,特别地,我们通常只用一簇线性函数(linearfunctions)来近似g0(X).当然,可以用类似的方法来建立g0(X)的非线性回归模型(Nonlinearregressionmodels),.,对该簇函数,函数形式已知为线性;未知的是(k+1)1向量.,.,注意:,(1)这里函数簇A的主要特征是g(X)=X关于是线性的。关于X可以是非线性的,如g(X)=0+1X+2X2或g(X)=0+1lnX(2)关于参数的取值没有约束。,.,证明:求解最小化问题,.,根据一阶偏导为零的条件,设*满足上述一阶条件,则,EX(Y-X*)=0E(XY)-E(XX*)=0E(XY)=E(XX)*=E(XX)-1E(XY),.,注意:,(a)条件E(Y2)保征E(Y|X)存在;(b)非奇异矩阵,保证解*存在。,(c)一般地,最佳线性最小二乘预测值(thebestlinearLSpredictor)g*(X)=X*E(Y|X).,.,Question:Whatistheinterpretationfor*?,在一元线性回归g(X)=X中,=(0,1),X=(1,X1)。,Slope:,Intercept:,Why?,验证,.,于是:,由于,则:,.,而,于是,可通过求解minE(Y-(0+1X1)2的方法解出*0,*1,.,DefinitionLinearRegressionModel:ThespecificationY=X+u,Rk+1iscalledalinearregressionmodel,whereuisthemodelregressiondisturbanceorregressionerror.,注意:线性回归模型(linearregressionmodel)是人为定义的。因此,该模型可能没有包括真正的回归函数(regressionfunction):g0(X)=E(Y|X),二、线性回归模型,.,Theorem:对线性回归模型Y=X+u以*代表最佳线性最小二乘解(bestlinearleastsquareapproximationcoefficient),则=*当且仅当如下正交条件成立:E(Xu)=0,Proof:记u=Y-X如果=*,则E(Xu)=E(XY)-E(XX)*=E(XY)-E(XX)E(XX)-1E(XY)=0如果E(Xu)=0,则E(Xu)=E(XY)-E(XX)=0于是:=E(XX)-1E(XY)=*,.,注意:,(1)无论E(Y|X)是否线性,我们总可以写出线性回归模型Y=X+u,并设定E(Xu)=0,以使=*;(2)当X中包含有截距项时(如X1=1),E(Xu)=0就意味着E(u)=0。(Why?)(3)E(Xu)=0与E(u|X)=0不能等同。有E(u|X)=0就有E(Xu)=0,但反之不成立。例如:设u=1+,X与为相互独立且服从标准正态分布N(0,1)的两随机变量,则E(u|X)=1E(Xu)=E(X1)+E(X)=E(X)+E(X)E()=0(4)当E(u)=0时,E(Xu)=Cov(X,u)(Why?),.,2.4模型的正确设定CorrectModelSpecification,对于被解释变量Y,最好的代表就是其条件期望E(Y|X),因此,线性模型中模型的正确设定就是关于条件期望的正确设定。,Whatisthecharacterizationforcorrectmodelspecificationinmean?,DefinitionCorrectModelSpecificationinMean:线性回归模型Y=X+u,Rk+1称为是关于E(Y|X)正确设定的,如果存在0Rk+1使得E(Y|X)=X0,.,注意:,(1)如果对所有的Rk+1,都有E(Y|X)X,则认为该线性模型没有关于E(Y|X)正确设定(misspecified);(2)如果一个线性模型是正确设定的,则参数0称为是“真实参数”(trueparameter);(3)经济理论不能保证E(Y|X)的函数形式关于X是线性的。因此当解释参数的经济含义时应慎重。,.,Theorem:如果线性模型Y=X+u关于E(Y|X)正确设定,则(a)存在0使Y=X0+,其中E(|X)=0(b)E(X)=0(c)*=0,注意:(1)结论(a)意味着E(Y|X)=X0(2)结论(c)意味着,在正交性条件下,最佳线性最小二乘近似解(beatlinearLSapproximationcoefficient)*等于参数的真实值0。,.,(b)由(a)知E(|X)=0,从而易推出E(X)=0;,(c)由(b)知对模型Y=X0+成立正交性条件,因此0=*,Proof:(a)由线性模型正确设定的定义,存在0Rk+1,使得E(Y|X)=X0;另一方面,Y总可以写成Y=E(Y|X)+,其中E(|X)=0。结合该两方面,(a)得证。,.,Question:WhathappensifthelinearregressionmodelY=X
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年盐城工业职业技术学院单招职业技能测试必刷测试卷新版
- 2026年山东力明科技职业学院单招职业适应性考试必刷测试卷及答案1套
- 2026年辽宁省营口市单招职业倾向性测试题库附答案
- 2026年濮阳职业技术学院单招职业技能测试必刷测试卷必考题
- 建筑工地安全生产责任制解读
- 2026年上海电机学院单招职业倾向性考试题库新版
- 2026年贵州工程职业学院单招职业倾向性测试必刷测试卷及答案1套
- 商业地产物业管理服务方案
- 2026年上饶幼儿师范高等专科学校单招职业技能考试题库及答案1套
- 2026年浙江工贸职业技术学院单招职业技能考试题库及答案1套
- 第13课 东汉的兴衰 课件 初中历史统编版(2024)七年级上册
- 《思想道德与法治》课件-第一章 领悟人生真谛 把握人生方向
- 2025-2030中国手套箱行业市场发展趋势与前景展望战略分析研究报告
- 谷丙转氨酶升高的临床意义
- 粮食仓库建设标准
- 诊所合伙经营合同范本
- 《市场调查与分析说》课件
- 啤酒厂筹建项目可行性研究报告
- 展会活动中如何提高观众的参与度与满意度研究报告
- 晚秋和值谜字谜
- K12教培咨询师培训
评论
0/150
提交评论