第3章 双变量模型假设检验_第1页
第3章 双变量模型假设检验_第2页
第3章 双变量模型假设检验_第3页
第3章 双变量模型假设检验_第4页
第3章 双变量模型假设检验_第5页
已阅读5页,还剩56页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1Reviewofsimpleregressionmodel:estimationPopulationregressionmodel:E(Y|X)=b0+b1XYi=b0+b1Xi+uiSampleregressionmodel:“Linear”regressionLinearwithparameters2Estimationofsimpleregressionmodel:OLS3第3章双变量模型:假设检验Simpleregressionmodel:Inferencey=

b0+b1

x+u4目录3.1经典线性回归模型基本假设3.2

OLS估计量的方差与标准差3.3

OLS估计量的性质3.4

OLS估计量的分布3.5假设检验3.6判定系数:R23.7回归分析结果的报告3.8正态性检验3.9例子:简单工资决定模型3.10预测53.1经典线性回归模型的基本假设解释变量(X)与随机误差项(u)不相关。即cov(X,u)=0,如果X是非随机的,上述假定自动成立。随机误差项的均值为0,即E(u)=0平均来说,随机项的影响可以相互抵消,其实该假设只是为了便于处理。随机误差项同方差(homoscedasticity),即Var(ui)=s2,所以Var(Y|X)=var(b0+b1X

+u|X)=s2Var(Y)=var(b0+b1X

+u)=s26同方差性(Homoscedasticity)..x1x2E(y|x)=b0+b1xyf(y|x)7异方差(Heteroscedasticity).x

x1x2yf(y|x)x3..E(y|x)=b0+b1x83.1经典线性回归模型的基本假设随机误差项无自相关(noautocorrelation),又称序列相关,即Cov(ui,uj)=0forallij,等价于E(ui,uj)=0随机误差项服从正态分布,即u~N(0,s2)上述几条假设称为经典线性模型基本假设(CLRM)93.2OLS估计量的方差与标准差OLS估计量103.2OLS估计量的方差与标准差113.2OLS估计量的方差与标准差s2的估计量回归标准差(standarderroroftheregression)123.2OLS估计量的方差与标准差133.3

OLS估计量的性质Gauss-MarkovTheorem如果满足经典计量经济学模型基本假设,则在所有无偏估计量中,OLS估计量具有最小方差性;即OLS估计量是最优线性无偏估计量(BLUE)。线性:模型参数估计量是样本观察值的线性函数。143.3

OLS估计量的性质无偏性最小方差性:OLS估计量是所有无偏估计量中方差最小的估计量。153.4

OLS估计量的分布

首先,由于解释变量iX是确定性变量,随机误差项iu是随机性变量,因此被解释变量iY是随机变量,且其分布(特征)与iu相同。其次,0ˆb和1ˆb分别是iY的线性组合,因此0ˆb、1ˆb的概率分布取决于Y。在u是正态分布的假设下,Y是正态分布,因此0ˆb和1ˆb也服从正态分布,其分布特征(密度函数)由其均值和方差唯一决定。163.4

OLS估计量的分布经典模型假设ui~N(0,s2)X~N(a,s12),Y~N(b,s22),相互独立X+Y~N(a+b,s12+s22)因此,OLS估计量也服从正态分布173.4

OLS估计量的分布18例3.1在收入-消费支出例子中,参数估计及其标准差的计算如下19(64.1382)(0.0357)203.5假设检验在模型估计中,我们往往关注某些变量是否对被解释变量有关系,如果关系不大,我们估计出的参数应该比较小,接近于零。因此,在假设检验中,我们往往关注这样的原假设,H0:b1=0比如居民消费函数Y=

b0+b1X+u213.5假设检验223.5假设检验233.5假设检验243.5假设检验:例子(64.1382)(0.0357)253.5假设检验:例子263.5假设检验:例子事实上,我们可以进行其他形式的假设检验,不只是考虑为0的假设。比如:273.5假设检验:例子283.5假设检验:例子如果我们现在要检验斜率的标准差是否为0.03,我们将使用卡方分布。29SummaryfortheclassClassicallinearmodelassumption(CLM)Cov(X,u)=0E(Xu)=0E(u)=0Var(u)=s2,homoskedasticityCov(ui,uj)=0,noautocorrelationui~N(0,s2),normaldistributionGuass-MarkovTheorem:

OLSestimatesareBLUEunderCLMassumption.30VariancesandstanddeviationsofOLSestimates31EstimateofvariancesandstanddeviationsofOLSestimates32ThedistributionofOLSestimates333.6判定系数R2343.6判定系数R2353.6判定系数R2....eixy363.7回归分析结果的报告373.7回归分析结果的报告(STATA)383.7回归分析结果的报告(Eviews)393.8正态性检验我们CLM假设误差项服从正态分布,如果不服从正态分布,我们就无法推出OLS估计量的分布,也就无法进行假设检验。那么我们的数据是不是正太分布呢,有一些检验方法:残差直方图Jarque-Bera检验403.8正态性检验Jarque-Bera检验H0:变量服从正态分布。从上面的式子可以看出,如果为正态分布,则JB值为0。如果通过计算,JB值大于临界值c2a(2),则拒绝原假设,认为变量不服从正态分布。SK检验H0:变量服从正态分布。如果通过计算,JB值大于临界值c2a(2),则拒绝原假设,认为变量不服从正态分布。413.9例子:简单工资决定模型考虑两种形式的工资决定模型wage=b0+b1educ+ulog(wage)=b0+b1educ+u数据(wage1.raw)结果wâge=-0.905+0.541educ

(0.685)(0.053)[0.187][0.000]n=526,R2=0.1648Skewness=1.861Kurtosis=7.797JB=807.843

SK=212.55log(wâge)=0.583+0.083educ(0.097)(0.0076)[0.000][0.000]n=526R2=0.1853Skewness=0.268Kurtosis=3.586JB=13.811SK=11.80c20.05=5.99423.9例子:美国的进行支出模型我们考察1968-1987年间美国的进口支出(Y)(或购买外国商品,包括耐用品或非耐用品的支出等)与个人的可支配收入(X)之间的关系。凯恩斯的消费函数理论:个人的消费支出与个人可支配收入正相关。而对进口支出是对国外商品的消费支出,是总支出的一部分,所以我们预期美国的进口支出与个人可支配收入之间也会正相关。构建模型:Y=b0

+b1

X+u433.9例子:美国的进行支出模型yearyxyearyx1968135.71551.31978274.12167.41969144.61599.81979277.92212.61970150.91668.11980253.62214.31971166.21728.41981258.72248.61972190.71797.41982249.52261.51973218.21916.31983282.22331.91974211.81896.91984351.12469.81975187.91931.71985367.92542.81976229.920011986412.32640.91977259.42066.619874392686.3443.9例子:美国的进行支出模型453.9例子:美国的进行支出模型从散点图看,美国的进口支出(Y)与个人可支配收入(X)之间近似线性相关关系,因此我们前面假设的模型形式是合适的。即Y=b0

+b1

X+u参数的意义数学上:b1

是斜率,b0是截距。经济学:

b1是进口支出的边际消费倾向,即个人可支配收入每增加1美元,所增加的进口支出。如果b1

=0.25,表示个人可支配收入增加1美元,对国外商品的平均消费支出将增加0.25美元。根据经济理论,0<b1

<1。b0表示个人的支配收入为0时,对国外商品的平均消费支出。463.9例子:美国的进行支出模型473.9例子:美国的进行支出模型对回归结果的解释与我们的预期相同,进口支出(Y)与可支配收入(X)之间正相关。样本回归曲线的斜率为0.245,表示个人的可支配收入每增加1美元,对国外商品的需求支出将增加0.245美元。即对国外商品的边际消费倾向为0.245。同时,0.245<1,符合经济理论的要求。R2=0.9388,表示我们的样本回归模型对数据的拟合程度达到93.88%。即进口支出波动性的93.88%被我们的模型解释了,说明我们的模型是比较好的模型。注意:在实际估计中,并不是说R2越高越好,更重要的是看模型的参数估计是不是能够通过t检验和F检验(下一章内容)。483.9例子:美国的进行支出模型显著性检验下面,我们要检验我们的回归系数是不是显著的不为0。首先,对于斜率是否为0进行检验。容易计算出其t检验值为0.245/0.0148=16.616,给定显著性水平a=0.05,我们计算出双侧检验临界值t0.05/2(20-2)=2.101,对于本例,我们的斜率显著为不0。如果,我们考察的备选假设是斜率大于零,我们将使用右侧检验,侧给定a=0.05,我们的单侧临界值则为t0.05(20-2)=1.734,同样我们会拒绝原假设,认为我们的斜率是大于0的。我们可以计算出我们斜率的置信区间,给定置信水平1-a=0.95,有即0.2142

b1

0.2762493.10预测我们利用1968-1987年的数据,估计出了美国的进口支出模型,那么我们能不能对未来的进行支出进行预测呢?比如,我们知道1988年的美国的个人可支配收入为2800美元,那么它1988年的平均进口支出为多少呢?利用我们前面的估计模型,我们可以计算出Ŷ1988=-261.09+0.245×2800=425.556Ŷ1988在CLRM假设下,是E(Y1988|X)的无偏估计量,但存在预测误差。那么如何估计我们的预测误差呢,我们需要求出预测值的分布。在CLRM假设下,我们的预测值也是服从正态分布的,因此,我们计算出其均值和方差,则其分布也就得到了。下面,我们看如何求解其均值与方差。503.10预测513.10预测课本(6-58)丢掉平方523.10预测值的分布533.10预测值的分布543.10预测值的置信区间我们知道了Ŷ*的分布,则可以求解给定置信水平1-a下的置信区间,满足而对于每一个X,我们都可以计算出一个预测值Y,从而可以计算出其置信区间。从而我们可以得到针对整条总体回归线的真实平均值E(Y|X)的置信区间,或置信带。553.10预测值的置信区间:例子给定预测值的分布,我们可以计算1988年总体平均消费支出的置信水平为95%的置信区间(425.556-2.101*11.47,425.556+2.101*11.47)即(401.46,449.65)其中,自由度为20-2=18,5%显著性水平的双侧分位数ta/2=2.101如果我们求出总体回归曲线上的所有平均消费支出的置信区间,这些置信区间将组成一个置信带,见下文图。563.10预测值的置信区间:例子95%CI2800425.556401.46449.65从图上可以看出,置信带在处是最窄。而离样本均值点越远,置信区间会越宽,因此,我们进行预测时,X值不能离均值太远。Ŷ*=-261.09+0.245X57AnExample:DeterminantsofCollegeGPA(wooldridge,p128)Variables:colGPA,collegeGPAskipped,theaveragenumberoflecturesmissedperweekACT,achievementtestscorehsGPA,highschoolGPA58AnExample:DeterminantsofCollegeGPA(wooldridge,p128)1.高中成绩对大学成绩的影响colGPA=1.42+0.48hsGPA(0.3069)(0.0898)se.[4.61][5.67]t{0.000}{0.000}p-valuen=141fd=141-2=139R2=0.1719高中成绩每提高1分,大学成绩平均来说会增加0.48分。即高中学习好,大学成绩也不会太差。H0:b1=0H1:b1

0|T|=0.48/0.0898=5.67>ta/2(139)=1.96,拒绝原假设,说明在5%的水平下,高中成绩的高低显著影响大学成绩。置信区间为(0.30,0.66)59AnExample:DeterminantsofCollegeGPA(wooldridge,p128)高考成绩对大学成绩的影响colGPA=2.40+0.027ACT(0.2642)(0.0109)[9.10][2.49]{0.000}{0.014}n=141fd=141-

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论