第3章+双变量模型-假设检验(2).ppt_第1页
第3章+双变量模型-假设检验(2).ppt_第2页
第3章+双变量模型-假设检验(2).ppt_第3页
第3章+双变量模型-假设检验(2).ppt_第4页
第3章+双变量模型-假设检验(2).ppt_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

小结:一元线性回归模型的参数估计,利用参数的普通最小二乘估计(OLS),要估计一元线性回归模型:,普通最小二乘法:残差的平方和最小。,参数估计量的计算公式为:,选取一组样本观测值(Xi,Yi)(i=1,2,n),求样本回归函数,尽可能好地拟合这组值.,小结:用EXCEL和Eviews实现最小二乘法,1、用“EXCEL实现最小二乘法”:利用菜单中“工具数据分析回归”,说明:男生的数学分数每增加1分,平均而言,其词汇将增加1.64分,-380.479没有什么实际意义。,小结:用EXCEL和Eviews实现最小二乘法,2、用“Eveiws实现最小二乘法”:在菜单中“QuickEstimakeEuqation”对话框中输入:“YCX”,说明:男生的数学分数每增加1分,平均而言,其词汇将增加1.64分,-380.479没有什么实际意义。,3.4一元线性回归模型的统计检验,回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。,在一次抽样中,估计值不一定就等于该真值,但如果有足够多的重复抽样,参数的估计值的期望(均值)就等于其总体的参数真值。,问题:怎样判别样本回归函数确实是真实的总体回归函数的一个好的估计量?,那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。,主要包括拟合优度检验、变量的显著性检验及参数的区间估计。,一、拟合优度检验:判定系数R2,拟合优度检验:是对样本回归直线与样本观测值之间拟合程度的检验。显然若观测点离回归直线近,则拟合程度好;反之则拟合程度差。度量拟合优度的指标:判定系数(或可决系数)R2,问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度?,1、总离差平方和的分解,已知由一组样本观测值(Xi,Yi),i=1,2,n得到如下样本回归直线,如果Yi=i即实际观测值落在样本回归“线”上,则拟合最好。此时可认为。,称为回归差,称为残差,残差越小,拟合越好!,离差=回归差+残差,对于所有样本点,则需考虑这些点与样本均值离差的平方和,很惊奇的结论:,记,总平方和(TotalSumofSquares),解释平方和(ExplainedSumofSquares),残差平方和(ResidualSumofSquares),总平方和TSS=解释平方和ESS+残差平方和RSS,离差=回归差+残差,在给定样本中,TSS不变,如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此,TSS=ESS+RSS,拟合优度用,来表示,判定系数,2、判定系数R2统计量,用来检验模型的拟合程度,称R2为(样本)判定系数,判定系数R2的性质(1)非负性(2)判定系数的取值范围0,1,根据上述关系,令,R2的值越接近1,说明实际观测点离样本线越近,回归直线对观测值的拟合程度越好;R2的值越接近0,说明回归直线对观测值的拟合程度越差。,3、R2的三个计算公式(P135-136),(1)R2可由下述计算公式给出:,(2)在实际计算判定系数时,若b2已经估计出后,则R2可由下述计算公式给出:,(3)由两变量的相关系数计算:,在第6章引例的收入-消费支出中,R2最大是1,因而0.9766已经是很大的了,说明收入变量解释了消费支出中的97.66%,可以认为样本回归线很好地拟合了总体回归函数。,注:判定系数是一个非负的统计量。它也是随着抽样的不同而不同。为此,对可决系数的统计可靠性也应进行检验,这将在后面章节中进行。,家庭可支配收入-消费支出EXCEL结果,se=(98.4060)(0.0425),说明收入变量解释了消费支出中的97.66%,可以认为样本回归线很好地拟合了总体回归函数。,家庭可支配收入-消费支出Eviews结果,se=(98.4060)(0.0425),说明收入变量解释了消费支出中的97.66%,可以认为样本回归线很好地拟合了总体回归函数。,二、变量的显著性检验,当得到回归参数的估计值后,所关心的就是解释变量与被解释变量之间是否真的存在回归关系。在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验。,变量的显著性检验所应用的方法是数理统计学中的假设检验。计量经济学中,主要是针对变量的参数真值是否为零来进行显著性检验的。,即主要是检验B2是否为零。通常用样本计算的b2的值不等于零,但用它来检验在统计是否存在B2显著为0。,1、变量的显著性检验(双边检验),(1)B2的显著性检验,对于一元线性回归方程中的b2,已经知道它服从正态分布,由于真实的s2未知,在用它的无偏估计量s2替代时,可构造如下统计量:,B2的显著性检验步骤:,1)对总体参数提出假设H0:B2=0,H1:B20,2)以原假设H0构造t统计量,并由样本计算其值,3)给定显著性水平,查t分布表,得临界值t/2(n-2)(或求t2的伴随概率),4)比较,判断,若|t2|t/2(n-2),,则拒绝H0,接受H1;即B20,若|t2|t/2(n-2),,则拒绝H1,接受H0;即B2=0,对于一元线性回归方程检验B1是否为零的过程如下:,(2)B1的显著性检验,1)给出原假设和备择假设:,2)此检验为双侧检验。所用统计量是t。在H0成立条件下:,H0:B1=0;H1:B10,3)给定显著性水平,查t分布表,得临界值t/2(n-2)(或求t2的伴随概率),4)比较,判断若|t1|t/2(n-2),则拒绝H0,接受H1;即B10若|t1|t/2(n-2),则拒绝H1,接受H0;即B1=0,在上述家庭可支配收入-消费支出例中,t统计量的计算结果分别为:,给定显著性水平=0.05,查t分布表得临界值t0.05/2(10-2)=2.306,提示:可通过EXCEL求临界值t0.05/2(10-2)=TINV(0.05,8)=2.306,|t2|2.306,说明拒绝原假设,即B20,家庭可支配收入在95%的置信度下显著,即收入是消费支出的主要解释变量;|t1|Z1-a/2拒绝原假设,|Z|0,3)给定显著性水平,查t分布表,得单边临界值t(n-2)t(n-2)=TINV(2,n-2),4)比较,判断若t2t(n-2)(或2p),则接受H0,拒绝H1;,2)以原假设H0构造t统计量,并由样本计算其值,在上述收入-消费支出例中,t统计量的计算结果分别为:,给定显著性水平=0.05,查t分布表得单边临界值t0.05(10-2)=1.860,提出假设H0:B20,H1:B20,若问:家庭可支配收入对消费支出是否有正向影响?,t21.860,说明拒绝原假设,家庭可支配收入在95%的置信度下对消费支出有正向影响;,提示:也可通过EXCEL求:t0.05(10-2)=TINV(0.1,8)=1.860,家庭可支配收入-消费支出EXCEL单边检验,在95%的置信度下,拒绝原假设,即在95%的置信度下对消费支出有正向影响;,家庭可支配收入-消费支出Eviews单边检验,在95%的置信度下,拒绝原假设,即在95%的置信度下对消费支出有正向影响;,家庭可支配收入-消费支出回归分析报告,利用一样本估计的可支配收入-消费支出的回归结果为:,se=(98.4060)(0.0425),此结果的优点是:可以一目了然地看到每个估计系数是否是统计显著的,即是否显著不为零,通过列出的p值能够确定t检验值的精确显著水平,将其与预期的显著水平比较,即可作出接受或拒绝的结论。,t=(-1.048)(18.29)R2=0.9766,p=(0.3251)(0.0000)df=8,讨论,考虑下面的回归方程:,se=(10.7509)(),完成空缺,如果a=5%,能否接受原假设:真实的B2=0?用单边检验还是双边检验?,t=()(18.73)R2=0.9460n=20,解:因为,拒绝原假设,假设检验可以通过一次抽样的结果检验总体参数可能的假设值(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数检验的置信区间估计。,三、参数的置信区间,则称这个区间为参数B的置信区间;1-称为置信系数,称为显著性水平,置信区间的端点称为置信限或临界值,如果存在这样一个区间,使得B落在这个区间上的概率为1-a,即,置信上限,置信下限,置信区间,1、一元线性模型中,Bi(i=1,2)的置信区间:,在变量的显著性检验中已经知道:,意味着存在临界值ta/2,使得:,即,置信区间,置信上限,置信下限,于是得到(1-)的置信度下,Bi的置信区间是,在上述收入-消费支出例中,如果给定=0.01,查表得:,由于,于是,B2的置信区间分别为:(0.6345,0.9195)由于B2的置信区间不包含0,所以拒绝B2为0的假设,变量显著,结论与变量的显著性检验相同,B1的置信区间分别为:(-433.32,226.98)由于B1的置信区间包含0,所以接受B1为0的假设。,可支配收入-消费支出EXCEL区间估计,于是,B2的99%置信区间分别为:(0.6345,0.9195),B1的99%置信区间分别为:(-433.32,226.98),由于B2的置信区间不包含0,所以拒绝B2为0的假设,变量显著,由于B1的置信区间包含0,所以接受B1为0的假设,注:eviews不能直接给出置信区间,需要计算,由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。,要缩小置信区间,需(1)增大样本容量n,因为在同样的置信水平下,n越大,t分布表中的临界值越小;同时,增大样本容量,还可使样本参数估计量的标准差减小;(2)提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型拟合优度越高,残差平方和应越小。,四、正态性检验,前面进行的统计回归及检验是建立在误差项ui服从正态分布的基础上,由于不能直接观察到真实的误差项,那么如何证实误差项确实服从正态分布呢?,虽然得不到误差项ui,但可以得到误差项ui的替代量残差ei,因此能够通过ei来获取ui的正态性检验。方法有多种,这里介绍几种较为简单的方法。,1、残差直方图,残差直方图是用于获知随机变量ei概率分布密度函数形状的一种简单图形。,在实践中,常常通过回归残差的直方图粗略地了解其概率分布的形状。,在EXCEL中可直接画出残差图。,在Eviews中画残差表可调用下述指令,在回归结果表中选择“viewActualFittedResidualActualFittedResidualTable”,出现实际值、估计值、残差的图。,在Eviews中画综合图可调用下述指令,在回归结果表中选择“viewActualFittedResidualActualFittedResidualGraph”,出现实际值、估计值、残差的图。,在Eviews中画残差图可调用下述指令,在回归结果表中选择“viewActualFittedResidualResidualGraph”,出现实际值、估计值、残差的图。,2、雅克-贝拉检验,现在常用的是雅克-贝拉检验,许多软件包括了这种检验方法。它是建立在OLS基础上的一种渐近(或大样本)检验方法。,雅克-贝拉检验的统计量为:,在正态性假设下,上式服从自由度为2的c2分布。,如果在选定的显著水平下,求出相应的c2临界值,用上述统计量值与临界值做比较,做出接受或拒绝的判断。,首先计算出随机变量的偏度系数S和峰度系数K。对于正态分布变量,偏度为0,峰度为3。,设雅克-贝拉检验的原假设和对立假设为:H0:误差项服从正态分布,H1:误差项不服从正态分布,在Eviews中雅克-贝拉检验指令:,在“回归结果表”中选择“ProcsMakeResidualSeries”,出现对话框后单击OK。出现残差变量表。,在“残差变量表”中选择“ViewDescriptiveStatisticsHistogramandStart”,残差直方图和JB统计结果。,Eviews的雅克-贝拉检验结果,由表中可知JB=1.1939,伴随概率p=0.55050.05,接受原假设,即误差项服从正态分布。,五、双变量模型的应用:预测问题,回归的目的之一是根据解释变量的值预测被解释变量的均值。预测分为事后预测和事前预测。,对于事后预测,被解释变量和解释变量的值在预测区间都是已知的。可以直接用实际发生值评价模型的预测能力。对于事前预测,解释变量是未发生的(当模型中含有滞后变量时,解释变量则有可能是已知的)。当预测被解释变量时,则首先应该预测解释变量的值。对于解释变量的预测,通常采用时间序列模型。,(一)单个Y0的点预测,对于一元线性回归模型,给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值0,可以以此作为其条件均值E(Y|X=X0)或个别值Y0的一个近似估计。,注意:严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因:(1)参数估计量不确定;(2)随机项的影响,E(Y|X=X0)0,Y00,(二)总体条件均值与单个Y0预测值的置信区间,1、总体均值预测值的置信区间,由于,且,则,于是,在1-的置信度下,总体均值E(Y|X0)的置信区间为,将未知的s2代以它的无偏估计量s2,可构造t统计量,2、单个Y0预测值的预测区间,由Y0=b1+b2X0+知:,于是,式中:,从而在1-的置信度下,Y0的置信区间为,将未知的s2代以它的无偏估计量s2,可构造t统计量,在上述收入-消费支出例中,得到的样本回归函数为,则在X0=1000处,0=103.172+0.7771000=673.84,而,同样地,对于Y在X=1000的个体值,其95%的置信区间为:673.84-2.306130.8789Yx=1000673.84+2.306130.8789或(372.03,975.65),总体回归函数的置信带(域)(confidenceband)个体的置信带(域),因此

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论