计量经济学第4章1-多元线性回归41-课件_第1页
计量经济学第4章1-多元线性回归41-课件_第2页
计量经济学第4章1-多元线性回归41-课件_第3页
计量经济学第4章1-多元线性回归41-课件_第4页
计量经济学第4章1-多元线性回归41-课件_第5页
已阅读5页,还剩167页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章多元线性回归模型学习目标

知识目标:了解多元线性回归模型的基本假设、掌握其估计方法以及检验程序。技能目标:在其计算过程中充分利用进行计算,通过本章的学习熟练地掌握了和运用,尤其是对中矩阵逆及相乘的运算。能力目标:会建立多元线性回归模型,会对多元线性回归模型进行估计、统计检验并进行经济预测。拿出一个案例能够独立的对其进行模型设定、参数估计、统计检验和预测。第4章多元线性回归模型学习目标1第4章多元线性回归模型§4.1多元线性回归模型及假定§4.2多元线性回归模型的参数估计§4.3多元线性回归模型的统计检验§4.4多元线性回归模型的置信区间§4.5受约束回归§4.6案例分析第4章多元线性回归模型§4.1多元线性回归模型及假定2§4.1多元线性回归模型及假定4.1.1多元线性回归模型4.1.2多元线性回归模型的若干假定§4.1多元线性回归模型及假定4.1.1多元线性回归34.1.1多元线性回归模型多元线性回归模型的一般形式其中k是解释变量的数目。4.1.1多元线性回归模型多元线性回归模型的一般形式4给定样本则上述模型表示为给定样本则上述模型表示为5几何意义:代数意义:经济意义:与存在线性关系,后者是前者的重要解释变量;与存在线性关系;表示一个多维平面。几何意义:代数意义:经济意义:与存在线性关系,后者是前者的重6多元总体回归函数该函数又称为条件期望函数,表明在给定下的分布的(总体)均值与存在着函数关系。多元线性回归模型表示的n个随机方程的矩阵表达式多元总体回归函数该函数又称为条件期望函数,表7其中其中8样本回归函数用来估计总体回归函数其随机表示式ei称为残差或剩余项,可看成是总体回归函数中随机扰动项ui的近似替代。或其中:样本回归函数的矩阵表达:样本回归函数用来估计总体回归函数其随机表示式94.1.2多元线性回归模型的若干假定假定1解释变量是非随机的,即在重复抽样中,解释变量取固定值,且相互之间互不相关(无多重共线性)。假定2随机干扰项与解释变量之间不相关。4.1.2多元线性回归模型的若干假定假定1解释变量是10假定3随机干扰项服从零均值,同方差,零协方差。假定4随机干扰项服从正态分布。假定5正确设定回归模型。(1)选择了正确的变量进入模型;(2)对模型的形式进行正确的设定;(3)对模型的解释变量、被解释变量以及随机干扰项做了正确的假定。上述假定条件称为多元线性回归模型的经典假定。在本章,我们假定以上条件都成立。假定3随机干扰项服从零均值,同方差,零协方差。假定411§4.2多元线性回归模型的参数估计4.2.1普通最小二乘法4.2.2极大似然法估计4.2.3参数估计量的性质§4.2多元线性回归模型的参数估计4.2.1普通最小124.2.1普通最小二乘法1.普通最小二乘估计利用最小二乘法估计模型的参数,同样应该使残差平方和达到最小,即取最小值。根据多元函数的极值原理,可得如下方程组:4.2.1普通最小二乘法1.普通最小二乘估计13写成矩阵形式为:式和式叫做正规方程组。由式可得这就是向量的OLS估计值。写成矩阵形式为:式和式142.随机干扰项方差估计值的普通最小二乘估计可以证明:随机干扰项的方差的无偏估计为2.随机干扰项方差估计值的普通最小二乘估计可以证154.2.2极大似然法估计这种估计思想认为,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使从模型中抽取该n组样本观测值的概率最大。将样本观测值联合概率函数称为似然函数,通过似然函数极大化以求得总体参数估计量的方法被称为极大似然法。4.2.2极大似然法估计这种估计思想认为,当从16对于多元线性回归模型Yi的概率函数为对于多元线性回归模型Yi的概率函数为17Yt是相互独立的,所以Yt是随机抽取的n组样本观测值的联合概率,即似然函数为Yt是相互独立的,所以Yt是随机抽取的n组样本观测值的联合18由于lnL是单调函数,所以使其极大的参数值也将使L极大。求使对数似然函数极大的参数值,可得:由于lnL是单调函数,所以使其极大的参数值也将使194.2.3参数估计量的性质

1.线性性参数估计量是线性估计量,即是随机变量Y的线性函数。显然,参数估计量是随机变量Y的线性函数,所以是线性估计量。4.2.3参数估计量的性质1.线性性参202.无偏性所以,2.无偏性所以,213.最小方差性是单位矩阵,3.最小方差性是单位矩阵,224.随机误差项方差估计量的性质由于被解释变量的估计值与观察值之间的残差由于所以残差平方和为

所以4.随机误差项方差估计量的性质由于被解释变量的估计值与观察23随机误差项方差的估计量为

随机误差项方差的估计量为24例4-1经过研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水平有关。现对某地区18名学生进行调查,得到样本数据如表4-1所示,其中Y表示购买书籍及课外读物(元/年),X1表示学生受教育年限,X2表示家庭月可支配收入(元/月)。下面我们估计学生购买书籍及课外读物的支出与受教育年限、家庭月可支配收入之间的线性关系。例4-1经过研究发现,学生用于购买书籍及课外读物的支出与本25回归线性模型设定如下用矩阵表示为:回归线性模型设定如下用矩阵表示为:26估计的回归模型表示为估计的回归模型表示为27计量经济学第4章1-多元线性回归41-课件28§4.3多元线性回归模型的统计检验4.3.1模型的拟合优度检验4.3.2回归方程的显著性检验4.3.3变量的显著性检验§4.3多元线性回归模型的统计检验4.3.1模型的294.3.1模型的拟合优度检验1.

R2检验(1)总离差平方和的分解有k个解释变量的多元线性回归模型对应的回归方程为将Yi与其平均值之间的离差分解如下:4.3.1模型的拟合优度检验1.R2检验(1)总离差30将Yi与其平均值之间的离差分解如下:总离差平方和回归平方和残差平方和

将Yi与其平均值之间的离差分解如下:总离差平方和回31即总离差平方和分解为回归平方和与残差平方和两部分。即总离差平方和分解为回归平方和与残差平方和两32(2)多元样本决定系数R2与拟合优度检验多元样本决定系数因为所以总有

R2的数值越接近1,表明Y中总离差平方和中可由样本回归线解释的部分越大,残差平方和越小,样本回归线与样本观测值的拟合程度越高;反之则拟合得越差。

R2作为度量回归值对样本观测值Yi拟合优度的指标,显然其数值越接近1越好。(2)多元样本决定系数R2与拟合优度检验多元样本决定系数因为33在例4-1中,计算可得在例4-1中,计算可得34(3)修正样本决定系数的大小与模型中解释变量的数目有关,解释变量的个数越多,它的值就越大,在实际运用中需要对其进行调整。

调整的思想是将残差平方和与总离差平方和之比的分子分母分别用各自的自由度去除,变成均方差之比,以剔除解释变量个数对拟合优度的影响。于是,修正的样本决定系数为(3)修正样本决定系数的大小与模型中解释变量35调整的可决系数与未经调整的可决系数之间存在如下关系:其中,n是样本观测值的个数,k是解释变量的个数。调整的可决系数与未经调整的可决系数之间存在如下关36在实际应用中,或R2究竟要多大才算模型通过了检验,没有绝对的标准,要视具体情况而定。在例4-1中,

拟合优度并不是评价模型优劣的唯一标准必须对回归方程和模型中各参数的估计量作进一步的显著性检验在实际应用中,或R2究竟要多大才算372.赤池信息准则和施瓦茨准则赤池信息准则(AIC)施瓦茨准则(SC)这两个准则均要求仅当所增加的解释变量能够减少AIC值或SC值时才在原模型中增加该解释变量。2.赤池信息准则和施瓦茨准则赤池信息准则(AIC)施瓦茨准38估计结果显示:某地区学生购买书籍及课外读物的支出二元例中建立某地区学生购买书籍及课外读物的支出一元例中从这点看,可以说家庭月可支配收入应包含在模型中。估计结果显示:某地区学生购买书籍及课外读物的支出二394.3.2回归方程的显著性检验1.回归方程的显著性检验回归方程的显著性检验是指在一定的显著性水平下,从总体上对模型中被解释变量与解释变量之间的线性关系是否显著成立而进行的一种统计检验。4.3.2回归方程的显著性检验1.回归方程的显著性检验40检验的原假设与备择假设分别为检验的思想来自于总离差平方和的分解式:

ESS是解释变量的联合对被解释变量的线性作用的结果,可通过该比值ESS/RSS的大小对总体线性关系进行推断。

检验的原假设与备择假设分别为检验的思想来自于总离差平方和的分41根据数理统计学中的定义,在H0成立的条件下,构造一个统计量:它服从自由度为(k,n-k-1)的F分布。

给定一个显著性水平,查分布表,得到一个临界值F(k,n-k-1)。根据数理统计学中的定义,在H0成立的条件下,构42如果发生F

F(k,n-k-1)

,则在1-水平下拒绝原假设,即模型的线性关系显著成立,模型通过方程显著性检验。如果未发生F

F(k,n-k-1)则在1-水平下接受原假设,即模型的线性关系显著不成立,模型未通过方程显著性检验。如果发生FF(k,n-k-1),则在143在例4-1中,检验的原假设与备择假设分别为所以结论是拒绝原假设,即Y与X1,X2

存在线性回归关系。在例4-1中,检验的原假设与备择假设分别为442.拟合优度检验与方程总体线性的显著性检验之间的关系F检验可用于度量总体回归直线的显著性,也可用于检验的显著性。2.拟合优度检验与方程总体线性的显著性检验之间454.3.3

显著性检验1.解释变量的显著性检验解释变量的显著性检验,是指在一定的显著性水平下,检验模型的解释变量是否对被解释变量有显著影响的一种统计检验。4.3.3显著性检验1.解释变量的显著性检验46检验的原假设与备择假设分别为构造如下的t

检验统计量检验的原假设与备择假设分别为构造如下的t检验统计量472.t检验的步骤(1)提出假设。(2)计算t

统计量。(3)查临界值t/2(n-k-1)。(4)判断。若|t|

t/2(n-k-1),则在1-水平下接受原假设,即Xj对应的解释变量j是不显著的。若|t|

t/2(n-k-1),则在1-水平下拒绝原假设,即Xj对应的解释变量j是显著的;2.t检验的步骤(1)提出假设。若|t|48

t1和t2分别大于临界值t0.025(15)=2.13,所以拒绝零假设,表明Xi1和Xi2对于Yi都是重要解释变量,应保留在模型中。在例4-1中,t1和t2分别大于临界值t0.025(15)49§4.4多元线性回归模型的置信区间4.4.1点估计值4.4.2参数估计量的置信区间4.4.3预测值的置信区间§4.4多元线性回归模型的置信区间4.4.1点估计值50§4.4多元线性回归模型的置信区间4.4.1点估计值

点估计值就是求解释变量对应的被解释变量Y的估计值。预测值与实际值Y之间存在的误差为§4.4多元线性回归模型的置信区间4.4.1点估计值514.4.2参数估计量的置信区间要判断样本参数的估计值在多大程度上可以近似地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的区间来考察它以多大的概率包含着真实的参数值。这种方法就是参数检验的置信区间估计。4.4.2参数估计量的置信区间要判断样本参52t分布的分布曲线对称于纵坐标轴,所以在给定的置信水平1-下,我们选取对称于原点的区间即使得t分布的分布曲线对称于纵坐标轴,所以在给定的置53于是得到参数估计量j的置信水平为1-的置信区间为于是得到参数估计量j的置信水平为1-的置信544.4.3预测值的置信区间1.

E(Y0)的预测区间4.4.3预测值的置信区间1.E(Y0)的预测区间55将随机干扰项的方差用其无偏估计量代替,可构造如下t统计量:于是,得到置信度为1-下的E(Y0)的置信区间:将随机干扰项的方差用其无偏估计量562.

Y0的预测区间设e0是实际预测值Y0与预测值之差:2.Y0的预测区间设e0是实际预测值Y0与预测值之57e0的标准差估计值其中构造t统计量e0的标准差估计值其中构造t统计量58于是,对于给定的置信水平1-,预测值Y0的置信区间为于是,对于给定的置信水平1-,预测值Y0的置信59

在实际应用中,我们希望置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?通常可以通过以下途径来实现:

(1)增大样本容量n。(2)提高模型的拟合优度,如果模型完全拟合样本观测值,残差平方和为0,则置信区间也为0。

(3)提高样本观测值的分散度。在一般情况下,样本观测值越分散,作为的分母的的值越大,使得区间缩小。在实际应用中,我们希望置信水平越高越好,置信区间60§4.5受约束回归4.5.1模型参数的线性约束4.5.2对回归模型增加或减少解释变量4.5.3参数的稳定性§4.5受约束回归4.5.1模型参数的线性约束61在建立回归模型时,有时根据经济理论需要对模型中变量的参数施加一定的约束条件。如:0阶齐次性条件的消费需求函数

1阶齐次性条件的C-D生产函数模型施加约束条件后进行回归,称为受约束回归;

不加任何约束的回归称为无约束回归。在建立回归模型时,有时根据经济理论需要对模型中变624.5.1模型参数的线性约束对模型施加约束得或如果对式回归得出参数的估计结果则由约束条件可得:4.5.1模型参数的线性约束对模型施加约束得或如果对式63

然而,对所考查的具体问题能否施加约束?需进一步进行相应的检验。常用的检验有:F检验、检验与t检验,下面主要介绍F检验然而,对所考查的具体问题能否施加约束?需进一步进64在同一样本下,记无约束样本回归模型为受约束样本回归模型为于是受约束样本回归模型的残差平方和RSSR在同一样本下,记无约束样本回归模型为受约束样本回归模型为于是65由式RSSR

RSSU从而

ESSRESSU受约束样本回归模型的残差平方和RSSR于是为无约束样本回归模型的残差平方和RSSU这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。由式RSSRRSSU66

但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSSR

RSSU的差异变小。可用RSSR-RSSU的大小来检验约束的真实性。但是,如果约束条件为真,则受约束回归模型与无约束回67根据数理统计学的知识:于是:根据数理统计学的知识:于是:68如果约束条件无效,RSSR

与RSSU的差异较大,计算的F值也较大。于是,可用计算的F统计量的值与所给定的显著性水平下的临界值作比较,对约束条件的真实性进行检验。其中,kU,kR分别为无约束与受约束回归模型的解释变量的个数(不包括常数项),kU-kR恰为约束条件的个数。如果约束条件无效,RSSR与RSSU的差69例4-2柯布—道格拉斯生产函数,试根据美国金属行业1901-1927年数据,检验规模效益不变的约束条件:。(1)无约束回归模型例4-2柯布—道格拉斯生产函数70(2)有约束回归模型得到的约束回归和无约束回归的残差平方和分别为(2)有约束回归模型得到的约束回归和无约束回归的残差平方71(3)检验原假设所以故受原假设,支持规模收益不变的假设。(3)检验原假设所以故受原假设,支持规模收益不变的假724.5.2对回归模型增加或减少解释变量考虑如下两个回归模型式可以看成是式的受约束回归:4.5.2对回归模型增加或减少解释变量考虑如下两个回归73相应的F统计量为:

F统计量的另一个等价式相应的F统计量为:F统计量的另一个等价式74如果约束条件为真,即额外的变量Xk+1,…,Xk+q对Y没有解释能力,则F统计量较小;否则,约束条件为假,意味着额外的变量对Y有较强的解释能力,则F统计量较大。因此,可通过F的计算值与临界值的比较,来判断额外变量是否应包括在模型中。如果约束条件为真,即额外的变量Xk+1,…,754.5.3参数的稳定性对于时间序列数据,因变量和解释变量之间的关系可能会发生结构变化,这可能是由经济系统的需求或供给冲击带来的,也可能是制度转变的结果。建立模型时往往希望模型的参数是稳定的,即所谓的结构不变,这将提高模型的预测与分析功能。如何检验?4.5.3参数的稳定性对于时间序列数据,因变量761.邹氏参数稳定性检验假设需要建立的模型为在两个连续的时间序列(1,2,…,n1)与(n1+1,…,n1+n2)中,相应的模型分别为

合并两个时间序列为(1,2,…,n1,n1+1,…,n1+n2),则可写出如下无约束回归模型1.邹氏参数稳定性检验假设需要建立的模型为在两个连续的时77如果=,表示没有发生结构变化,因此可针对如下假设进行检验:H0:=式施加上述约束后变换为受约束回归模型如果=,表示没有发生结构变化,因此可78因此,检验的F统计量为因此,检验的F统计量为79记RSS1与RSS2为在两时间段上分别回归后所得的残差平方和,容易验证,于是记RSS1与RSS2为在两时间段上分别回归后所得的残差80

(1)分别以两连续时间序列作为两个样本进行回归,得到相应的残差平方:

RSS1与RSS2

(2)将两序列并为一个大样本后进行回归,得到大样本下的残差平方和RSSR(3)计算F统计量的值,与临界值比较:若F值大于临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。该检验也被称为邹氏参数稳定性检验。参数稳定性的检验步骤:(1)分别以两连续时间序列作为两个样本进行回归,得到相应812.邹氏预测检验

上述参数稳定性检验要求n2>k。如果出现n2<k,则往往进行如下的邹氏预测检验。邹氏预测检验的基本思想:先用前一时间段n1个样本估计原模型,再用估计出的参数进行后一时间段n2个样本的预测。

如果预测误差较大,则说明参数发生了变化,否则说明参数是稳定的。2.邹氏预测检验上述参数稳定性检验要求n2>k。如果82分别以、表示第一与第二时间段的参数,则,如果=0,则=,表明参数在估计期与预测期相同其中式的矩阵式为:分别以、表示第一与第二时间段的参数,则83可见,用前n1个样本估计可得前k个参数的估计,而不外是用后n2个样本测算的预测误差如果参数没有发生变化,则,矩阵式简化为式与式分别可看成受约束与无约束回归模型,于是有如下检验:这里:kU

-kR=n2

RSSU=RSS1可见,用前n1个样本估计可得前k个参数84邹氏预测检验步骤:

第一步,在两时间段的合成大样本下做OLS回归,得受约束模型的残差平方和RSSR

;第二步,对前一时间段的n1个子样做OLS回归,得残差平方和RSS1;第三步,计算检验的F统计量,做出判断:给定显著性水平,查F分布表,得临界值F(n2,n1-k-1)。如果F>F(n2,n1-k-1),则拒绝原假设,认为预测期发生了结构变化。

邹氏预测检验步骤:第一步,在两时间段的合成大样本下做85由例4-2,利用OLS分别对1901-1927年和两个子区间1901-1912年、1913-1927年进行估计,估计结果分别为(样本区间1901-1912年)(样本区间1913-1927年)由例4-2,利用OLS分别对1901-1927年和两个86由式计算F统计量为:

小于显著性水平为5%的临界值,因此可以认为1913年没有发生结构变化,不拒绝参数稳定的原假设。由式计算F统计量为:小于显著87由得,进行邹氏预测检验:

大于显著性水平为5%的临界值,拒绝参数稳定的原假设。由88§4.6

案例分析§4.6案例分析89例4-3某市财政教育经费支出分析例4-3某市财政教育经费支出分析90第4章多元线性回归模型学习目标

知识目标:了解多元线性回归模型的基本假设、掌握其估计方法以及检验程序。技能目标:在其计算过程中充分利用进行计算,通过本章的学习熟练地掌握了和运用,尤其是对中矩阵逆及相乘的运算。能力目标:会建立多元线性回归模型,会对多元线性回归模型进行估计、统计检验并进行经济预测。拿出一个案例能够独立的对其进行模型设定、参数估计、统计检验和预测。第4章多元线性回归模型学习目标91第4章多元线性回归模型§4.1多元线性回归模型及假定§4.2多元线性回归模型的参数估计§4.3多元线性回归模型的统计检验§4.4多元线性回归模型的置信区间§4.5受约束回归§4.6案例分析第4章多元线性回归模型§4.1多元线性回归模型及假定92§4.1多元线性回归模型及假定4.1.1多元线性回归模型4.1.2多元线性回归模型的若干假定§4.1多元线性回归模型及假定4.1.1多元线性回归934.1.1多元线性回归模型多元线性回归模型的一般形式其中k是解释变量的数目。4.1.1多元线性回归模型多元线性回归模型的一般形式94给定样本则上述模型表示为给定样本则上述模型表示为95几何意义:代数意义:经济意义:与存在线性关系,后者是前者的重要解释变量;与存在线性关系;表示一个多维平面。几何意义:代数意义:经济意义:与存在线性关系,后者是前者的重96多元总体回归函数该函数又称为条件期望函数,表明在给定下的分布的(总体)均值与存在着函数关系。多元线性回归模型表示的n个随机方程的矩阵表达式多元总体回归函数该函数又称为条件期望函数,表97其中其中98样本回归函数用来估计总体回归函数其随机表示式ei称为残差或剩余项,可看成是总体回归函数中随机扰动项ui的近似替代。或其中:样本回归函数的矩阵表达:样本回归函数用来估计总体回归函数其随机表示式994.1.2多元线性回归模型的若干假定假定1解释变量是非随机的,即在重复抽样中,解释变量取固定值,且相互之间互不相关(无多重共线性)。假定2随机干扰项与解释变量之间不相关。4.1.2多元线性回归模型的若干假定假定1解释变量是100假定3随机干扰项服从零均值,同方差,零协方差。假定4随机干扰项服从正态分布。假定5正确设定回归模型。(1)选择了正确的变量进入模型;(2)对模型的形式进行正确的设定;(3)对模型的解释变量、被解释变量以及随机干扰项做了正确的假定。上述假定条件称为多元线性回归模型的经典假定。在本章,我们假定以上条件都成立。假定3随机干扰项服从零均值,同方差,零协方差。假定4101§4.2多元线性回归模型的参数估计4.2.1普通最小二乘法4.2.2极大似然法估计4.2.3参数估计量的性质§4.2多元线性回归模型的参数估计4.2.1普通最小1024.2.1普通最小二乘法1.普通最小二乘估计利用最小二乘法估计模型的参数,同样应该使残差平方和达到最小,即取最小值。根据多元函数的极值原理,可得如下方程组:4.2.1普通最小二乘法1.普通最小二乘估计103写成矩阵形式为:式和式叫做正规方程组。由式可得这就是向量的OLS估计值。写成矩阵形式为:式和式1042.随机干扰项方差估计值的普通最小二乘估计可以证明:随机干扰项的方差的无偏估计为2.随机干扰项方差估计值的普通最小二乘估计可以证1054.2.2极大似然法估计这种估计思想认为,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使从模型中抽取该n组样本观测值的概率最大。将样本观测值联合概率函数称为似然函数,通过似然函数极大化以求得总体参数估计量的方法被称为极大似然法。4.2.2极大似然法估计这种估计思想认为,当从106对于多元线性回归模型Yi的概率函数为对于多元线性回归模型Yi的概率函数为107Yt是相互独立的,所以Yt是随机抽取的n组样本观测值的联合概率,即似然函数为Yt是相互独立的,所以Yt是随机抽取的n组样本观测值的联合108由于lnL是单调函数,所以使其极大的参数值也将使L极大。求使对数似然函数极大的参数值,可得:由于lnL是单调函数,所以使其极大的参数值也将使1094.2.3参数估计量的性质

1.线性性参数估计量是线性估计量,即是随机变量Y的线性函数。显然,参数估计量是随机变量Y的线性函数,所以是线性估计量。4.2.3参数估计量的性质1.线性性参1102.无偏性所以,2.无偏性所以,1113.最小方差性是单位矩阵,3.最小方差性是单位矩阵,1124.随机误差项方差估计量的性质由于被解释变量的估计值与观察值之间的残差由于所以残差平方和为

所以4.随机误差项方差估计量的性质由于被解释变量的估计值与观察113随机误差项方差的估计量为

随机误差项方差的估计量为114例4-1经过研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水平有关。现对某地区18名学生进行调查,得到样本数据如表4-1所示,其中Y表示购买书籍及课外读物(元/年),X1表示学生受教育年限,X2表示家庭月可支配收入(元/月)。下面我们估计学生购买书籍及课外读物的支出与受教育年限、家庭月可支配收入之间的线性关系。例4-1经过研究发现,学生用于购买书籍及课外读物的支出与本115回归线性模型设定如下用矩阵表示为:回归线性模型设定如下用矩阵表示为:116估计的回归模型表示为估计的回归模型表示为117计量经济学第4章1-多元线性回归41-课件118§4.3多元线性回归模型的统计检验4.3.1模型的拟合优度检验4.3.2回归方程的显著性检验4.3.3变量的显著性检验§4.3多元线性回归模型的统计检验4.3.1模型的1194.3.1模型的拟合优度检验1.

R2检验(1)总离差平方和的分解有k个解释变量的多元线性回归模型对应的回归方程为将Yi与其平均值之间的离差分解如下:4.3.1模型的拟合优度检验1.R2检验(1)总离差120将Yi与其平均值之间的离差分解如下:总离差平方和回归平方和残差平方和

将Yi与其平均值之间的离差分解如下:总离差平方和回121即总离差平方和分解为回归平方和与残差平方和两部分。即总离差平方和分解为回归平方和与残差平方和两122(2)多元样本决定系数R2与拟合优度检验多元样本决定系数因为所以总有

R2的数值越接近1,表明Y中总离差平方和中可由样本回归线解释的部分越大,残差平方和越小,样本回归线与样本观测值的拟合程度越高;反之则拟合得越差。

R2作为度量回归值对样本观测值Yi拟合优度的指标,显然其数值越接近1越好。(2)多元样本决定系数R2与拟合优度检验多元样本决定系数因为123在例4-1中,计算可得在例4-1中,计算可得124(3)修正样本决定系数的大小与模型中解释变量的数目有关,解释变量的个数越多,它的值就越大,在实际运用中需要对其进行调整。

调整的思想是将残差平方和与总离差平方和之比的分子分母分别用各自的自由度去除,变成均方差之比,以剔除解释变量个数对拟合优度的影响。于是,修正的样本决定系数为(3)修正样本决定系数的大小与模型中解释变量125调整的可决系数与未经调整的可决系数之间存在如下关系:其中,n是样本观测值的个数,k是解释变量的个数。调整的可决系数与未经调整的可决系数之间存在如下关126在实际应用中,或R2究竟要多大才算模型通过了检验,没有绝对的标准,要视具体情况而定。在例4-1中,

拟合优度并不是评价模型优劣的唯一标准必须对回归方程和模型中各参数的估计量作进一步的显著性检验在实际应用中,或R2究竟要多大才算1272.赤池信息准则和施瓦茨准则赤池信息准则(AIC)施瓦茨准则(SC)这两个准则均要求仅当所增加的解释变量能够减少AIC值或SC值时才在原模型中增加该解释变量。2.赤池信息准则和施瓦茨准则赤池信息准则(AIC)施瓦茨准128估计结果显示:某地区学生购买书籍及课外读物的支出二元例中建立某地区学生购买书籍及课外读物的支出一元例中从这点看,可以说家庭月可支配收入应包含在模型中。估计结果显示:某地区学生购买书籍及课外读物的支出二1294.3.2回归方程的显著性检验1.回归方程的显著性检验回归方程的显著性检验是指在一定的显著性水平下,从总体上对模型中被解释变量与解释变量之间的线性关系是否显著成立而进行的一种统计检验。4.3.2回归方程的显著性检验1.回归方程的显著性检验130检验的原假设与备择假设分别为检验的思想来自于总离差平方和的分解式:

ESS是解释变量的联合对被解释变量的线性作用的结果,可通过该比值ESS/RSS的大小对总体线性关系进行推断。

检验的原假设与备择假设分别为检验的思想来自于总离差平方和的分131根据数理统计学中的定义,在H0成立的条件下,构造一个统计量:它服从自由度为(k,n-k-1)的F分布。

给定一个显著性水平,查分布表,得到一个临界值F(k,n-k-1)。根据数理统计学中的定义,在H0成立的条件下,构132如果发生F

F(k,n-k-1)

,则在1-水平下拒绝原假设,即模型的线性关系显著成立,模型通过方程显著性检验。如果未发生F

F(k,n-k-1)则在1-水平下接受原假设,即模型的线性关系显著不成立,模型未通过方程显著性检验。如果发生FF(k,n-k-1),则在1133在例4-1中,检验的原假设与备择假设分别为所以结论是拒绝原假设,即Y与X1,X2

存在线性回归关系。在例4-1中,检验的原假设与备择假设分别为1342.拟合优度检验与方程总体线性的显著性检验之间的关系F检验可用于度量总体回归直线的显著性,也可用于检验的显著性。2.拟合优度检验与方程总体线性的显著性检验之间1354.3.3

显著性检验1.解释变量的显著性检验解释变量的显著性检验,是指在一定的显著性水平下,检验模型的解释变量是否对被解释变量有显著影响的一种统计检验。4.3.3显著性检验1.解释变量的显著性检验136检验的原假设与备择假设分别为构造如下的t

检验统计量检验的原假设与备择假设分别为构造如下的t检验统计量1372.t检验的步骤(1)提出假设。(2)计算t

统计量。(3)查临界值t/2(n-k-1)。(4)判断。若|t|

t/2(n-k-1),则在1-水平下接受原假设,即Xj对应的解释变量j是不显著的。若|t|

t/2(n-k-1),则在1-水平下拒绝原假设,即Xj对应的解释变量j是显著的;2.t检验的步骤(1)提出假设。若|t|138

t1和t2分别大于临界值t0.025(15)=2.13,所以拒绝零假设,表明Xi1和Xi2对于Yi都是重要解释变量,应保留在模型中。在例4-1中,t1和t2分别大于临界值t0.025(15)139§4.4多元线性回归模型的置信区间4.4.1点估计值4.4.2参数估计量的置信区间4.4.3预测值的置信区间§4.4多元线性回归模型的置信区间4.4.1点估计值140§4.4多元线性回归模型的置信区间4.4.1点估计值

点估计值就是求解释变量对应的被解释变量Y的估计值。预测值与实际值Y之间存在的误差为§4.4多元线性回归模型的置信区间4.4.1点估计值1414.4.2参数估计量的置信区间要判断样本参数的估计值在多大程度上可以近似地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的区间来考察它以多大的概率包含着真实的参数值。这种方法就是参数检验的置信区间估计。4.4.2参数估计量的置信区间要判断样本参142t分布的分布曲线对称于纵坐标轴,所以在给定的置信水平1-下,我们选取对称于原点的区间即使得t分布的分布曲线对称于纵坐标轴,所以在给定的置143于是得到参数估计量j的置信水平为1-的置信区间为于是得到参数估计量j的置信水平为1-的置信1444.4.3预测值的置信区间1.

E(Y0)的预测区间4.4.3预测值的置信区间1.E(Y0)的预测区间145将随机干扰项的方差用其无偏估计量代替,可构造如下t统计量:于是,得到置信度为1-下的E(Y0)的置信区间:将随机干扰项的方差用其无偏估计量1462.

Y0的预测区间设e0是实际预测值Y0与预测值之差:2.Y0的预测区间设e0是实际预测值Y0与预测值之147e0的标准差估计值其中构造t统计量e0的标准差估计值其中构造t统计量148于是,对于给定的置信水平1-,预测值Y0的置信区间为于是,对于给定的置信水平1-,预测值Y0的置信149

在实际应用中,我们希望置信水平越高越好,置信区间越小越好。如何才能缩小置信区间?通常可以通过以下途径来实现:

(1)增大样本容量n。(2)提高模型的拟合优度,如果模型完全拟合样本观测值,残差平方和为0,则置信区间也为0。

(3)提高样本观测值的分散度。在一般情况下,样本观测值越分散,作为的分母的的值越大,使得区间缩小。在实际应用中,我们希望置信水平越高越好,置信区间150§4.5受约束回归4.5.1模型参数的线性约束4.5.2对回归模型增加或减少解释变量4.5.3参数的稳定性§4.5受约束回归4.5.1模型参数的线性约束151在建立回归模型时,有时根据经济理论需要对模型中变量的参数施加一定的约束条件。如:0阶齐次性条件的消费需求函数

1阶齐次性条件的C-D生产函数模型施加约束条件后进行回归,称为受约束回归;

不加任何约束的回归称为无约束回归。在建立回归模型时,有时根据经济理论需要对模型中变1524.5.1模型参数的线性约束对模型施加约束得或如果对式回归得出参数的估计结果则由约束条件可得:4.5.1模型参数的线性约束对模型施加约束得或如果对式153

然而,对所考查的具体问题能否施加约束?需进一步进行相应的检验。常用的检验有:F检验、检验与t检验,下面主要介绍F检验然而,对所考查的具体问题能否施加约束?需进一步进154在同一样本下,记无约束样本回归模型为受约束样本回归模型为于是受约束样本回归模型的残差平方和RSSR在同一样本下,记无约束样本回归模型为受约束样本回归模型为于是155由式RSSR

RSSU从而

ESSRESSU受约束样本回归模型的残差平方和RSSR于是为无约束样本回归模型的残差平方和RSSU这意味着,通常情况下,对模型施加约束条件会降低模型的解释能力。由式RSSRRSSU156

但是,如果约束条件为真,则受约束回归模型与无约束回归模型具有相同的解释能力,RSSR

RSSU的差异变小。可用RSSR-RSSU的大小来检验约束的真实性。但是,如果约束条件为真,则受约束回归模型与无约束回157根据数理统计学的知识:于是:根据数理统计学的知识:于是:158如果约束条件无效,RSSR

与RSSU的差异较大,计算的F值也较大。于是,可用计算的F统计量的值与所给定的显著性水平下的临界值作比较,对约束条件的真实性进行检验。其中,kU,kR分别为无约束与受约束回归模型的解释变量的个数(不包括常数项),kU-kR恰为约束条件的个数。如果约束条件无效,RSSR与RSSU的差159例4-2柯布—道格拉斯生产函数,试根据美国金属行业1901-1927年数据,检验规模效益不变的约束条件:。(1)无约束回归模型例4-2柯布—道格拉斯生产函数160(2)有约束回归模型得到的约束回归和无约束回归的残差平方和分别为(2)有约束回归模型得到的约束回归和无约束回归的残差平方161(3)检验原假设所以故受原假设,支持规模收益不变的假设。(3)检验原假设所以故受原假设,支持规模收益不变的假1624.5.2对回归模型增加或减少解释变量考虑如下两个回归模型式可以看成是式的受约束回归:4.5.2对回归模型增加或减少解释变量考虑如下两个回归163相应的F统计量为:

F统计量的另一个等价式相应的F统计量为:F统计量的另一个等价式164如果约束条件为真,即额外的变量Xk+1,…,Xk+q对Y没有解释能力,则F统计量较小;否则,约束条件为假,意味着额外的变量对Y有较强的解释能力,则F统计量较大。因此,可通过F的计算值与临界值的比较,来判断额外变量是否应包括在模型中。如果约束条件为真,即额外的变量Xk+1,…,1654.5.3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论