线性回归模型_第1页
线性回归模型_第2页
线性回归模型_第3页
线性回归模型_第4页
线性回归模型_第5页
已阅读5页,还剩116页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

线性回归模型第1页,共121页,2023年,2月20日,星期二第二章线性回归模型线性模型的参数估计线性模型的检验预测实证分析第2页,共121页,2023年,2月20日,星期二第一节线性模型的参数估计模型假定及最小二乘估计估计量的性质及参数的估计约束最小二乘法第3页,共121页,2023年,2月20日,星期二2.1.1模型假定及最小二乘估计一、模型及模型的假定线性模型的一般形式是

(2.1) 其中,为被解释变量(因变量),为解释变量(自变量),是随机误差项,

j=1,2,…,k为模型参数。第4页,共121页,2023年,2月20日,星期二对经济问题的实际意义:与存在线性关系,是的重要解释变量。由于模型是现实问题的一种简化,以及数据收集和测量是产生,因此代表众多影响变化的微小因素,称为干扰项。计量经济学中的多种估计、检验、预测等分析方法,是针对不同性质的扰动项引入的。第5页,共121页,2023年,2月20日,星期二这里应该注意到,由于的影响使变化偏离了

决定的维空间平面。 用矩阵表示(2.1)式变形为 等价地,总体回归模型表示为

,(2.2)第6页,共121页,2023年,2月20日,星期二总体回归方程为

(2.3) 其中,

第7页,共121页,2023年,2月20日,星期二

这里的表示对于不同的(),被解释变量的均值向量;X是由解释变量的数据构成的矩阵,其中截距项可视为解释变量总是取值为1。有时也称为数据矩阵或设计矩阵。第8页,共121页,2023年,2月20日,星期二那么,样本回归模型为

(2.4) 样本回归方程为

(2.5) 其中,

这里表示Y的样本估计值向量;表示回归系数估计值向量;e表示残差向量。第9页,共121页,2023年,2月20日,星期二这里需要说明的是,在构建线性回归模型时,要以总体回归方程(2.3)式描述的内容为理论基础,利用样本通过统计推断建立样本回归方程(2.5)式,然后借助样本回归模型(2.4)式,解释总体回归模型(2.2)式所描述的实际经济问题。然而,线性回归分析是有前提的,下面我们将介绍经典线性回归模型必须满足的假定条件。第10页,共121页,2023年,2月20日,星期二1、零均值假定假定随机干扰项期望向量或均值向量为零,即

(2.6)第11页,共121页,2023年,2月20日,星期二2、同方差和无序列相关假定假定假定随机干扰项不存在序列相关且方差相同,即第12页,共121页,2023年,2月20日,星期二 即

(2.7) 其中,为n阶单位矩阵。 3、假定随机干扰项与解释变量相互独立,即

(2.8) 这里通常假定X中的元素为非随机变量。第13页,共121页,2023年,2月20日,星期二4、无多重共线性的假定假设各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关,在此条件下,数据矩阵X列满秩 此时,方阵满秩

(2.9) 从而,可逆,存在。第14页,共121页,2023年,2月20日,星期二5、正态性假定假定随机干扰项服从正态分布,即~

这里假定1和假定2是对随机干扰项性质的要求,同时满足也成为“球形干扰项”。假定3的主要意义是方便线性回归的讨论和证明,避免由于X与随机干扰项有强相关时回归分析的有效性和价值受到影响;假定4是多元线性回归分析的特定要求,对保证回归分析的有效性和可靠性也很只要;假定5实际上要求干扰项确实是多种微小扰动因素的综合,也是回归系数估计量分布性质和相关统计推断的基础,但这一假定不是线性回归分析必须要求,因为本身不影响回归系数估计的性质。第15页,共121页,2023年,2月20日,星期二在实际经济问题中,这些假定条件有时可能并不成立。如何识别这些假定条件是否满足,以及假定条件不成立时如何进行参数估计和检验,我们将在下一章讨论。第16页,共121页,2023年,2月20日,星期二二、最小二乘估计总体回归模型(2.2)式

中的参数矩阵各个元素,反映了解释变量对被解释变量Y的影响程度。由于矩阵是总体参数矩阵,通过有限的样本无法得到矩阵。只能通过统计推断的思想,用有限的样本对矩阵进行估计,得出参数估计值矩阵。第17页,共121页,2023年,2月20日,星期二求参数估计值矩阵的方法是最小二乘(OLS)法,即求使得残差平方和达到最小。 由样本回归模型(2.4)式 和样本回归方程为(2.5)式 可以得到残差矩阵(2.10)第18页,共121页,2023年,2月20日,星期二那么,残差平方和为

(2.11) 根据矩阵代数理论,对(2.11)式以求偏导,并令其为零,可以得到方程 即(2.12) 称其为正则方程。第19页,共121页,2023年,2月20日,星期二因为(X'X)是一个非退化矩阵,所以有(2.13) 这就是线性回归模型参数的最小二乘估计量。这里需要提及的是,根据微积分的极值理论,只是函数的一个驻点,应该证明确实使得达到最小。事实上,对于任何一个,有(2.14)第20页,共121页,2023年,2月20日,星期二由于满足正则方程(2.12)式,于是, 那么(2.14)式中的第三项为零。这样就证明了对于任何的,有(2.15)又因为是一个正定阵,故(2.15)式中的第二项总是非负的,于是 且等号成立当且仅当第21页,共121页,2023年,2月20日,星期二下面我们考虑一个多元线性回归模型的特例 ——一元线性回归模型假设影响被解释变量Y的因素只有一个,记为X。已知得到Y和X的一组观测值(,)(),于是有() 这时,正则方程(2.12)式变为第22页,共121页,2023年,2月20日,星期二当()不全相等时,,这里。于是正则方程左边的系数行列式=n。经过初等计算可以得到和的最小二乘估计分别为 其中,第23页,共121页,2023年,2月20日,星期二2.1.2估计量的性质及参数的估计一、估计量的性质在线性模型的经典假设的前提下,线性回归模型参数的最小二乘估计有优良的性质,是对最小二乘估计量有效性和其价值的有力支持。线性回归模型参数的最小二乘估计量性质的具体内容由高斯—马尔可夫定理来体现。高斯—马尔可夫(Gauss-Markov)定理:在线性模型的经典假设下,参数的最小二乘估计量是线性无偏估计中方差最小的估计量(BLUE估计量)。第24页,共121页,2023年,2月20日,星期二下面我们逐一证明。 1、线性特性 由(2.13)式知

(2.16) 令,那么,(2.16)式为(2.17)第25页,共121页,2023年,2月20日,星期二各个参数的估计量为(2.18)这里(2.18)中的是矩阵的k行因素构成的行向量,由此证明了参数估计量具有线性特性。它不仅是Y的线性组合,也是的线性组合。线性特性是确定参数估计量的分布性质和进行统计推断的重要基础。第26页,共121页,2023年,2月20日,星期二2、无偏性由(2.17)式知

(2.19)这里需要提及的是,这个性质从概率分布的角度反映了最小二乘估计量与参数真实值之间的内在联系,利用无偏性通过最小二乘估计量的概率分布可以推断参数情况和范围等。第27页,共121页,2023年,2月20日,星期二3、最小方差性最小二乘估计量的有效性,也称为“有效性”。即在模型参数的所有线性无偏估计量中最小二乘估计的方差最小。由(2.17)式知,最小二乘估计量的协方差矩阵为(2.20)第28页,共121页,2023年,2月20日,星期二该协方差矩阵对角线上的因素就是模型各个参数估计量的方差,其他因素是不同参数估计量之间的协方差。下面需要证明,任何其他线性无偏估计量的方差都大于,不妨假设(2.21)第29页,共121页,2023年,2月20日,星期二由于为的无偏估计量,即有(2.22) 这样只有或 那么有

(2.23)第30页,共121页,2023年,2月20日,星期二在(2.23)式中 从而(2.24)第31页,共121页,2023年,2月20日,星期二根据矩阵代数的知识,任何矩阵与自身转置的乘积都是半正定矩阵,(2.24)式中的为半正定矩阵,其对角线上的元素必然是非负的,因此得知,任意其他线性无偏估计量的方差都大于最小二乘估计量的方差。这里需要说明的是,对于无偏估计,方差愈小愈好,因此高斯—马尔可夫(Gauss-Markov)定理表明:最小二乘估计量在的线性无偏估计量中是最优的,所以我们也称在的“最佳线性无偏估计量”(BLUE估计量)。这个实事奠定了最小二乘估计在线性回归模型中的地位。第32页,共121页,2023年,2月20日,星期二二、参数的估计在线性回归模型(2.7)式中还有一个重要的参数,它是模型干扰项的方差,因而有时简称为误差方差。反映了模型误差以及观测误差的大小,在线性回归分析中起着重要的作用。现在我们讨论的估计问题。 由样本回归模型(2.4)式知(2.25)第33页,共121页,2023年,2月20日,星期二令,即有 说明e是的线性变换。其中,M称为最小二乘基本等幂矩阵。M有如下的性质: 1、对称性。即(2.26) 实际上, 这个性质表明M为对称矩阵。第34页,共121页,2023年,2月20日,星期二 2、等幂性。即(2.27) 实际上, 所以第35页,共121页,2023年,2月20日,星期二 3、M与X互相独立。即(2.28) 实际上, 利用最小二乘基本等幂矩阵M的性质,以及(2.25)式,可以得到残差平方和为第36页,共121页,2023年,2月20日,星期二由于和都是标量,由矩阵代数的知识知, 标量应与其迹相等,并由迹的轮换性定理知,即第37页,共121页,2023年,2月20日,星期二再由迹的轮换性知(2.29) 从而, 即

定义(2.30) 则为的无偏估计量,即。第38页,共121页,2023年,2月20日,星期二2.1.3约束最小二乘法对于线性回归模型(2.2)式,在对参数向量没有附加任何约束条件的情况下,我们以前求出了最小二乘估计量,并讨论了它的基本性质。但是,在解决经济活动的实际问题中,我们需要求带一定线性约束的最小二乘估计量。 假设参数向量的线性约束为(2.31)是一个相容线性方程组,其中D为的已知矩阵,而且秩为p,b为已知向量。第39页,共121页,2023年,2月20日,星期二我们用Lagrange乘子法求模型(2.2)满足线性约束(2.31)式的最小二乘估计量。, 则线性约束(2.31)式可以表示为,(2.32) 我们的问题是在(2.32)式的p个条件下,求使得 达到最小的。第40页,共121页,2023年,2月20日,星期二应用Lagrange乘子法构造目标函数为 其中为Lagrange乘子。对函数求对的偏导数,整理并令它们等于零,得到(2.33) 然后解(2.33)式和线性约束(2.31)式组成的联立方程组。第41页,共121页,2023年,2月20日,星期二为方便表述,我们用和表示(2.33)式和(2.31)式的解。用左乘(2.33)式,整理后得到

(2.34)代入(2.31)式得到即(2.35)这是一个关于的线性方程组。第42页,共121页,2023年,2月20日,星期二因为D的秩为p,于是是的可逆矩阵,从而(2.35)式有唯一的解将代入(2.34)式得到(2.36)第43页,共121页,2023年,2月20日,星期二这里我们需要提及的是,确实是线性约束下的的最小二乘估计量。即应该满足: 1、; 2、对一切满足的,都有 根据(2.36)式容易验证。第44页,共121页,2023年,2月20日,星期二下面我们只验证第二个结论即可。 利用(2.15)式得到(2.37) 其中是无约束条件下的最小二乘估计量。第45页,共121页,2023年,2月20日,星期二由(2.34)式得知 这个等式对一切满足的成立。 那么,(2.37)式表明,对一切满足的, 总有(2.38)第46页,共121页,2023年,2月20日,星期二且等号成立当且仅当(2.37)式中的 =0,也就是。于是(2.38)式中用代替 等式成立,即(2.39) 从而,综合(2.38)和(2.39)式,得到 这里我们把估计量称为的约束最小二乘估计。第47页,共121页,2023年,2月20日,星期二第二节线性模型的检验拟合优度

参数估计值的分布与检验

第48页,共121页,2023年,2月20日,星期二2.2.1拟合优度拟合优度是描述线性回归方程与样本数据趋势拟合情况的重要指标,它既是分析数据情况的手段,也是检验模型变量关系真实性的重要手段。为了说明线性回归模型对样本观测值的拟合情况,需要考察解释变量Y的总变差进行分解分析。Y的总变差分解式为:(2.40)其中,称为总离差平方和,记为TSS,它反映了被解释变量观测值总变差的大小,其自由度为;第49页,共121页,2023年,2月20日,星期二称为残差平方和,记为ESS,它反映了被解释变量观测值与估计值之间的变差,其自由度为;称为回归平方和,记为RSS,它反映了被解释变量回归估计值总变差的大小,其自由度为。 用矩阵表示为:TSSRSSESS第50页,共121页,2023年,2月20日,星期二实际上,由(2.11)和(2.12)式知 即有(2.41)第51页,共121页,2023年,2月20日,星期二这里,回归平方和RSS越大,残差平方和ESS就越小,从而被解释变量观测值总变差中能由解释变量解释的那部分变差就越大,回归模型对观测值的拟合程度就越高。因此,我们定义可决系数来描述回归模型对观测值的拟合程度,即

(2.42)我们应该注意到,可决系数有一个显著的特点:如果观测值不变,可决系数将随着解释变量数目的增加而增大。第52页,共121页,2023年,2月20日,星期二设解释变量为时,残差平方和为,如果观测值不变,再增加一个解释变量,相应的残差平方和为。由于在利用最小二乘法求参数估计值时,残差平方和和都分别达到最小值,而达到最小值,相当于最后引入的解释变量的系数等于零的条件下的极小值,即是条件极小值。而是不要求等于零这个条件就可以达到极小值,即无条件极小值。因为无条件极小值不大于条件极小值,即(2.43)因此,(2.44)第53页,共121页,2023年,2月20日,星期二其中,是解释变量为时的可决系数,而是增加了解释变量以后的可决系数。这样随着解释变量数目的增加,残差平方和不断减小,可决系数不断增加。有些解释变量对被解释变量的影响很小,增加这些解释变量对减少残差平方和没有多大作用。由(2.30)式可以知道引入解释变量数目越多,k越大。如果残差平方和减小不明显,那么误差方差估计值将增大。第54页,共121页,2023年,2月20日,星期二的增大对于推断参数的置信区间,以及对于预测区间的估计,都意味这推断精度的降低。因此,在线性模型中引入某个解释变量不应该根据可决系数是否增大来判断。为了解决这一问题,我们定义修正可决系数为(2.45)

修正可决系数描述了,当增加一个对被解释变量有较大影响的解释变量时,残差平方和减小比减小更显著,修正可决系数就增大;如果增加一个对被解释变量没有多大影响的解释变量,残差平方和减小没有减小显著,会减小,其说明不应该引入这个不重要的解释变量。第55页,共121页,2023年,2月20日,星期二由此可见,修正可决系数比一般可决系数更准确的反映了解释变量对被解释变量的影响程度。因此在一般情况下修正可决系数比应用更广泛。那么,修正可决系数与一般可决系数的关系怎样呢?

第56页,共121页,2023年,2月20日,星期二由于(2.46)第57页,共121页,2023年,2月20日,星期二由于,,,知(2.47)即修正可决系数不大于一般可决系数。修正可决系数有一个重要的特点,它可能为负值。根据(2.46)式,若,则即第58页,共121页,2023年,2月20日,星期二这样(2.48)那么,当(2.48)式成立时,。这样使用修正可决系数将失去意义,因此,只适应于变量Y与变量的整体相关程度比较高的情况。第59页,共121页,2023年,2月20日,星期二2.2.2参数估计值的分布与检验在本章2.1节中讨论参数的最小二乘估计的过程,及参数估计量的有关性质,并没有涉及干扰项的具体分布形式。如果只计算最小二乘估计,不需要对的分布形式提出要求。但是如果讨论参数估计的检验问题、总体参数的置信区间和预测问题时,就必须对干扰项的分布形式作出规定。第60页,共121页,2023年,2月20日,星期二一、参数估计式的分布特性首先,我们明确根据中心极限定理,无论干扰项

服从什么分布,只要样本容量n足够大,就可以近似按服从正态分布的情况一样,对进行显著性检验,以及对总体参数的置信区间进行推断。在实际经济活动中,各种经济变量之间有的联系较为复杂,样本资料很难满足正态分布的要求。同时,也很难对样本本身是否严格服从正态分布作出准确判断,甚至根本无法判断样本服从什么分布。有了中心极限定理,就可以回避检验的分布形式的困难,按照Y和服从正态分布讨论检验和预测等问题。只要样本容量比较大,得到的结果的近似程度就比较高。因此,对正态分布的讨论具有一般性。第61页,共121页,2023年,2月20日,星期二根据线性模型回归模型的经典假设,随机干扰项服从多元正态分布,即~由式(2.16)可以知道,参数估计中的任何一个元素等于矩阵中的对应元素加上的线性组合。假定服从多元正态分布,那么也服从多元正态分布。由(2.19)式和(2.20)式,可以得到~(2.49)第62页,共121页,2023年,2月20日,星期二这里用它的无偏估计近似代替。利用的方差估计式就可以对参数估计进行显著性检验。在线性回归模型分析中,除了要对单个参数进行检验,还要检验多个解释变量对被解释变量Y的共同影响是否显著。这种检验是多方面的检验,要反复筛选解释变量和反复检验。通常构造统计量F进行这些检验。第63页,共121页,2023年,2月20日,星期二为了构造F统计量,必须证明: 1、服从分布。 2、与的分布互相独立。 首先证明服从分布。由矩阵的秩的性质可以知道,如果M是是等幂矩阵,则 由(2.29)式,可以得到第64页,共121页,2023年,2月20日,星期二因此,最小二乘基本等幂矩阵M为一个降秩矩阵,并且存在一个维正交矩阵P,满足第65页,共121页,2023年,2月20日,星期二如果把干扰项看做利用正交矩阵P对一个维随机变量列矩阵V作线性变换得到的,即 那么,

(2.50)第66页,共121页,2023年,2月20日,星期二由正交矩阵的性质,也是正交矩阵,并且P和 中的行向量都是单位向量,两两正交,所以与 有相同方差。由于~,那么~。由(2.50)式可以知道,为个均值为0,方差为的满足独立正态分布变量的平方和。因此,服从自由度为的分布,即 所以~(2.51)

第67页,共121页,2023年,2月20日,星期二下面证明与的分布互相独立。由于 将(2.25)式和(2.16)式代入上式得

(2.52) 因此,与的分布互相独立。即与的分布互相独立。第68页,共121页,2023年,2月20日,星期二二、参数估计的显著性检验与总体参数的

置信区间下面讨论的检验问题。为了得到多种假设检验和的置信区间的一般方法,首先对作线性变换。 则

(2.53)第69页,共121页,2023年,2月20日,星期二其中,为维列矩阵。C为维常数矩阵。r为待检验的参数数目,k为全部参数的数目。显然。假设C为满秩矩阵,即。这样只要改变C的定义形式,对的检验可以代表对中不同参数估计的各种检验。 随机矩阵的期望和协方差分别为

第70页,共121页,2023年,2月20日,星期二和由于是的线性变换,服从多元正态分布,所以也服从多元正态分布。并且的元素之间是互相独立的。第71页,共121页,2023年,2月20日,星期二服从自由度为r的分布,即

~ 用矩阵形式表示的统计量为第72页,共121页,2023年,2月20日,星期二即~ 令及 由(2.51)式,知

令及。第73页,共121页,2023年,2月20日,星期二因此,可以得到F统计量第74页,共121页,2023年,2月20日,星期二将(2.30)式代入上式得

~(2.54) 上式中的F统计量不但可以用于显著性检验,也可以用于推断的置信区间。如果确定了显著水平,那么

(2.55)第75页,共121页,2023年,2月20日,星期二的概率为。并且的置信区间为

(2.56) 对于不同的情形,讨论参数估计的显著性检验问题和总体回归的参数的置信区间问题。 1、对全部的显著性检验及全部的置信区间问题。 假设,即,则,,第76页,共121页,2023年,2月20日,星期二且(2.54)式简化为

~(2.57) 那么,我们检验的问题是,备选假设为。在原假设成立下,(2.57)式简化为~(2.58)第77页,共121页,2023年,2月20日,星期二当时,接受。即认为矩阵中的所有元素作为一个整体不显著,因此必须重新建立模型。当时,中的元素作为一个整体显著,但是并不保证其中每个元素都显著。由(2.56)式,的置信区间,即的联合置 信区间为

(2.59)落入该置信区间的概率为。第78页,共121页,2023年,2月20日,星期二 2、对部分的显著性检验和部分的置信区间问题。重新排列原解释变量矩阵中各解释变量的顺序,把准备留在模型中的个解释变量排到新的X矩阵中的右边r列。重新排列的矩阵和矩阵中,与X相应的和排列在下面r行。定义第79页,共121页,2023年,2月20日,星期二因此, 如果定义矩阵为矩阵中下面r行右面r

列元素构成的子矩阵,那么

(2.60) 那么,我们检验的问题是,备选假设为。第80页,共121页,2023年,2月20日,星期二在原假设成立下,则(2.54)式简化为~(2.61) 当时,接受假设。 当时,接受对立假设。 由(2.56)式,的联合置信区间为

(2.62)落入上述区间的概率为。第81页,共121页,2023年,2月20日,星期二 3、对单个的显著性检验和单个的置信区间问题。 在上述对部分参数的检验问题中,令。即重新排列X矩阵,把最重要的解释变量放在新X矩阵最右边一列,即。和矩阵也重新排列,把与相应的元素放在最下面一行,即和。取,矩阵的右下角的元素记为。构造假设。在原假设成立下,(2.54)式简化为

(2.63) 当时,接受。 当时,拒绝。第82页,共121页,2023年,2月20日,星期二对单个参数进行检验,不但可以利用F统计量,也可以利用t统计量,两者是等价的。即

(2.64) 参数的概率为的置信区间为

(2.65) 即

(2.66) 或者

(2.67)第83页,共121页,2023年,2月20日,星期二第三节预测单值预测和的预测区间第84页,共121页,2023年,2月20日,星期二我们这里所介绍的预测方法,是建立在多元线性回归模型在预测期或预测范围内仍然成立的基础上的。无论对于时间数据模型,还是对于横断面数据模型,预测的基本前提都是由样本得到的统计规律不发生太大变化,原有回归模型的假设条件仍然成立。预测可分为事前预测和事后预测。两种预测都是在样本区间之外进行,如图2.1所示。

T1T2T3(目前)

样本区间事后预测事前预测图2.1预测过程示意图第85页,共121页,2023年,2月20日,星期二对于事后预测,被解释变量和解释变量的值在预测区间都是已知的。可以直接用实际发生值评价模型的预测能力。对于事前预测,解释变量是未发生的。(当模型中含有滞后变量时,解释变量则有可能是已知的。)当预测被解释变量时,则首先应该预测解释变量的值。对于解释变量的预测,通常采用时间序列模型。预测还分为有条件预测和无条件预测。对于无条件预测,预测式中所有解释变量的值都是已知的。所以事后预测应该属于无条件预测。当一个模型的解释变量完全由滞后变量组成时,事前预测也有可能是无条件预测。在预测期内对被解释变量进行预测,也分为单值预测和区间预测。第86页,共121页,2023年,2月20日,星期二2.3.1单值预测针对线性回归模型,对给定的解释变量矩阵,假设在预测期或预测范围内,有关系式

(2.68) 其中,是要观测的数值,为观测期的误差项。仍然满足经典假设条件,,,~(2.69)也服从于正态分布~(2.70)第87页,共121页,2023年,2月20日,星期二把样本回归扩大定义范围就可以得到

(2.71) 由上式得到的估计值,是的点估计值,也是的点估计值。 由于(2.72) 说明是的无偏估计量。第88页,共121页,2023年,2月20日,星期二另外(2.73) 可见不是的无偏估计量。但是(2.74) 说明的平均程度稳定在零。从而可是,用估计值,是作为和的单值预测具有一定的合理性。第89页,共121页,2023年,2月20日,星期二2.3.2和的预测区间一、的预测区间为了得到的置信区间,首先要得到的方差

(2.75) 其中,为标量,因此

第90页,共121页,2023年,2月20日,星期二代入(2.75)式得

(2.76)

的估计值为

(2.77)第91页,共121页,2023年,2月20日,星期二由于~(2.78) 所以~(2.79) 在给定了置信度之后,的置信区间为

(2.80)第92页,共121页,2023年,2月20日,星期二二、的预测区间为了得到的预测区间,首先要得到的方差

由于 因此

(2.81)

第93页,共121页,2023年,2月20日,星期二其中,是标量,因此 代入(2.81)式得

(2.82) 其中,是标量,因此

第94页,共121页,2023年,2月20日,星期二代入(2.82)式得(2.83) 由式(2.16) 代入(2.83)式得

(2.84)第95页,共121页,2023年,2月20日,星期二其中,矩阵的各元素中不包含,所以 代入(2.84)式得到的方差

(2.85)

用代替,得到

(2.86)第96页,共121页,2023年,2月20日,星期二由于~(2.87) 所以~(2.88) 在给定了置信度之后,的预测区间

(2.89)第97页,共121页,2023年,2月20日,星期二第四节实证分析多元回归分析

变量删选

第98页,共121页,2023年,2月20日,星期二2.4.1多元回归分析为了研究影响中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济模型。影响中国税收收入增长的因素很多,但据分析主要的因素可能有:(1)从宏观经济看,经济整体增长是税收增长的基本源泉。(2)公共财政的需求,税收收入是财政收入的主体,社会经济的发展和社会保障的完善等都对公共财政提出要求,因此对预算支出所表现的公共财政的需求对当年的税收收入可能会有一定的影响。(3)物价水平。我国的税制结构以流转税为主,以现行价格计算的GDP等指标和经营者的收入水平都与物价水平有关。(4)税收政策因素。选择包括中央和地方税收的“国家财政收入”中的“各项税收”(简称“税收收入”)作为被解释变量,以反映国家税收的增长;选择“国内生产总值(GDP)”作为经济整体增长水平的代表;选择中央和地方“财政支出”作为公共财政需求的代表;选择“商品零售物价指数”作为物价水平的代表。第99页,共121页,2023年,2月20日,星期二由于财税体制的改革难以量化,而且1985年以后财税体制改革对税收增长影响不是很大,可暂不考虑税制改革对税收增长的影响。所以解释变量设定为可观测的“国内生产总值”、“财政支出”、“商品零售物价指数”等变量。设定的多元线性回归模型为:第100页,共121页,2023年,2月20日,星期二表2.1税收收入及相关数据年份税收收入(亿元)(Y)国内生产总值(亿元)(X2)财政支出(亿元)(X3)商品零售价格指数(%)(X4)1978519.283624.11122.091122.091979537.824038.21281.79102.01980571.704517.81228.83106.01981629.894862.41138.41102.41982700.025294.71229.98101.91983775.595934.51409.52101.51984947.357171.01701.02102.8第101页,共121页,2023年,2月20日,星期二年份税收收入(亿元)(Y)国内生产总值(亿元)(X2)财政支出(亿元)(X3)商品零售价格指数(%)(X4)19852040.798964.42004.25108.819862090.7310202.22204.91106.019872140.3611962.52262.18107.319882390.4714928.32491.21118.519892727.4016909.22823.78117.819902821.8618547.93083.59102.119912990.1721617.83386.62102.919923296.9126638.13742.20105.419934255.3034634.44642.30113.2第102页,共121页,2023年,2月20日,星期二年份税收收入(亿元)(Y)国内生产总值(亿元)(X2)财政支出(亿元)(X3)商品零售价格指数(%)(X4)19945126.8846759.45792.62121.719956038.0458478.16823.72114.819966909.8267884.67937.55106.119978234.0474462.69233.56100.819989262.8078345.210798.1897.4199910682.5882067.513187.6797.0200012581.5189468.115886.5098.5200115301.3897314.818902.5899.2200217636.45104790.622053.1598.7第103页,共121页,2023年,2月20日,星期二回归结果:==第104页,共121页,2023年,2月20日,星期二1、经济意义检验模型估计结果说明,在假定其它变量不变的情况下,当年GDP每增长1亿元,税收收入就会增长0.02207亿元;在假定其它变量不变的情况下,当年财政支出每增长1亿元,税收收入会增长0.7021亿元;在假定其它变量不变的情况下,当年零售商品物价指数上涨一个百分点,税收收入就会增长23.9854亿元。这与理论分析和经验判断相一致。第105页,共121页,2023年,2月20日,星期二2、统计检验 (1)拟合优度:由表2.1中数据可以得到:,修正的可决系数为,这说明模型对样本的拟合很好。 (2)F检验:针对,给定显著性水平,在F分布表中查出自由度为和的临界值。由表2.1中得到,由于,应拒绝原假设,说明回归方程显著,即“国内生产总值”、“财政支出”、“商品零售物价指数”等变量联合起来确实对“税收收入”有显著影响。第106页,共121页,2023年,2月20日,星期二 (3)t检验:分别针对(),给定显著性水平,查分布表得自由度为临界值。由表2.1中数据可得,与、、、对应的t

统计量分别为-2.7459、3.9566、21.1247、2.7449,其绝对值均大于,这说明分别都应当拒绝(),也就是说,当在其它解释变量不变的情况下,解释变量“国内生产总值”()、“财政支出”()、“商品零售物价指数”()分别对被解释变量“税收收入”都有显著的影响。第107页,共121页,2023年,2月20日,星期二3、预测假如进行事后预测,已知2003年的国内生产总值,财政支出,商品零售物价指数分别为117251.9亿元,24649.95亿元,99.9%。利用上面的模型点预测得2003年的税收收入为19707.6亿元,税收收入均值在95%的置信度下的区间预测为[19245.11,20170.09],税收收入在95%的置信度下的区间预测为[18989.81,20425.40]。第108页,共121页,2023年,2月20日,星期二2.4.2变量删选影响财政收入的因素很多,不可能包含所有对因变量有影响的自变量,况且当自变量数目过大时,模型计算复杂且往往会扩大估计方差,降低模型精度。下面利用逐步回归法对各个可能变量进行删选,寻找对国家财政收入影响最大的变量。 根据实际情况挑选了6个变量,分别为工业产值(,亿元)、农业总产值(,亿元)、建筑业总产值(,亿元)、社会商品零售总额(,亿元)、人口数(,万人)、受灾面积(,万公顷)。具体数据如下:第109页,共121页,2023年,2月20日,星期二表2.2我国1989-2003财政收入及相关变量年度YX2X3X4X5X6X719892664.96484.04100.67948101.4112704469911990

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论