




已阅读5页,还剩119页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章经典单方程计量经济学模型:一元线性回归模型,2.1回归分析概述2.2一元线性回归模型的基本假设2.3一元线性回归模型的参数估计2.4一元线性回归模型的统计检验2.5一元线性回归模型的预测2.6一元线性回归建模实例,2.1回归分析概述,一、变量间的关系及回归分析的基本概念二、总体回归函数三、随机扰动项四、样本回归函数,一、变量间的关系及回归分析的基本概念,1、变量间的关系(1)确定性关系或函数关系:研究的是确定现象非随机变量间的关系。,(2)统计依赖或相关关系:研究的是非确定现象随机变量间的关系。,对变量间统计依赖关系的考察主要是通过相关分析(correlationanalysis)或回归分析(regressionanalysis)来完成的。相关分析主要研究随机变量间的相关形式及相关程度。变量间的相关程度可通过计算相关系数来考察。具有相关关系的变量有时存在因果关系,这时,我们可以通过回归分析来研究它们之间的具体依存关系。,课堂思考题,两者的区别,一方面,相关分析仅关注变量间的联系程度,不关注具体的依赖关系;而回归分析则关注变量间的具体依赖关系(因果关系),研究如何通过解释变量的变化来估计或预测被解释变量的变化。另一方面,在相关分析中,变量的地位是对称的。而在回归分析中,变量的地位是不对称的,有解释变量与被解释变量之分。,课堂思考题,2、回归分析的基本概念,回归分析(regressionanalysis)是研究一个变量关于另一个(些)变量的具体依赖关系的计算方法和理论。其目的在于通过后者的已知或设定值,去估计和(或)预测前者的(总体)均值。前者称为被解释变量(ExplainedVariable)或应变量(DependentVariable)。后者称为解释变量(ExplanatoryVariable)或自变量(IndependentVariable)。,课堂思考题,回归分析构成计量经济学的方法论基础,其主要内容包括:(1)根据样本观察值对经济计量模型参数进行估计,求得回归方程;(2)对回归方程、参数估计值进行显著性检验;(3)利用回归方程进行分析、评价及预测。,二、总体回归函数,回归分析关心的是根据解释变量的已知或给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能值的平均值。,例2.1.1:一个假想的社区有99户家庭组成,要研究该社区每月家庭消费支出Y与每月家庭可支配收入X的关系。即如果知道了家庭的月收入,能否预测该社区家庭的平均月消费支出水平。为达到此目的,将该99户家庭划分为组内收入差不多的10组,以分析每一收入组的家庭消费支出。,课堂思考题,一个抽样,由于调查的完备性,给定收入水平X的消费支出Y的分布是确定的。即以X的给定值为条件的Y的分布是已知的,如P(Y=561|X=800)=1/4。进而,给定某收入Xi,可得消费支出Y的条件均值,如E(Y|X=800)=605。这样,可依次求出所有不同可支配收入水平下相应家庭消费支出的条件概率和条件均值,见表2.1.2.,描出散点图可以发现:随着收入的增加,消费“平均地说”也在增加,且Y的条件均值均落在一根正斜率的直线上,这条直线称为总体回归线。,表2.1.2各收入水平组家庭消费支出的条件均值,课堂思考题,在给定解释变量Xi条件下被解释变量Yi的期望轨迹称为总体回归线(populationregressionline),或更一般地称为总体回归曲线。,称为(双变量)总体回归函数(populationregressionfunction,PRF)。,相应的函数:,总体回归函数说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。至于具体的函数形式,则由所考察的总体的特征和经济理论来决定。在例2.1中,将居民消费支出看成是其可支配收入的线性函数时,该总体回归函数为:,它是一个线性函数。其中,0,1是未知参数,称为回归系数(regressioncoefficients)。,三、随机扰动项,总体回归函数说明在给定的收入水平Xi下,该社区家庭的平均消费支出水平。但对某一个别的家庭,其消费支出可能与该平均水平有偏差。对每个个别家庭,记为观察值Yi围绕它的期望值E(Y|Xi)的离差。它是一个不可观测的随机变量,称为随机误差项或随机干扰项。,例2.1中,给定收入水平Xi,个别家庭的支出可表示为两部分之和:(1)该收入水平下所有家庭的平均消费支出E(Y|Xi),称为系统性或确定性部分;(2)其他随机或非确定性部分i。,称为总体回归函数(PRF)的随机设定形式。表明被解释变量除了受解释变量的系统性影响外,还受其他因素的随机性影响。由于方程中引入了随机项,成为计量经济学模型,因此也称为总体回归模型。,随机误差项主要包括下列因素:在解释变量中被忽略的因素的影响;变量观测值的观测误差的影响;模型关系的设定误差的影响;其它随机因素的影响。,四、样本回归函数,由于总体回归函数所需全部数据的获取往往是非常困难的,有时甚至是不可能的,于是我们关心:能从一次抽样中获得总体的近似的信息吗?如果可以,如何从抽样中获得总体的近似信息?,仍以例2.1.1(回顾)为例,假设总体中有如下一个样本,能否从该样本估计总体回归函数?,回答:能。,在例2.3.1中的应用,表2.1.3家庭消费支出与可支配收入的一个随机样本,课堂思考题,该样本的散点图(scatterdiagram):,画一条直线以尽好地拟合该散点图,由于样本取自总体,可以该直线近似地代表总体回归线。该直线称为样本回归线。,记样本回归线的函数形式为:,称为样本回归函数。,课堂思考题,样本回归模型,将样本回归线看成总体回归线的近似替代,则有,于是,同样地,样本回归函数也有如下的随机形式:,由于方程中引入了随机项,成为计量经济模型,因此也称为样本回归模型。,课堂思考题,回归分析的主要目的,就是根据样本回归函数SRF,估计总体回归函数PRF。,即,由,估计,注意:这里PRF(总体回归函数)可能永远无法知道,第一节课堂思考题,什么是回归分析?回归分析和相关分析是一回事吗,为什么?以例2.1.1为例,概述总体回归函数和样本回归函数有什么区别(提示:Y,家庭个数)。样本(总体)回归函数和样本(总体)回归模型有什么区别?,2.2一元线性回归模型的基本假设,一元线性回归模型:只有一个解释变量,i=1,2,n,Y为被解释变量,X为解释变量,0与1为待估参数,为随机干扰项。,回归分析的主要目的是要通过样本回归函数(模型)SRF尽可能准确地估计总体回归函数(模型)PRF。为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。,假设1:回归模型是正确设定的。假设2:解释变量X是确定性变量,不是随机变量。假设3:解释变量X在所抽取的样本中具有变异性,而且随着样本容量的无限增加,解释变量X的样本方差趋于一个非零的有限常数。,课堂思考题,假设4:随机误差项具有给定X条件下的零均值、同方差和不序列相关性:E(i|Xi)=0i=1,2,nVar(i|Xi)=2i=1,2,nCov(i,j|Xi,Xj)=0iji,j=1,2,n假设5:随机误差项与解释变量之间不相关。假设6:随机误差项服从零均值、同方差的正态分布。,课堂思考题,以上假设称为线性回归模型的经典假设。满足该假设的线性回归模型称为经典线性回归模型。,第二节课堂思考题,一元线性回归模型的基本假设有哪些?,2.3一元线性回归模型的参数估计,一、参数的普通最小二乘估计(OLS)二、最小二乘估计量的性质三、参数估计量的概率分布及随机干扰项方差的估计四、某城市消费规律研究,一元线性回归模型的参数估计,是在一组样本观测值(xi,yi),i=1,2,n下,通过一定的参数估计方法,估计出样本回归线。最常用的是普通最小二乘法(Ordinaryleastsquares,OLS)估计。除此之外,还有其他的估计方法,如最大似然法(ml)和矩法(mm),有兴趣的同学可自学。,给定一组样本观测值(Xi,Yi)(i=1,2,n)要求样本回归函数尽可能好地拟合这组值.普通最小二乘法(Ordinaryleastsquares,OLS)给出的判断标准是:二者之差的平方和最小。,一、参数的普通最小二乘估计,课堂思考题,根据微积分的知识,当Q对两个参数的偏导数为0时,Q达到最小,即:,记,解方程得到参数估计量:,由于参数的估计结果是通过最小二乘法得到的,故称为普通最小二乘估计量(ordinaryleastsquaresestimators)。,课堂思考题,例2.3.1:在上述家庭可支配收入-消费支出例中,对于所抽出的一组样本数,参数估计的计算可通过下面的表2.3.1进行。,系数估计,表2.3.1参数估计计算表,因此,由该样本估计的回归方程为:,拟合优度,统计检验,预测,根据公式与前页的计算:,四、最小二乘估计量的性质,当模型参数估计出后,需考虑参数估计值的精度,即是否能代表总体参数的真值,或者说需考察参数估计量的统计性质。一个用于考察总体的估计量,可从如下几个方面考察其优劣性:线性性,即它是否是另一随机变量的线性函数;,无偏性,即它的均值或期望值是否等于总体的真实值;有效性,即它是否在所有线性无偏估计量中具有最小方差。这三个准则也称作估计量的小样本性质。拥有这类性质的估计量称为最佳线性无偏估计量(bestlinerunbiasedestimator,BLUE)。,课堂思考题,当不满足小样本性质时,需进一步考察估计量的大样本或渐近性质:渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。,高斯马尔可夫定理(Gauss-Markovtheorem):在给定经典线性回归的假定下,最小二乘估计量是具有最小方差的线性无偏估计量。,五、参数估计量的概率分布及随机干扰项方差的估计,2、随机误差项的方差2的估计,2又称为总体方差。,由于随机项i不可观测,只能从i的估计残差ei出发对总体方差进行估计。可以证明,2的最小二乘估计量为,它是关于2的无偏估计量。,课堂思考题,其中,六、某城市消费规律研究,1、设计方程:Y=C(1)+C(2)*XX=可支配收入Y=消费性支出,2、搜集并整理数据,3、利用软件进行参数估计,4、写出回归结果,利用输出结果替换方程的系数:Y=C(1)+C(2)*XX=可支配收入Y=消费性支出得到:Y=237.75+0.75*X,预测,课堂思考题,第3节课堂思考题,概述最小二乘法估计。最小二乘估计量有哪些统计性质?随机干扰项方差的最小二乘估计量是?回顾“六、某城市消费规律研究”,概括建模步骤。,第3节课后练习题,本章练习题11的(1),P60。本章练习题12的(1),P61。,2.4一元线性回归模型的统计检验,一、拟合优度检验二、变量的显著性检验三、参数的置信区间,回归分析是要通过样本所估计的参数来代替总体的真实参数,或者说是用样本回归线代替总体回归线。尽管从统计性质上已知,如果有足够多的重复抽样,参数的估计值的期望(均值)就等于其总体的参数真值,但在一次抽样中,估计值不一定就等于该真值。,那么,在一次抽样中,参数的估计值与真值的差异有多大,是否显著,这就需要进一步进行统计检验。主要包括拟合优度检验、变量的显著性检验及参数的区间估计。,一、拟合优度检验,拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。度量拟合优度的指标:判定系数(可决系数)R2,1、总离差平方和的分解(R2的推导),已知由一组样本观测值(Xi,Yi),i=1,2,得到如下样本回归直线,R2的定义,由前图可以看出,如果Yi=i(ei=0)即实际观测值落在样本回归“线”上,则拟合最好。,对于所有样本点,则需考虑这些点与样本均值离差的平方和,可以证明:,TSS=ESS+RSS,记,总体平方和(TotalSumofSquares),回归平方和(ExplainedSumofSquares),残差平方和(ResidualSumofSquares),Y的观测值围绕其均值的总离差(TSS)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS):在给定样本中,TSS不变如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大可以用ESS/TSS(=R2)来度量拟合的程度,2、可决系数R2统计量,称R2为(样本)可决系数/判定系数(coefficientofdetermination)。,可决系数的取值范围:(0,1)R2越接近1,说明实际观测点离样本线越近,拟合优度越高。,R2的图示,课堂思考题,在例2.1.1的收入-消费支出例子中,根据相关计算,有,这说明在家庭消费支出的总离差中,由家庭可支配收入的离差解释的部分占99.35%,模型的拟合优度较高。,根据定义,可以看出:可决系数是一个非负的统计量。它也是随着抽样的不同而不同。在多变量的情形下,可决系数需要调整(见第3章)。,二、变量的显著性检验,回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验。,变量的显著性检验所应用的方法是数理统计学中的假设检验。计量经济学中,主要是针对变量的参数真值是否为零来进行显著性检验。,1、假设检验,所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受原假设。,假设检验采用的逻辑推理方法是反证法:先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。判断结果合理与否,是基于“小概率事件不易发生”这一原理的。,2、变量的显著性检验,检验步骤:,(1)对总体参数提出假设H0:1=0,H1:10,(2)以原假设H0构造t统计量,并由样本计算其值,(3)给定显著性水平,查t分布表得临界值t/2(n-2),(4)比较,判断若,则拒绝H0,接受H1;若,则拒绝H1,接受H0;,课堂思考题,该统计量服从自由度为n-2的t分布,检验的原假设为。,而对于常数项0,可构造如下t统计量进行显著性检验:,在前述收入-消费支出例子中,首先计算随机干扰性的方差的估计值:,由系数和标准差,t统计量的计算结果分别为:,给定显著性水平=0.05,查t分布表(教材354页,或下页)得临界值t0.05/2(8)=2.306|t1|2.306,说明家庭可支配收入在95%的置信度下显著,即通过了变量的显著性检验。同样地,|t2|2.306,表明在95%的置信度下,拒绝截距项为零的假设。,置信区间,课堂思考题,用伴随概率判断显著性,在Eviews软件给出的计算结果中,没有给出检验的临界值,作为一种等价的做法,给出了变量显著性检验的伴随概率这是一种更精确、方便的检验方法。,对于变量显著性的t检验:若伴随概率的数值小于0.01,则说明变量在0.01的水平上是显著的;若伴随概率的数值小于0.05,则说明变量在0.05的水平上是显著的;若伴随概率的数值大于0.01而小于0.05,则说明变量在0.01的水平上是不显著的,但在0.05的水平上是显著的;等等。,举例,课堂思考题,根据前页的输出结果:常数项C是不显著的,即使在0.1的水平上。GDP在0.05的水平上是显著的(但在0.01的水平上不显著)。CS(-1)在0.01的水平上是显著的。,三、参数的置信区间,统计检验虽然可以通过一次抽样的结果检验总体参数可能的假设值的范围(如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。,要判断样本参数的估计值在多大程度上可以“近似”地替代总体参数的真值,往往需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数检验的置信区间估计。,如果存在这样一个区间,便称之为置信区间;1-称为置信系数(置信度),称为显著性水平;置信区间的端点称为置信限或临界值(criticalvalues)。,在变量的显著性检验中已经知道:,这意味着,如果给定置信度(1-),从分布表中查得自由度为(n-2)的临界值,那么t值处在(-t/2,t/2)的概率是(1-)。表示为:,即,i(i=1,2)的置信区间,课堂思考题,于是得到:(1-)的置信度下i的置信区间是,在前述收入-消费支出例中,如果给定=0.01,查表得:,由于,于是,1、0的99%的置信区间分别为:(0.6056,0.7433)(-6.719,291.52),课堂思考题,由于置信区间一定程度地给出了样本参数估计值与总体参数真值的“接近”程度,因此置信区间越小越好。而(1-)的置信度下i的置信区间是,提高拟合优度,要缩小置信区间,需要(1)增大样本容量n。因为在同样的置信水平下,n越大,t分布表(教材354页)中的临界值越小(见置信区间公式),(2)提高模型的拟合优度因为样本参数估计量的标准差与残差平方和呈正比;模型拟合优度越高,回归平方和越大,残差平方和应越小,参数估计值的标准差越小(见置信区间公式)。,第4节课堂思考题,可决系数是怎么定义的,怎么运用该指标判断模型的拟合优度?结合收入消费例子,怎么运用t检验判断变量的显著性?结合Eviews输出表,利用伴随概率判断解释变量的显著性。置信区间公式中的各个字母分别代表什么,在收入消费例子中如何根据t检验构造参数的置信区间?,第4节课后练习题,本章练习题11的(2)、(3),P6061。本章练习题12的(2),P61。,一、预测方法二、两个例子,2.5一元线性回归分析的预测,一、预测方法,对于一元线性回归模型,给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值0,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个近似估计。可以证明:这个估计是无偏的。做这种预测是有现实意义的。,课堂思考题,在前述收入-消费支出例子中,得到的样本回归函数为:,则在X0=1000处(注意,1000不在抽样的样本里面),0=142.4+0.6701000=812.4,例2.5.1,课堂思考题,例2.5.2,在前面,我们得到了某城市1981-2002年的消费函数。设该城市2003年的可支配收入为14000,根据消费函数,该市2003年的消费性支出应为:Y=237.75+0.75*14000=10737.75如果事实上该市2003年的消费性支出为9000,那么就说明该市2003年的消费习惯与前20年相比发生了很大变化(该市居民因为某种原因大幅度压缩了开支)。,课堂思考题,第5节课堂思考题,被解释变量的预测值用什么来代替,它是条件均值或个别值的无偏估计吗?举例说明。,第5节课后练习题,本章练习题12的(3)(只求预测值即可),P61。,2.6一元线性回归建模实例,在本节,我们通过两个实例演示计量经济建模分析的一般过程。第一个例子用的是截面数据,而第二个例子用的是时间序列数据。这两类数据是最基础的、应用最多的数据。,例2.6.1,为考察中国城镇居民2006年人均可支配收入与消费支出的关系,表2.6.1给出了内地31个省区以当年价测算的城镇居民家庭年人均收入(X)与年人均支出(Y)。由于表2.6.1是同一年份中不同地区的数据,因此是截面数据。截面数据:同一时间点上不同地区的样本数据。时间序列数据:同一地区不同时间点上的样本数据。,课堂思考题,表2.6.1中国内地31个省区城镇居民家庭人均全年可支配收入与消费性支出(单位:元),注:教材(第54页)中该表的X与Y颠倒了。,拟建立如下一元线性回归模型:,一、设计模型,其中,Y=人均消费支出,X=人均可支配收入。,二、收集与整理数据,在Excel表格中整理数据:数据要齐全表格要整齐命名变量(用英文字母),整理后的数据表,三、模型估计,将数据导入Eviews软件,进行估计Eviews软件给出的回归分析结果见下表,统计检验,写出方程,课堂思考题,三、模型估计,根据Eviews输出结果写出回归方程:Yi=281.50+0.7146Xi(1.047)(31.395)R2=0.9714,F=985.66,DW=1.4615,四、统计检验,对估计结果进行统计检验可决系数R2=0.9714,表明城镇居民人均消费支出变化的97.14%可由人均可支配收入的变化来解释,模型在整体上拟合得非常好。t检验值:C:1.047,X:31.395临界值(查表P.354):t0.05/2(29)=2.045常数项不显著,斜率项显著。,五、经济意义解释,(常数项不显著,无需解释;另外,常数项也不重要。)0斜率项=0.71461,符合经济理论中边际消费倾向在0与1之间的绝对收入假说,表明在2006年,中国城镇居民家庭人均可支配收入每增加1元,人均消费支出增加0.7146元。,六、预测(非必需步骤),假设我们需要关注2006年人均可支配收入在20000元这一档的中国城镇家庭的人均消费支出问题,将可支配收入20000元代入估计出的模型,求出预测值:Y=281.50+0.714620000=14572.6(元)可以看出,预测的人均消费支出与上海的数据相差不大;2
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- DB36/T 979-2017电子政务外网安全接入平台技术规范
- 幼儿园大班科学《会吹气球的瓶子》微课件
- DB32/T 4655-2024内河智慧航道建设总体技术规范
- DB32/T 4609-2023地表水环境质量监测网断面(点位)标识设置与管理技术规范
- 高效能地面打磨机行业深度调研及发展项目商业计划书
- 民用建筑可行性研究报告编制要点考试 100分
- 高精度轴承座安装工具企业制定与实施新质生产力项目商业计划书
- 2025年水族陶瓷产品行业深度研究分析报告
- 大学生材料作文常见错误分析
- 2025年气包网络弹力纱行业深度研究分析报告
- JJF(津) 54-2021 液体流量计在线校准规范
- 关于进一步厉行节约推行无纸化办公的通知
- 刘德武教学课件小学数学一年级下册《找规律》
- 河池市大任产业园污水处理厂(江南污水处理厂二期)项目环境影响报告书
- DB22-T 5118-2022 建筑工程资料管理标准
- 集体备课《发生在肺内的气体交换》
- 六年级下册生命生态安全知识要点
- JJG 211-2021 亮度计检定规程(高清最新版)
- 高压喷射注浆工程施工工艺标准
- 最新部编版九年级语文下册课件(完美版)写作布局谋篇
- 农村水电站岗位设置及定员标准(全面)
评论
0/150
提交评论