计量经济学重点知识整理_第1页
计量经济学重点知识整理_第2页
计量经济学重点知识整理_第3页
计量经济学重点知识整理_第4页
计量经济学重点知识整理_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、计量经济学重点点知识整理1一般性定义计量经济学是以以经济理论和和经济数据的的事实为依据据,运用数学学和统计学的的方法,通过过建立数学模模型来研究经经济数量关系系和规律的一一门经济学科科。 研究的主主体(出发点点、归宿、核核心): 经济现象象及数量变化化规律 研究的工具具(手段): 模型数学和统计计方法 必须明确: 方法手段段要服从研究究对象的本质质特征(与数数学不同),方法是为经经济问题服务务2注意:计量经经济研究的三三个方面理论:即说明所所研究对象经经济行为的经经济理论 计量经济济研究的基础础数据:对所研究究对象经济行行为观测所得得到的信息计量经济济研究的原料料或依据方法:模型的方方法与估计

2、、检检验、分析的的方法计量经济济研究的工具具与手段三者缺一不可3计量经济学的的学科类型理论计量经济济学 研究经经济计量的理理论和方法 应用计量经经济学:应用计量经经济方法研究究某些领域的的具体经济问问题4区别: 经济理理论重在定性性分析,并不不对经济关系系提供数量上上的具体度量量 计量量经济学对经经济关系要作作出定量的估估计,对经济济理论提出经经验的内容5计量经济学与与经济统计学学的关系联系:经济统计侧重重于对社会经经济现象的描描述性计量经济统计提供供的数据是计计量经济学据据以估计参数数、验证经济济理论的基本本依据经济现象不能能作实验,只只能被动地观观测客观经济济现象变动的的既成事实,只只能依

3、赖于经经济统计数据据6计量经济学与与数理统计学学的关系联系: 数数理统计学是是计量经济学学的方法论基基础 区别别: 数理统计学学是在标准假假定条件下抽抽象地研究一一 般的随机变变量的统计规规律性; 计计量经济学是是从经济模型型出发,研究究模型参数 的估计和推推断,参数有有特定的经济济意义,标准准 假定条件经经常不能满足足,需要建立立一些专门的的 经济计量方方法3、计量经济学学的特点:计量经济学的一一个重要特点点是:它自身身并没有固定定的经济理论论,而是根据据其它经济理理论,应用计计量经济方法法将这些理论论数量化。4、计量经济学学为什么是一一门单独的学学科计量经济学是经经济理论、数数理经济、经经

4、济统计与数数理统计的混混合物。1、经济理论所所作的陈述或或假说大多数数是定性性质质的,计量经经济学对大多多数经济理论论赋予经验内内容。2、经济统计学学的问题主要要是收集、加加工并通过图图或表的形式式以展现经济济数据,他们们不考虑怎样样用所收集的的数据来检验验经济理论。3、虽然数理统统计学提供了了这一行业中中使用的许多多工具,但由由于大多数经经济数据的独独特性,计量量经济学家常常常需要有特特殊的方法。2、计量经济济学的方法论论 1、用计量经经济学来分析析问题的一般般方法;(1)理论或假假说的陈述(2)理论的数数学模型的设设定(3)理论的计计量模型的设设定(4)获取数据据(5)计量经济济模型的参数

5、数估计(6)模型检验验(假设检验验)(7)模型的应应用:A、预预报或预测 B、利用模模型进行控制制或制定政策策2、应用举例(消消费函数):(1)理论或假假说的陈述: 凯恩斯认为为:随着收入入的增加,消消费也会增加加,但是消费费的增加不及及收入增加的的多。即边际际消费倾向递递减。(2)理论的数数学模型设定定: Y = a + bX 其中y为消消费支出, x为收入,为模型的的参数,分别别代表截距和和斜率系数。斜斜率系数就就是消费边际际倾向MPCC的度量。 其中左边的的Y称为应变变量,方程右右边的X称为为自变量或解解释变量。 该方程表明明消费和收入入之间存在准准确的一一对对应关系。 (3)计量模型型

6、的设定: 考虑到经济济变量间的非非准确关系,则则消费函数的的计量模型可可以设定为: Y = a + BBx + 其中被称为干扰扰项,或误差差项,是一个个随机 变量量,它有良好好定义的概率率性质。 是从模型型中省略下来来的而又集体体影响着Y的的全部变量的的替代物(就就是除了收入入外,其它可可能影响消费费的所有因素素)。(4)数据的获获得 各种种统计年鉴,企企业报表和相相关职能部门门公布的统计计数据 。(该该例中我们可可以通过中国国统计年鉴获获取相关数据据)(5)参数估计计(利用各种种统计或计量量软件来进行行如:Eviiews) 以美国19980-19991年的数数据,通过EEviewss5.0的

7、计计算, 我们们可得如下消消费函数方程程: -2231.8 + 0.77196 其中-231.88 0.7196 它表明在11980-11991年间间,实际收入入每增加一元元,美国人的的平均消费增增加0.722元。(6)模型检验验(假设检验验)A、对理论或假假说的检验 弗里德曼曼认为凡是不不能通过经验验数据检验(实实证检验)的的理论或假设设,都不能作作为科学探索索的一部分。 0 0.7719611B、对模型的检检验 统计推断检检验:模型的的拟合优度检检验、变量的的显著性检验验 计量经济学学检验:平稳稳性、多重共共线性、自相相关、异方差差 等方面的的检验、(7)预报或预预测(8)利用模型型进行控

8、制或或制定政策4.计量经济学学模型的应用用 一、结构分析经济学中的结构构分析是对经经济现象中变变量之间相互互关系的研究究。 结构分析所采用用的主要方法法是弹性分析析、乘数分析析与比较静力力分析。 计量经济学模型型的功能是揭揭示经济现象象中变量之间间的相互关系系,即通过模模型得到弹性性、乘数等。应用举例二、经济预测计量经济学模型型作为一类经经济数学模型型,是从用于于经济预测,特特别是短期预预测而发展起起来的。 计量经济学模型型是以模拟历历史、从已经经发生的经济济活动中找出出变化规律为为主要技术手手段。 对于非稳定发展展的经济过程程,对于缺乏乏规范行为理理论的经济活活动,计量经经济学模型预预测功能

9、失效效。模型理论方法的的发展以适应应预测的需要要。 三、政策评价政策评价的重要要性。经济政策的不可可试验性。计量经济学模型型的“经济政策实实验室”功能。四、理论检验与与发展实践是检验真理理的唯一标准准。 任何经济学理论论,只有当它它成功地解释释了过去,才才能为人们所所接受。 计量经济学模型型提供了一种种检验经济理理论的好方法法。 对理论假设的检检验可以发现现和发展理论论。 3 变量 数数据 参数 与模型1、计量经济模模型中的变量量(1)从变量的的因果关系分分: 自变量 因(应)变变量 解释变变量 被被解释变量(2)从变量的的性质分 内生变量量:模型求解解的结果 外生变量量:2、计量经济学学中应

10、用的数数据(1)时间序列列数据(2)截面数据据(3)混合数据据(4)虚拟变量量数据:一些些定性的事实实,不能直接接用一般的数数据去计量。3、参数及其估估计准则(1)无偏性(2)最小方差差性(最优无无偏估计)(3)一致性4、计量模型的的基本函数形形式(1)线性模型型(2)非线性模模型(可变为为线性形式的的非线性模型型) 双对数模模型 半对数模模型 倒数变换换模型第二章 一元回归模模型概述回归分析的性质质 回归分析的一些些基本概念对线性的几点说说明2.1 回回归分析的性性质一、变量间的关关系及回归分分析的基本概概念1、变量间的关关系 经济变变量之间的关关系,大体可可分为两类:(1)确定性关关系或函

11、数关关系:研究的的是确定现象象非随机变量量间的关系。(2)统计依赖赖或相关关系系:研究的是是非确定现象象随机变量间间的关系。(以以一定的统计计规律呈现出出来的关系)例如: 函数关系:统计依赖关系/统计相关关关系:注意:不线性相关并并不意味着不不相关;有相关关系并并不意味着一一定有因果关关系;回归分析/相相关分析研究究一个变量对对另一个(些些)变量的统统计依赖关系系,但它们并并不意味着一一定有因果关关系。相关分析对称称地对待任何何(两个)变变量,两个变变量都被看作作是随机的。回回归分析对变变量的处理方方法存在不对对称性,即区区分应变量(被被解释变量)和和自变量(解解释变量):前者是随机机变量,后

12、者者不是。回归与因果关系系虽然回归分析研研究一个变量量对另一(些些)变量的依依赖关系,但但它并不意味味着因果关系系。Kenddall和SStuartt认为一个统统计关系式不不管多么强,也也不管多么有有启发性,却却永远不能确确立因果方面面的联系,对对因果关系方方面的理念必必须来自统计计学之外,最最终来自这种种或那种理论论。 从逻辑上说说,统计关系系式本身不可可能意味着任任何因果关系系。要谈因果果关系,必须须诉诸先验或或理论上的思思考。2.2回归分分析的基本思思想: 一、利利用样本来推推断总体 11、总回归函函数(PRFF) 22、样本回归归函数(SRRF)3、样本回归函函数对总回归归函数的进行行

13、拟合: (1)最小二二乘法(OLLS) (2)最小二二乘法的基本本假定 (3)最小二二乘估计的精精度或标准误误(4)最小二乘乘估计量的性性质 (5)拟合优优度的度量 (6)区间估估计或假设检检验4、利用回归方方程进行分析析、评价及预预测。二、回归分析的的基本概念1、 回归分分析(reggressiion annalysiis)是研究究一个变量关关于另一个(些些)变量的具具体依赖关系系的计算方法法和理论。 其用意:在于于通过后者的的已知或设定定值,去估计计和(或)预预测前者的(总总体)均值。 这这里:前一个个变量被称为为被解释变量量或因变量对对变量测量尺尺度的注解: 分类尺度度(名义尺度度)、顺

14、序尺度(序序数尺度)、间隔尺度(区区间尺度)、比率尺度(比比率尺度)三、总体回归函函数由于变量间关系系的随机性,回回归分析关心心的是根据解解释变量的已已知或给定值值,考察被解解释变量的总总体均值,即即当解释变量量取某个确定定值时,与之之统计相关的的被解释变量量所有可能出出现的对应值值的平均值。例2.1:一个个假想的社区区有100户户家庭组成,要要研究该社区区每月家庭消消费支出Y与与每月家庭可可支配收入XX的关系。 即如果知道道了家庭的月月收入,能否否预测该社区区家庭的平均均月消费支出出水平。为达到此目的,将将该100户户家庭划分为为组内收入差差不多的100组,以分析析每一收入组组的家庭消费费支

15、出。分析:(1)由由于不确定因因素的影响,对对同一收入水水平X,不同同家庭的消费费支出不完全全相同;(2)但由于调调查的完备性性,给定收入入水平X的消消费支出Y的的分布是确定定的,即以XX的给定值为为条件的Y的的条件分布(CCondittionall disttributtion)是是已知的, 如: P(Y=561|XX=800)=1/4。因此,给定收入入X的值Xii,可得消费费支出Y的条条件均值(ccondittionall meann)或条件期期望(connditioonal eexpecttationn): E(Y|X=XXi)该例中:E(YY | X=800)=561描出散点图发现现:

16、随着收入入的增加,消消费“平均地说”也在增加,且且Y的条件均均值均落在一一根正斜率的的直线上。这这条直线称为为总体回归线线。 005001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消费支出Y(元)概念:在给定解释变量量Xi条件下下被解释变量量Yi的期望望轨迹称为总总体回归线,或或更一般地称称为总体回归归曲线。相应的函数:称称为(双变量量)总体回归归函数。含义:回归函数数(PRF)说说明被解释变变量Y的平均均状态(总体体条件期望)随随解释变量XX变化的规律律。函数形式:可以以是线性或非非线性的。例2.1中

17、,将将居民消费支支出看成是其其可支配收入入的线性函数数时: 为一线性函数。其其中,b0,b1是未知参数数,称为回归归系数(reegresssion ccoeffiicientts)。 。四、随机扰动项项总体回归函数说说明在给定的的收入水平XXi下,该社社区家庭平均均的消费支出出水平。但对某一个别的的家庭,其消消费支出可能能与该平均水水平有偏差。记:称mi为观察值值Yi围绕它的的期望值E(Y|Xi)的离,是一一个不可观测测的随机变量量,又称为随随机干扰项或或随机误差项项。 例2.1中,个个别家庭的消消费支出为:(*)即,给定收入水水平Xi ,个别家庭的的支出可表示示为两部分之之和:(1)该收入水

18、水平下所有家家庭的平均消消费支出E(Y|Xi),称为系统统性(sysstemattic)或确确定性(deetermiinistiic)部分。 (2)其其他随机或非非确定性(nnonsysstemattic)部分分i。(*)式称为总总体回归函数数PRF的随随机设定形式式。表明被解解释变量除了了受解释变量量的系统性影影响外,还受受其他因素的的随机性影响响。由于方程中引入入了随机项,成成为计量经济济学模型,因因此也称为总总体回归模型型。随机误差项主要要包括下列因因素的影响:随机误差项是指指从模型中省省略下来的而而又集体地影影响着Y的全全部变量的替替代物。1)在解释变量量中被忽略的的因素的影响响;2)

19、变量观测值值的观测误差差的影响;3)其它随机因因素的影响。产生并设计随机机误差项的主主要原因:1)理论的含糊糊性; 22)数据的欠欠缺(糟糕的的替代变量) 3)核心变量与与周边变量; 4) 节省省原则;5)人类行为的的内在随机性性;6)错误误的函数形式式;35五、样本回回归函数(SSRF)问题:能从一次次抽样中获得得总体的近似似的信息吗?如果可以,如如何从抽样中中获得总体的的近似信息?例2.2:在例例2.1的总总体中有如下下一个样本,总体的信息往往往无法掌握,现现实的情况只只能是在一次次观测中得到到总体的一个个样本。问:能否从该样样本估计总体体回归函数PPRF?回答:能核样本的散点图图(sca

20、ttter ddiagraam):样本散点图近似似于一条直线线,画一条直直线以尽好地地拟合该散点点图,由于样样本取自总体体,可以该线线近似地代表表总体回归线线。该线称为为样本回归线线。记样本回归线的的函数形式为为:称为样本回归函函数。 注意:这里将样样本回归线看看成总体回归归线的近似替替代则样本回归函数的的随机形式/样本回归模模型:同样地,样本回回归函数也有有如下的随机机形式: 由于方程中引入入了随机项,成成为计量经济济模型,因此此也称为样本本回归模型。回归分析的主主要目的:根根据样本回归归函数SRFF,估计总体体回归函数PPRF。即,根据 估计注意:这里PRRF可能永远远无法知道。2.3 对

21、对线性的几点点说明一、对变量之间间关系为线性性二、对参数为线线性三、本身为非线线性,但通过过变形可以变变为线性关系系经典回归分析主主要考虑对参参数是线性的的形式,对变变量之间的关关系不作线性性要求。第三章 一元元回归模型的的参数估计 一、参数的普通通最小二乘估估计(OLSS)二、最小二乘估估计量的数值值性质三、一元线性回回归模型的基基本假设四、最小二乘估估计量的统计计性质五、参数估计量量的概率分布布及随机干 扰项方方差的估计 六、最小二乘估估计(OLSS)的精度或或标准误单方程计量经济济学模型分为为两大类: 线性模型和和非线性模型型线性模型中,变变量之间的关关系呈线性关关系非线性模型中,变变量

22、之间的关关系呈非线性性关系一元线性回归模模型:只有一一个解释变量量 i=1,2,nnY为被解释变量量,X为解释变量量,b0与b1为待估参数数,m为随机干扰扰项回归分析的主要要目的是要通通过样本回归归函数(模型型)SRF尽尽可能准确地地估计总体回回归函数(模模型)PRFF。估计方法有多种种,其中最广广泛使用的是是普通最小二二乘法。因为为OLS具有有良好的数值值性质和统计计性质。同时时,在一系列列假定下OLLS估计量具具有BLUEE性质,能满满足我们用样样本推断总体体的要求。注:实际这些假假设与所采用用的估计方法法紧密相关。 一、参数的普通通最小二乘估估计(OLSS) 给定一组样本观观测值(Xii

23、, Yi)(ii=1,2,n)要求样样本回归函数数尽可能好地地拟合这组值值.离差要求样本函数仅仅可能好的拟拟合这组数值值,我们可以以考虑使观测值Yi与与样本回归值值之差(残差差ei)尽可可能的小,使之尽可能的接接近PRF,即:注:在统计分析析中,如没有有特殊说明,离离差一般是指指观测值与其其均值的差,即即这种方法尽管有有直观上的说说服力,却不不是一个很好好的准则,如如果采用 即minnei那么在总和(ee1+e2+e3+e44+ei )中,无论残差离样本回回归函数SRRF远还是近近,都得到同样的权重重。结果很可可能ei离开开SRF散布得很远,但但代数和很小小甚至为零。普通最小二乘法法给出的判断

24、断标准是:二二者之差的平平方和最小。为什么要用两者者之差平方和和最小:1、它根据各观观测值离SRRF的远近不不同分别给予予不同的权重重。从而eii越大,ei2也越越大。2、 ei22f(b0 , b1 ),即残残差平方和是是估计量b0 ,b1 的某个函函数。 3、用OLS原原理或方法选选出来的b0 ,b1,将使得对对于给定的样样本或数据残残差平方和尽尽可能的小。方程组(*)称称为正规方程程组(norrmal eequatiions)。 记上述参数估计量量可以写成: 称为OLS估计计量的离差形形式 由于参数数的估计结果果是通过最小小二乘法得到到的,故称为为普通最小二二乘估计量。 二、OLS估计计

25、量的数值性性质 OLS数值性质质是指运用最最小二乘法而而得以成立的的那些性质,而而不管这些数数据是怎样产产生的。1、OLS估计计量纯粹是用用可观测的量量(即样本)来来表达的,因因此这些量是是容易计算的的。2、这些量是点点估计量。3、一旦从样本本数据得到OOLS估计值值,便容易画画出样本回归归线,这样得得到的回归线线有如下性质质:(1)它通过YY和X的样本本均值。即(2)估计的YY均值等于实实测的Y均值值。即(3)残差eii的均值为零零。即ei=0。据据此,我们可可以推出样本回归函函数的离差形形式。即注意:在计量经经济学中,往往往以小写字字母表示对均均值的离差。 记 则有 可得 (*)(*)式为

26、样样本回归函数数的离差形式式。(4)残差eii和预测的YYi值不相关关。即(5)残差eii和Xi不相相关。即 eiXi=0三、线性回归模模型的基本假假设为什么要做出假假定:1、虽然通过OOLS,我们们可以获得 , 的估计值,但但我们的目的的不仅仅是为为了得到它们们的值。2、更为重要的的是对b0 , b1与真实的b0 , b1 之间的替替代性进行推推断。3、对Yi与EE(Y|X=Xi)之间间的差距到底底有多大进行行推断。4、在模型 中, ei是一随随机变量,如如果我们不知知道xi、ei是怎样产产生的,就无无法对Yi做出任何何推断,也无无法对b0 , b1 做出任何何推断。 5、在一系列列假定下,

27、OOLS具有良良好的统计性性质,能够满满足我们对b0 , b1 作出推断断的要求。线性回归模型的的基本假设假设1、线性回回归模型,回回归模型对参参数而言是线线性的; 假设2、解解释变量X是是确定性变量量,不是随机机变量; 假设3、随随机误差项具有零均值值、同方差和和不序列相关关性: E(mmi)=0 i=11,2, ,n Varr(mi)=sm2 i=11,2, ,n Covv(mi, mj)=0 ij i,j= 1,2, ,n 假设4、随随机误差项与解释变量量X之间不相关关:Cov(Xi, mi)=0 i=1,2, ,n假设5、服从从零均值、同同方差、零协协方差的正态态分布 miN(0, s

28、2 ) i=1,2, ,n假设6、观测次次数n必须大大于待估的参参数个数;假设7、X值要要有变异性;假设8、正确的的设定了回归归模型;也被被称为模型没没有设定偏误误(speccificaation errorr) ;假设9、在多元元回归模型中中没有完全的的多重共线性性。注意:1、如果假设22、3满足,则则假设4也满满足;2、如果假设55满足,则假假设3也满足足。以上假设也称为为线性回归模模型的经典假假设或高斯(GGauss)假假设,满足该该假设的线性性回归模型,也也称为经典线线性回归模型型。 另外,在进行模模型回归时,还还有一个暗含含的假设: 假设10:随着着样本容量的的无限增加,解解释变量X

29、的的样本方差趋趋于一有限常常数。即假设5旨在排除除时间序列数数据出现持续续上升或下降降的变量作为为解释变量,因因为这类数据据不仅使大样样本统计推断断变得无效,而而且往往产生生所谓的伪回回归问题。 四、假定条件下下的最小二乘乘估计量的统统计性质当模型参数估计计出后,需考考虑参数估计计值的精度,即即是否能代表表总体参数的的真值,或者者说需考察参参数估计量的的统计性质。一个用于考察总总体的估计量量,可从如下下几个方面考考察其优劣性性: (1)线性性性,即它是是否是另一随随机变量的线线性函数; (2)无偏偏性,即它的的均值或期望望值是否等于于总体的真实实值; (3)有效效性,即它是是否在所有线线性无偏

30、估计计量中具有最最小方差。(4)渐近无偏偏性,即样本本容量趋于无无穷大时,是是否它的均值值序列趋于总总体真值;(5)一致性,即即样本容量趋趋于无穷大时时,它是否依依概率收敛于于总体的真值值;(6)渐近有效效性,即样本本容量趋于无无穷大时,是是否它在所有有的一致估计计量中具有最最小的渐近方方差。这三个准则也称称作估计量的的小样本性质质。 拥有这类类性质的估计计量称为最佳佳线性无偏估估计量(beest liiner uunbiassed esstimattor, BBLUE)。 当不满足小样本本性质时,需需进一步考察察估计量的大大样本或渐近近性质:高斯马尔可夫夫定理在给定经典线性性回归的假定定下,

31、最小二二乘估计量是是具有最小方方差的线性无无偏估计量。证证:易知 故同样地,容易得得出 (2)证明最小小方差性其中,ci=kki+di,ddi为不全为为零的常数则容易证明普通最小二乘估估计量称为最最佳线性无偏偏估计量 由于最小二乘估估计量拥有一一个“好”的估计量所所应具备的小小样本特性,它它自然也拥有有大样本特性性。 五、参数估计量量的概率分布布及随机干扰扰项方差的估估计 2、随机误差项项m的方差s2的估计由于随机项mii不可观测,只只能从mi的估计残差ei出发,对对总体方差进进行估计。 2又称为总体体方差。可以证明,s22的最小二乘乘估计量为它它是关于s2的无偏估计计量。 第四章一元线性性回

32、归模型的的统计检验 一、拟合优度检检验 二、变量的的显著性检验验 三、参数的的置信区间 回归分析是要通通过样本所估估计的参数来来代替总体的的真实参数,或或者说是用样样本回归线代代替总体回归归线。尽管从统计性质质上已知,如如果有足够多多的重复抽样样,参数的估估计值的期望望(均值)就就等于其总体体的参数真值值,但在一次次抽样中,估估计值不一定定就等于该真真值。 那么,在一次次抽样中,参参数的估计值值与真值的差差异有多大,是是否显著,这这就需要进一一步进行统计计检验。 主要包括拟合合优度检验、变变量的显著性性检验及参数数的区间估计计。一、拟合优度检检验 拟合优度检验:对样本回归归直线与样本本观测值之

33、间间拟合程度的的检验。 度量拟合合优度的指标标:判定系数数(可决系数数)r2(二二元回归)或或R2(多元元回归)问题:采用普通通最小二乘估估计方法,已已经保证了模模型最好地拟拟合了样本观观测值,为什什么还要检验验拟合程度?1、总离差平方方和的分解已知由一组样本本观测值(XXi,Yi),ii=1,2,n得到如如下样本回归归直线 如果Yi=ii 即实实际观测值落落在样本回归归“线”上,则拟合合最好。可认为,“离差差”全部来自回回归线,而与与“残差”无关。对于所有样本点点,则需考虑虑这些点与样样本均值离差差的平方和。我们可以得到:方程两边同时平平方,求和得得:TSS=ESSS+RSSY的观测值围绕绕

34、其均值的总总离差(tootal vvaria可可分解为两部部分:一部分分来自回归线线(ESS),另一部分分则来自随机机势力(RSSS)。在给定样本中,TTSS不变, 如如果实际观测测点离样本回回归线越近,则则ESS在TTSS中占的的比重越大,因因此,拟合优度:回归平方和和ESS/YY的总离差TTSS2、可决系数RR2统计量 称 R2 为(样样本)可决系系数/判定系系数(coeefficiient oof detterminnationn)。 可决系数的取值值范围:00,1 R2越接近近1,说明实实际观测点离离样本线越近近,拟合优度度越高。二、回归系数的的区间估计如果存在这样一一个区间,称称之为

35、置信区区间; 1-a称为置信系系数(置信度度),a称为显著性性水平;置信信区间的端点点称为置信限限或临界值。从定义我们可以以看出,区间间估计量是一一个构造出来来的区间,要要使得它把参参数的真值包包括在区间的的界限内有一一个特定的概概率:1在给定0.05或5%的情况下,置信(随机机)区间包含真实的概率为00.95或995%。它表示使用我们们所描述的方方法构造出来来的众多区间中包含含真值的概率率为0.955或95%。我们能不能构造造出这样的区区间呢?依据什么来构造造呢?依据概率知识我我们知道,如如果估计量的的抽样或概率率分布已知,我我们就可以构构造出以一定定概率包含真真实值的区间。对回归系数的的区

36、间估计可可归纳为三种种情况0.05, 即 1 0.955 0.011, 即 11 0.999 0.0001,即 11 0.9999例如:取00.05, 即 1 0.955,查标准正正态分布表可可知Z值在(1.96,1.96)区间间的概率为00.95。即即P(1.96Z1.96)0.95三、假设检验:回归分析是要判判断解释变量量X是否是被被解释变量YY的一个显著著性的影响因因素。 在在一元线性模模型中,就是是要判断X是是否对Y具有有显著的线性性性影响。这这就需要进行行变量的显著著性检验。变量的显著性检检验所应用的的方法是数理理统计学中的的假设检验。 计量量经计学中,主主要是针对变变量的参数真真值

37、是否为零零来进行显著著性检验的。 1、假设检验 所谓假设检验,就就是事先对总总体参数或总总体分布形式式作出一个假假设,然后利利用样本信息息来判断原假假设是否合理理,即判断样样本信息与原原假设是否有有显著差异,从从而决定是否否接受或否定定原假设。 当我们拒拒绝原假设(虚虚拟假设)时时,我们说发发现统计上是是显著的。当当我们不拒绝绝原假设时,我我们说发现不不是统计上显显著的。 假设检验验采用的逻辑辑推理方法是是反证法。 先假定定原假设正确确,然后根据据样本信息,观观察由此假设设而导致的结结果是否合理理,从而判断断是否接受原原假设。 判断结果果合理与否,是是基于“小概率事件件不易发生”这一原理的的2

38、、变量的显著著性检验 检验步骤:(1)对总体参参数提出假设设H0: b11=0, HH1:b10(2)以原假设设H0构造tt统计量,并并由样本计算算其值(3)给定显著著性水平,查t分布表,得得临界值t a/2(n-2)(4) 比较,判判断 若若 |t| tt a/2(n-2),则拒拒绝H0 ,接受受H1 ; 若 |t| t a/2(n-2),则拒拒绝H1 ,接受受H0 ; t统计量的计算算结果分别为为: 给定显著性水平平a=0.055,查t分布表得临临界值t 00.05/22(8)=22.306 |tt1|2.306,说说明家庭可支支配收入在995%的置信信度下显著,即即是消费支出出的主要解释

39、释变量; |t2|2.3066,表明在995%的置信信度下,无法法拒绝截距项项为零的假设设。 3、变量的置信信区间检验要判断样本参数数的估计值在在多大程度上上可以“近似”地替代总体体参数的真值值,往往需要要通过构造一一个以样本参参数的估计值值为中心的“区间”,来考察它它以多大的可可能性(概率率)包含着真真实的参数值值。这种方法法就是参数检检验的置信区区间估计。 在置信区间检验验程序中,我我们试图建立立一个以某种种概率包含有有真实,但未未知的的一个范围围区间;而在在显著性检验验步骤中,我我们假设为某值,然然后看所计算算的 值,是否位于该该假设值周围围某个合理的的范围内。 由于置信区间一一定程度地

40、给给出了样本参参数估计值与与总体参数真真值的“接近”程度,因此此置信区间越越小越好。要缩小置信区间间,需 (1)增增大样本容量量n,因为在在同样的置信信水平下,nn越大,t分分布表中的临临界值越小;同时,增大大样本容量,还还可使样本参参数估计量的的标准差减小小; (2)提提高模型的拟拟合优度,因因为样本参数数估计量的标标准差与残差差平方和呈正正比,模型拟拟合优度越高高,残差平方方和应越小。第六章 双变量量线性回归模模型的延伸6.1 过原点点的回归过原点的回归 例1: 资本资资产定价模型型 (CAPPM) 证券券期望风险溢溢价=期望市市场风险溢价价 例 尺度和单位变化化的影响 bi, SSEE,

41、 RRSS 的值值会受到影响响6.3 回归模模型的函数形形式对数线性模型半对数模型倒数模型 6.7函数形式式的选择模型背后的理论论求出回归子对回回归元的斜率率和弹性系数应满足一些些先验预期 有时不不止一个模型型能很好的拟拟合给定数据据集不应该过分强调调R2。6.8 相加性性和相乘性误误差无论是何种设定定的模型,只只要是关于参参数的线性模模型,均可以以运用OLSS 进行估计计,但对于残残差而言,只只能对便携式式计的残差进进行诊断其是是否为正态,而而不是直接对对原始扰动进进行检验。 第七章多元回归分析估估计问题7.1三变量量模型将双变量总体回回归模型(PPRF)推广广为3变量, 即 b1为截距项,

42、按模型的设设定可机械地地解释为当XX1,X2为为0时,Y的的均值, 隐隐含的意义为为没有包含在在模型中的变变量对Y的部部分影响,系系数b2和bb3则称为偏偏回归系数。误差项的假定7.2 多元回回归方程的解解释 方程表示,在给给定回归变量量的固定值时时,被解释变变量的条件期期望即总体回回归函数。 b2代表了在XX3不变的情情况下, XX2每变化一一个单位时,YY的条件均值值变化。 b3代表了在XX2不变的情情况下,X33每变化一个个单位时,YY的条件均值值变化。 7.6 例子:婴儿死亡率率与人均GDDP和女性识识字率的关系系定义变量:Yii表示婴儿死死亡率(5岁岁以下,千分分数),X22i表示人

43、均均GDP, X3i表示示女性识字率率(%), 为研究这33 个变量之之间的关系,设定模型为为Yi =b1+ b2X22i+ b33X3i+uui 人均GDP,应应有b200, b3 Faa(k,n-kk-1) 或 FFa(k,n-kk-1)来拒绝或接受原原假设H0,以以判定原方程程总体上的线线性关系是否否显著成立。 对于中国居民人人均消费支出出的例子: 一元模型:F=2855.92 二元模型:F=20557.3给定显著性水平平a =0.005,查分布布表,得到临临界值: 一元例:FF a(1,211)=4.332 二元例: Fa(2,199)=3.552显然有 F Fa(k,n-kk-1)

44、即二个模型的线线性关系在995%的水平平下显著成立立。2、关于拟合优优度检验与方方程显著性检检验关系的讨讨论 三、变量的显著著性检验(tt检验)方程的总体线性性关系显著每个解释变变量对被解释释变量的影响响都是显著的的因此,必须对每每个解释变量量进行显著性性检验,以决决定是否作为为解释变量被被保留在模型型中。 这一检验是是由对变量的的 t 检验验完成的。1、t统计量 由于以cii表示矩矩阵(XX)-1 主对角线上上的第i个元元素,于是参参数估计量的的方差为:其中2为随机机误差项的方方差,在实际际计算时,用用它的估计量量代替: 2、t检验设计原假设与备备择假设: H0:bi=00 (i=11,2k

45、) H1:bi0 给定显著著性水平a,可得到临临界值ta/2(n-kk-1),由由样本求出统统计量t的数值,通通过 |tt| ta/2(n-kk-1) 或 |t|ta/2(n-kk-1)来拒绝或接受原原假设H0,从从而判定对应应的解释变量量是否应包括括在模型中。 注意:一元线性性回归中,tt检验与F检检验一致 一方面,t检验验与F检验都是对对相同的原假假设H0:b1=0 进行检验验; 另一方面,两两个统计量之之间有如下关关系: 在中国居民人均均收入-消费费支出二元模模型例中,由由应用软件计计算出参数的的t值:给定显著性水平平a=0.055,查得相应应临界值: t0.0225(19) =2.00

46、93。可见,计算的所所有t值都大大于该临界值值,所以拒绝绝原假设。即即:包括常数项在内内的3个解释释变量都在995%的水平平下显著,都都通过了变量量显著性检验验。四、参数的置信信区间 参数的置信区间间用来考察:在一次抽样样中所估计的的参数值离参参数的真实值值有多“近”。 在变量的显显著性检验中中已经知道:容易推出:在(1-a)的置信水水平下bi的置信区区间是 其中,ta/22为显著性水水平为a 、自由度度为n-k-1的临界界值。 在中国居民人均均收入-消费费支出二元模模型例中, 给定a=0.055,查表得临临界值: 从回归计计算中已得到到:计算得参数的置置信区间: b0 :(444.2844,

47、 1977.116) b1 : (0.09337, 0.3489 ) b2 :(00.09511, 0.88080)如何才能缩小置置信区间? 增大样本容量nn,因为在同同样的样本容容量下,n越越大,t分布布表中的临界界值越小,同同时,增大样样本容量,还还可使样本参参数估计量的的标准差减小小;提高模型的拟合合优度,因为为样本参数估估计量的标准准差与残差平平方和呈正比比,模型优度度越高,残差差平方和应越越小。提高样本观测值值的分散度,一般情况下下,样本观测测值越分散,(XX)-1的的分母的|XXX|的值越越大,致使区区间缩小。9、 受约束束回归在建立回归模型型时,有时根根据经济理论论需对模型中中变

48、量的参数数施加一定的的约束条件。如: 0阶阶齐次性 条条件的消费需需求函数 1阶齐次性性 条件的CC-D生产函函数模型施加约束条条件后进行回回归,称为受受约束回归(rrestriicted regreessionn); 不加任任何约束的回回归称为无约约束回归。一、模型参数的的线性约束 二二、对回归模模型增加或减减少解释变量量 三三、参数的稳稳定性 *四四、非线性约约束一、模型参数的的线性约束然而,对所考查查的具体问题题能否施加约约束?需进一步进行相相应的检验。常常用的检验有有: F检检验、x2检检验与t检验验,主要介绍F检验验在同一样本下,记记无约束样本本回归模型为为受约束样本回归归模型为于是

49、受约束样本回归归模型的残差差平方和RSSSR于是 (*)ee为无约束束样本回归模模型的残差平平方和RSSSU受约束与无约束束模型都有相相同的TSSS由(*)式 RSSR RSSU从而 ESSSR ESSU这意味着,通常常情况下,对对模型施加约约束条件会降降低模型的解解释能力。但是,如果约束束条件为真,则则受约束回归归模型与无约约束回归模型型具有相同的的解释能力,RRSSR 与与 RSSUU的差异变小小。可用RSSR - RSSSU的大小来来检验约束的的真实性根据数理统计学学的知识:于是:讨论: 如果约约束条件无效效, RSSSR 与 RRSSU的差差异较大,计计算的F值也也较大。于是,可用计算算的F统计量量的值与所给给定的显著性性水平下的临临界值作比较较,对约束条条件的真实性性进行检验。注意,kU - kR恰为为约束条件的的个数。例3.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论