版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第章 计量经济学建模模型设定和检验博士 教授经济学院: :133-6603-5111第一节 概述问题回顾:经典线性回归模型假定9分析中所使用的模型被“正确地”设定了。问题:经验分析中选择一个模型的准则有哪些?在实践中容易遇到哪些类型的模型设定误差?设定误差的有哪些?如何一旦设定误差?出设定误差,能采取哪些补救措施?如何评价几个人表现不相上下的备选模型?计量经济建模的传统观点:平均经济回归(AER)构造计量经济模型是进行计量经济分析的基础和前提,它就像是一座的基石,发挥着举足轻重的作用。因此,在经典线性回归模型(CLRM)的假定中明确提出了“正确地设定了回归模型”这一假设,使得我们之后对模型参数
2、的估计和检验有了牢固的根基。若某些统计量不能让人满意,则需要去侦察是否存在多重共线性或自相关等问题,并利用一些方法去解决它们。但有时在做完这些工作后,检验结果仍然不能令就可以怀疑是模型的设定有误差或偏误。满意时,模型的设定误差,就广义而言,指的是在建立回 归模型的过程中,因为错误设定模型结构以及任 何一个不正确的基本假定而产生的误会差。就狭 义而言,仅指因错误设定模型结构所导致的误差。那么如何才能正确设定模型呢?传统的计量经济建模方法是自下而上方法(bottom-up approach),或平均经济回归(AverageEconomic Regres,简记AER),即为避免自变量的疏漏,先设定一
3、个包含若干回归元的模型,然后通过检验确定需要加入的其他回归元。而我们最初设定的回归遵循以下几个准则:首先,模型应是所的现实问题的抽象且精简的描述。现实问题总是复杂而多变的,因此在设定模型时,不可能也不应将所有的情况和都考虑进去,而是应该抓住问题的关键,确定哪些是必不可少的变量,从而构建一个既有实际意义又精简的模型。第二,所估计的模型的参数应有唯一的值,即我们所构造的模型是可识别的。第三,拟合优度应尽可能的高,这代表解释变量可以尽可能多地解释应变量。第四,所设立的的模型应与事实相符,例如好商品的需求与价格应成反比,若算出的价格系数为正,即使再高也不能使人相信。第五,所设立的模型应有很好的功效。只
4、能说明样本内的功效,而构造的模型应尽量地能对样本时期外的变量情况作出解释。传统经济建模的理论认为在建模中遵循这几条准则就基本上可以设定误差的可能性将的最小。但在某些情况下,设定误差仍然存在,因此一些统的计量经济学方法论提出了对传,他们的理论将在后面的章节中进行介绍。第二节 模型的选择准则1、数据的容纳性:即从模型做出必须有逻辑上的可能性。2、与理论一致:即必须有好的经济含义。如的收入假说成立,则消费对收入的回归中,预期截距项的值应为零。3、回归元的弱外生性:即解释变量或回归元必须与误差项不相关。4、参数估计的不变性:即参数值的稳定性。5、表现出数据的协调性:即从模型中估计出的残差必须完全随机。
5、6、模型具有一定包容性:即模型从能解释其结论的意义上讲应该包容或包括所有与之相竞争的模型。第三节 设定误差的类型区分:模型设定误差与模型设定误差模型设定误差脑海中有一个真实的模型,只是出于种种原因没有估计这个正确的模型 漏掉一个有关变量包含一个无需变量采用错误的函数形式测量误差模型误设误差不知道真实的模型是什么 对随机误差项不正确的设定第四节 模型设定误差的1、模型拟合不足(漏掉一个变量)假如真实的模型是Yi但出于种种原因拟合 1 2 X 2i 3 X 3i ui成了如下模型:Y X ui122ii:1、如果漏掉的变量X 与包含进来的变量X 相关,则 和 是有设定3212偏误且非一致的。2、即
6、使X1与X2不相关,尽管现在是无偏的,但仍有偏误。3、误差(干扰)的方差 2将不正确地被估计。4、上计算的 的方差( / 222i)是真实估计量的方差的一个x2有偏误的估计量。5、通常的置信区间和假设检验程序,对于所估计参数的统计显著性,容易导出误导性的结论。6、基于不正确模型做出的及(置信)区间都是不可靠的。期望和方差的分析 3b3(2证明见p519附录13A.1)E( 2 ) 2回归的斜率。除非3 或其中b32是漏去的变量X3对包含进来的变量Xb32或两者同时为零,否则 2 就是有偏误的。排除了3为零的可能性,因为如果那样的话就不存在设定误差的问题。系数b32在X2与X3无关时为零,这在大
7、多数经济数据中都不太可能。一般而言,偏误程度取决于偏误项3 b32。比方说,3为正(即X3对Y有正的影响),并且b32也是正的(即X2与X3正相关)。那么,总了真实的 2。因为X 不仅代表了其对Y的直接影响,体而言, 将2还包括了其(通过X )对Y的间接2影响。3再来分析 和的方差 2 2 2 ) var(22x2i 2 2var( ) *VIF222i22i2x(1 r)x23其中VIF为方差膨胀因子,而r23为变量X2和X3的相关系数。var( )var( )根据以上公式, 2 一般不同于。知道var( 是) 无偏的,因此var()222就存在偏误。但是由于0r21,所以var()小于。所
8、以var( )2322一个两难选择:尽管 2有偏,但其方差比无偏估计量 2的方差小。同时,由于两个模型的RSS和度不一样,所以所得估计的 也2不相同。得到 2的一个估计值为 2 RSS/df,其大小取决于模型中度。如果在模型中增加变量,RSS通常会包含的回归元个数和度下降,净影响取决于RSS下降是减小,但待估参数增加也使否足以抵消增加回归元所导致的度损失。考虑r23=0的特殊情为了给这种做出个结论,让X 和Xb=0形,即无关的情形。这时,从而 现在是23232无偏的,而且2和 2 的方差相等。那么,是否从模型中略去X3,尽管理论上它是个有关变量,也不至于有什么害处呢?一般来说,回答是否定的。因
9、为这时估计出来的var( 2 ) 仍是有偏误的,只是说,大多数经济 以上的问题。的假设检验程序仍值得怀疑。再中,X2和X3都会相关,从而产生了论点已十分清楚:一旦根据相关理论把模型建立起来,切忌从中再忽略掉一个变量。2、包含一个无关变量(模型拟合过度)假定ui 是真实模型,而拟合了一下模型:Yi 1 2 X 2i从而导致模型中引入了一个无需变量的设定误差。Yi 1 2 X 2i 3 X 3i ui1、“不正确”的模型中全部参数的OLS估计量都是无偏又一致的,即E() ,E(和 E( 0 。 2 ) 3 ) 11232、误差方差的估计是正确的。23、通常的置信区间和假设检验程序仍有效。4、然而,
10、一般诸系数的估计量是非有效的,也就是说它们的方差一般都大于真实模型中 的方差。的相对无效性证明2由通常使用的OLS估计式得var(2 ) 22ix2 ) var(和222i2x(1 1r)23var( 2 ) 因此,223(1 r)var(2 )由于0r21,推知var(2 ) var(。2 )也就是说,虽然平均23 而言, = ,即E() ,但 的方差一般都大于 的方222222差。这一发现的含义是包含无关变量X 将使 的方差不必要32地增大,从而使 的精度减小。这对也是成立的。 21设定偏误的不对称性:如果略去了一个有关变量,则留在模型中的变量的系数一般地说既有偏误又非一致,误差的估计也是
11、不正确的,从而通常的假设检验是无效的。而另一方面,模型中含有无关变量,虽然仍能给出真实模型中系数的无偏且一致的估计,而且通常的假设检验方法也仍有效;但引入变量的唯一代价是,系数方差的估计值变大了,致使对参数进行概率推断的精度降低了。一个无益的结论是:与其忽略掉有关变量,不如含有无关变量。但是这种哲理是不值得的,因为增加无关变量将导致估计量的效率损失,并且还可能引起多重共线性的问题,更不用说度的损失了。因此,一般而言的最好办法是,根据理论,仅仅包含那些直接影响因变量、而又不能由已被引入的其它变量替代的解释变量。第五节 设定误差的检验实际问题中,关心的不是为什么会造成这种错误,而是如何发现这种错误
12、。一旦发现存在设定误差,也就常常能找出解决的方法。设定误差的出现常常不是人们有意为之的,而是由于理论基础或是数据资料的缺乏所导致的,因此在设定模型时出现这样的错误在客观上是不可避免的。但是,当设定好一个模型却可以通过检验来判断模型是否存在设定误差,并采取相应补救措施。这有些像“亡羊补牢”,但的确“犹未为晚”对过度拟合模型的对遗漏变量和不正确的函数形式的检验对过度拟合模型的假设设定的模型为Y X X X ui122i33ikkii若检验解释变量X ki 是否应该包含在模型内,可以采用通常的t检验,即t k/ se(k )去检验估计的 k的显著性。,是否应该包含在模型内,可以通过F检若要检验X 3
13、 、X 4验3 0 对是否进行检验。 4值得注意的是,这些检验进行的前提是已经根据理论建立了一个被自己认为是正确的模型,而这些检验的用处是帮助判断模型里是否有多余的变量,而不是建立模型。也就是说,k 在统计上显著是Y与X k 相帮关的必要而非充分条件,不能因为k 是统计上显著的,就把本来不被包括在模型中的 X k 引入到模型中。因此,在建立模型时,的经济学含义。还是应以理论为基础,注重它也就是说,不可以说Y之所以与X2有关只是因为是统计显著的。然后又因为是统计显著的便把X3包含在模型中。这种建模策略被称为自下而上的方法,或数据开采方法、回归捕捉方法、数据琢磨方法等等。数据开采的主要目标是在进行
14、一些检验之后,提出一个“最好”的模型 (所有估计系数都具 有“正确”的符号、基于t和F的检验都是统计显著的。R2值足够高、d统计量值可以接受等等)。是诸如1%、5%、10%等常用的显著性水数据开采的平并非真正的显著性水平,从而名义显著性水平的结果说明其结果在统计上显著是难以令人信服的。(Lovell)的理论,如果有个回归元,在根据进行数据开采时,从中选出个( k n),则真实的显著性水平 *和名义的显著性水平 的关系是:* 1 (1 )n / k* n / k或近似地为:对遗漏变量和不正确的函数形式的检验虽然尽量使设定的模型达到真实模型的情况,但遗憾的是却并不能保证这个经过深思熟虑的模型就是正
15、确的。所以在设定好模型后,要进行一系列的检验,例如 R 2 值,估计的t比率,估计的系数符号是否与事先预期的一致,德宾-统计量,等等。如果这些的结果都比较理想,那么模型便可以被认为是正确的。若反之,则模型的设定就可能有某些设定偏误,例如遗漏了某个有关变量、采用了不正确的函数形式,或是没有差分消除序列相关,等等。侦察是否存在这些设定偏误有以下几种方法:(1)残差分析;(2)德宾-d统计量;(3)的RESET检验;(4)为增补变量的日乘数(LM)检验。残差分析法残差分析除了可以侦察自相关和异方差性外,还可以帮助进行设定误差的探测,而且尤其适用于横截面数据。若模型的残差图呈现明显的变动趋势,则模型可
16、能存在设定误差,如遗漏某个解释变量或采用了不正确的函数形式。Y u假设真实模型为3ii12i其中Y=总成本,X=产量。错误地拟合了以下两种形式的模型:假设Y X X u2i12i3i2i和Yi 1 2 Xi u3i从以下残差图中可以看出逐渐接近真实模型的过程中,不仅残差在绝对值上减小了,而且与错用模型联系在一起的突出的周期摆动也逐渐。由此看到残差分析图的效用:如果有设定误差,残差图必定展现出明显的样式。德宾-d统计量使用德宾-在自相关一章中,检验来侦察序列相关,而本章中知道若模型遗漏了某个解释变量则很有可能导致序列相关,因此可以使用德宾-检验通过侦察新序列相关的形式来判断模型是否有设定误差。操
17、作步骤:从假定的模型中计算出OLS残差;假设模型遗漏的变量为Z,将上一步中得到的残差按照Z的升序排列;(3) 计算该排列的d统计量:n(ut 2ut 1 )d t 2nu2tt为重排后的顺序,而不一定是时间顺序。 t1(4)根据德宾-d统计量表判断d统计量是否显著。若其显著则接受模型存在设定误差的假设,反之则反。的RESET检验拟合的模型为线性函数:假设Yi 1 2 Xi u3i其中Y=总成本,X=产量。它的残差图如下:u i0Y150200250300350400由图可以看出,残差的均值Y 随呈现系统的变化。因而,若将当作解释变量Yii引入回归方程,则会使R 2显著地增大,表明模型存在设定误
18、差。RESET检验的操作步骤如下:(1)从所检测的模型中得到 的值。Yi(2)将 以某种形式作为解释变量引入模型。例如将 和 引入回23YYYiii归方程,得到:Y X Y Y u23i12i3 iii(3)记原回归方程的R 为F检验:,新回归方程的为 新 ,然后引入2222RRR旧(R 2 R 2 ) 新回归元的个数F 旧新(1 R 2 ) (n 新模型中的参数个数)新判断是否因为将 和 的引入而显著地增大。23YYii(4)R 2设定显著性水平,若F在此水平上显著,则可接受原模型存在设定误差的假设。优点:不要求设立对立模型,故易于应用。缺点:即使知道了模型误设,也不一定有助于另外选出一个更
19、好的模型。日乘数(LM)检验为增补变量的面的例子中,可以看出若新回归方程中的平方项和立方项的系数为零,则它与原方程就没有实际的差别,所以可以将原方程看作是新方程的一个受约束形式。采用LM检验,操作步骤如下:为了检验该假定,(1)采用OLS估计法得到原受约束回归的残差ui 。(2)因为假定新模型是真实的模型,所以原模型的残差 i 应与和有关。X 2X 3ii(3)因此做 ui 对所有回归元的回归(辅助回归),如:u v4ii其中vi(4)服从12i为满足经典假设的误差项。曾证明在辅助回归中,对于大样本(设样本容量为n),nR 2 2度为受约束回归中的约束个数的 分布,即:nR2 2(约束个数)度
20、为2。本例中,(5)设定显著性水平,若 2 值大于在此水平上的 2 的临界值,则拒绝收约束回归,否则不。第六节 测量误差对因变量Y和诸在之前的分析中隐含地假设解释变量X的观测无任何误差。但是在实际观测时,我们往往因为客观条件的限制得不到真实准确的数据,这便了又一类设定误差。一、因变量Y中的测量误差(1) X uY *考虑一下模型: iii其中 =Y *性消费支出i=当前收入=随机干扰项X iui由于不可直接观测,可以利用这样的一个可观测变量:*YiY Y * iii其中 为 的观测误差。于是估计的模型实际上为:*YiiYi ( Xi Xiui ) i (ui i )(2) Xi vi i 是一
21、个 ui其中vi项。误差项,包含着方程误差项和测量误差假设误差 i 和 i 分别满足经典线性回归中的假设,即零均值,同方差,无序列相关,且观测误差分别与方程误差和 X i 也无相关关系。这些假定使得从上述模型估计出的 都是无偏的,因此应变量中的观测误差不会破坏OLS估计的无偏性。但从方程(1)得到的方差和标准差将不同于从(2)得到的方差和标准差。从(1)得到的方差是:var而从(2)得到的方差是:2u i2xvar2v2ix 22 u i2x显然后者大于前者。二、解释变量X中的测量误差 X u*假设模型为:Yiii其中 =当前消费支出Yii =性收入X *=干扰项(方程误差)ui假令观测到的不
22、是,而是具有观测误差的:X *X iiX X * wiii其中代表中的测量误差,则的估计是:wiX *iYi ( Xi wi ) ui Xi (ui i wi ) Xi i,是方程与观测两种误差的一个混合。其中 i i wi现在仍假设误差ui 和wi分别满足经典线性回归中的假设,即零均值,同方差,无序列相关,但却不能再假定误差项与解释变X i量相互独立,因为covi , Xi Ei Ei X i EXi Eui wi wi E w 2i 2w由于误差项与解释变量Xi 相关不符合经典线性回归模型的假定,所以OLS估计量是有偏误且非一致的,而且即使令样本含量无限地增大也无法改变。如果观测误差出现在
23、应变量中,所得的估计量仍然是无偏的且一致的,但如果观测误差出现在解释变量中,应怎么办呢?(proxy)变量,可以采取这样的补救措施:找一个这个变量与原始X变量高度相关,但与方程误差就能得到 的一 个测误差项都不相关。因此通过它一致性估计量。但实际上这种变量是很难找到的,就找到了也很难确定它是否与方程误差 由于补救措施的高难度,测误差项都不相关。所以有时便假定模型的的解释变量不存在观测误差,以继续使用OLS估计。习题十三1.假设真实模型为:Yi Xi ui 01 Xi ui若拟合的模型是: Yi那么设定误差的如何?2.假定上题中的(2)为真实模型,则拟合误差模型(1)的是什么?3.假定真实模型为
24、: Y X ui011ii(1)若拟合的模型加入了一个无关的解释变量 X 2的真实系数 2 为零):X 2(“无关”指Yi 0 1 Xi 2 X 2i vi(2)(1)模型(2)的 R 2和 R 2矫正会不会比模型(1)的大?(2)模型(2)的参数估计 0 和 是无偏估计1吗?(3)无关变量 X 2 的引入对0 和响吗?的方差有影14.考虑“真实”(生产函数模型为:lnYi-)的 0 1 ln L1i 2 ln L2i 3 ln Ki ui其中 Y 产出, 生产性劳动,L2L1非生产性劳动,K 资本。假若经验研究省去了 L2 ,使实际回归为:ln Yi 0 1 ln L1i 3 ln Ki v
25、i基于横断面数据,回答下面的问题:(1)OLS估计和是和的无偏估计吗? (2)若为无关变量,则(1)的结论是否成立?请推导。第七节 对随机误差项不正确的设定由于误差项不能直接观测到,所以就不容易确定它进入模型的形式。假定Yi Xiui是“正确”的模型,但估计的是Yi Xi ui附录13A.4证明了若,则ln ui N(0, )2u log 正态e 2 / 2 , e 2 (e 2 1)i结果: ) e 2 / 2E(其中e为自然对数的底。则是一个有偏的估计量,因为其均值不等于真实的。第八节 嵌套与非嵌套模型嵌套模型:存在关于B的参数的约束,使得在这些约束之下,模型A就简化为模型B。嵌套模型:若
26、这种约束不存在,则称A与B为非嵌套模型。例如,模型A: Yi考虑以下模型: 14 X 4i ui3i模型B: 1 2 X 2i 3 X 3i uiYi估计模型A,然后检验假设H 0如果:4 0。若不H 0,则模型A就简化为了模型B,即模型B嵌套在模型A中。再考虑下面的模型:模型C:Yi 1 2 X 2i ui模型D: Yi 1 2 Z2i vi其中X和Z是两组不同的变量集合。因为模型C和D中的一个不能做为另 个的简化模型,因此模型C和D是非嵌套的。第九节 非嵌套假设的检验一、判别方法判别法是通过比较拟合优度的大小来选择模型的方法。反映拟合优度的准则有:数值越大越好的校正 R(2即)值,数R 2
27、值越小越好的Hocking的 度量,MS pallow的 度量,AmCep miya的PC度量,Akaike的AIC度量,还有Schwarz准则,Hannan-Quinn准则和Shibata准则等。但必须牢记,在比较两(或多个)模型时,回归子必须相同。二、辨识方法非嵌套F检验或包容F检验要在上一节的模型C和D中作出选择。首先做一个嵌套或例如,混合模型E:Yi 1 2 X 2i 3 Z2i ui模型E嵌套了模型C和D,但C和D彼此是非嵌套的。所以,若C是正确的,则3 0 ,而若D是正确的,则2 0。对此来检验2和3 的统计显著性。可以通过F检验问题:1)如果 X与Z高度相关,很可能一个或多个 系
28、数在统计上不显著,尽管设。有可能所有斜率系数同时为零的(联合)假参考假设的选择有时能决定模型选择的结果,尤其是在相互争持的多回归元中有严重多重共线性的情况下。人为的嵌套模型F可能缺乏经济意义。-J检验(Davidson-Mackinnon J test )为了弥补F检验的不足,计量们又提出了其他检验方法,-J检验。为了说明这种检验方法,其中就有再次上面的模型C和模型D这种J检验的步骤如下:1)对模型D进行估计,得到Y(的估计值Y。Di2)将得到的 作为另一回归无增补到模型C(中,并估计下面的模DYi型: Y X Y uDi122i3 ii(3)用t检验对3 0假设进行检验。(4)若上面的假设不
29、被,则可接受模型CD为真模型。因为 代Yi表不被模型C所含有的变量影响,因此模型D不含有能改进模型C的,则模型C就不是真模型。其他信息。反之,若虚拟假设不被(5)现在将假设或模型C和D颠倒过来,重复上面步骤,即估计下面模型:Y X Y uCi122i3 iiC中得到的Y 0。若假设不被其中 是从模型的估计值。检验假设CYi3,则选择模型D,若假设被,则由于模型D没有改进模型C,所以选择C。问题:J检验虽然在直观上比较可取,但却也存在一些问题。首先,由于两个检验是独立操作的,故有下述可能结局:如果J检验程序导致同时接受或两模型,就得不到明确的。其次,用t 统计量检验显著性时,t统计量只能渐进地记
30、载大样本中遵从标准正态分布。所以在小样本的情况下,J检验会过多地真假设或真模型,因此它不是统计上有功效的。假设 3 0假设 3 0不不模型C 和D 均被接受接受模型D,模型C接受模型C,模型D模型C 和D 均被第十节 模型选择准则样本内与样本外样本内本质上告诉,所选择的模型在给定样本中对数据拟合得如何。样本外则考虑到一个拟合模型在给定回归元值情况下对回归子未来值的。具体准则 R 2准则校正 R 2(= R 2)准则赤池信息准则信息准则Cp 准则 2所有准则都是为了最小化残差平方和(RSS)。在模型的拟合优度与其复杂性之间有一种权衡取舍的关系。R 2 准则对一个回归模型拟合优度的度量指标之一就是
31、R 2 ,其定义为: ESS/RSS 1- RSS/TSSR 2如此定义的R 2 必介于0和1之间,越接近1,拟得越好。问题:它度量的是样本内拟合优度,不能对样本外观测做出很好的预测。在将两个或多个R 2进行比较时,因变量或回归子必须相同。当模型中添加越来越多的变量时, R 2总不会变小,但同时也使误差的方差变大。校正R 2准则作为对增加回归元来提高值的一种惩罚,校正R 2。提出_2n 1RSS/(n - k) 1- 1 (1 R )2Rn kTSS/(n -1)_从该公式可以看出R 2 R 2。与R 2不同, 校正R 2只有在所添加的变量的t值的绝对值大于1时才会增加。同样,进行比较时,被比
32、较模型的回归子必须相同。赤池信息准则(AIC)在AIC准则中,进一步对模型中增加回归元进行了惩罚,AIC的定义为: i2uRSSAIC e2k / n e2k / n nn其中k为回归元的个数,n为观测次数。取对数得:ln AIC 2k ln( RSS )n其中2k/n为惩罚因子。n在比较两个模型时,具有最低AIC值的模型优先。AIC 的优越性之一在于,它不仅适用于样本内,还适用于一个回归模型的样本外的表现。此外,它对嵌套和非嵌套模型都适用,甚至还可以用于决定AR(p)模型的滞后长度。信息准则(SIC)与AIC类似,SIC定义为:u 2SIC n k / n或以对数表现为nnln SIC k
33、ln)nn其中(k/n)lnn为惩罚因子。通过比较可以看出,SIC施加的惩罚比AIC更加严厉。与AIC类似,SIC值越低的模型就越好。而且与AIC一样,SIC可以用于比较一个模型在样本内或样本外的现。表的Cp准则有一个包括家具在内k假设个回归元的模型, 为真实 2 的估2只选择其中的p (pk) 个回归元,并从适用这p个计量。假设回归元的回归中得到RSS。令RSSP表示使用p个回归元的残差平方和。CP准则表现如下: RSS p (n 2 p)Cp2其中n为观测次数。假设拟合足够充分,则可以证明: p) 2E(R(n p)2E(CP ) (n 2 p) p2想找到一个CP 值很低(约为p)的模型
34、。换句话说,根据节俭原选择一个含有p个回归元(pk)并相当好地拟合数据的则,模型。对p进行描点。一个“充分的”模型实践中,人们通常将计算出的CP将作为一个与CP =p线接近的点而出现。如图,A点显然比B点更优。CPABCP =PP对模型选择的一句忠告以上的各种准则只是纯粹描述性的,或许没有什么很强的理论性,其中还有一些易于受到数据开采的指控。快尽管如此,这些准则仍频繁地被实践者所使用。这些准则中没有哪一个肯定优于其它准则。第十一章 计量经济建模的其它专题一、异常数据、杠杆数据和有的数据在回归背景下,一个异常数据可定义为一个具有“很大残差”的观测。如果一个数据点不成比例地远离绝大部分回归元值,那
35、就认为它表现出(高度)杠杆性。一个杠杆数据点能把回归线向自己拉近,由此改变回归线的斜率。如果这种情况真的发生了,那就称这样一个杠杆数据点为一个与数据点、从样本中删去这样一个数据点会显著地影响回归线。的二、递推最小二乘法在已知转折点的情况下,可使用检验时间序列的稳定性问题。但在未知转折点的情况下又会怎样呢?此时可使用递推最小二乘法。以储蓄收入回归为例。Yt 1 2 Xt ut其中Y=储蓄,X=收入,样本期间为1970-1995年。使用1970年-1974年的数据并估计了这个储蓄函数,得到 1假设和 2 的估计值。然后使用1970-1975年的数据再次进行估计并得到这两个参数的估计值。再使用197
36、0-1976年的数据再次估计。以此类推直至用完全部样本。1和 2可以想象,每组回归都将给出的一组新估计值。如果把这些参数估计值依次描点,将会看出估计参数是如何变化的。如果所考虑的模型结构是稳定的,这两个参数的估计值变化会很小,而且基本上是随机的。如果这两个人参数值变化明显,则意味着存在结构转折。当横截面数据按照某种“规格”或“规模”变量排序时,递推最小二乘法也是一个有用的工具。三、在第八章失灵检验检验。过结构稳定性的还证明了他的检验方法略加修改后还可用于对回归模型功效的检验。对1970-1981年期间估计了储蓄-收入回归,并得到基于假设1970-1981年期间的数据估计的截距和斜率系数和,现在
37、我1,70812,7081们利用1982-1995年期间收入的实际值和1970-1981年期间的截距1982-1995和斜率值,来每一年的出须知。逻辑:若参数值没有发生严重的结构变化,则基于前一期间系数估计值而估计出来的1982-1995的储蓄估计值,不应该与后一期间储蓄的实际值与值有很大不同,若实际值与值之间存在巨大差异,则整个数据期间储蓄-收入关系的稳定性就值得怀疑。储蓄的实际值与估计值之间的差别是大是小可以通过F检验判断: t t2u ) / n2(u2F t1u /(n k)2其中n1=初始回归所基于的第一期间(1970-1981)中观测次数,n2=第二期间或期间的观测次数, t=对所
38、2un +n )估计出的RSS=对前你个观测估计 t有观测(,2u12出来的RSS,k为待估参数的个数。若误差是独立同正态分布的,则F统计量服从和n2的F分布。度为n1非线性回归模型博士 教授经济学院: :133-6603-5111第一节 本质上的线性和非线性回归模型本质非线性回归模型(NLRM):不能通过变换使模型线性于参数。例:不同形式的C-D函数Y=产出 X2=劳动投入 X3=资本投入1) Yln Yi 2 ln X 2i 3 ln X 3i ui XXeu或23ii12i3i ln 。1其中所以这个模型是本质线性的。ln Yi 2 ln X 2i 3 ln X 3i ln ui2) Y
39、 X或Xu23i12i3ii ln 。1其中这个模型也是线性于参数的。Y XX u3)23i12i3ii不可通过变换转化为线性于参数,故该模型是非线性回归模型。Y AK (1 )L1/ 4)常替产函数()iii它是C-D生产函数的一个特例,也是本质上非线性的回归模型。第二节 线性和非线性回归模型的估计考虑以下两个模型 线性模型(1)Yi 1 2 Xi ui(2)非线性模型Y e Xu2 ii1i对应于线性情况,最小化(2)中的残差(附录14A.1),得到的正规方程组为:Y e X2 Xi e22 ii1Y X e X2 Xi 22 iX eii1i可以发现与线性模型正规方程组不同,非线性模型正规方程组左右两侧都有未知量(诸 )。因
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 护理健康宣教软件
- 初中校长在第六届校园科技节闭幕式暨表彰会致辞
- 2023年专业技术人员继续教育信息能力建设考试多选题
- 2024年《安全生产管理知识》模拟试卷(一)
- 中国古代文学常识汇编
- 2023年绥化绥棱县“绥才回流”计划考试真题
- 2023年高级营销员四级考试试题样本无答案
- 2023年四川宜宾中考英语试题及答案
- 2023年教师资格之小学综合素质考前冲刺模拟试卷A卷含答案
- 质量通病防治措施技术交底
- 2025-2030中国内河运输行业市场深度分析及竞争格局与投资前景研究报告
- 山东山东文化艺术职业学院2025年招聘18人笔试历年参考题库附带答案详解(5卷)
- 【地理】“鱼米之乡”长江三角洲地区课件-2025-2026学年八年级地理下册人教版
- 河北衡水中学2026届高三下学期综合素质评价三语文试卷+答案
- 12D401-3 爆炸危险环境电气线路和电气设备安装
- 小学 六年级 劳动教育《小空间大农场》第二课时 教学设计
- 南方cass教程手册
- 秘书的人际交往
- 第六章-污染土壤的化学修复原理与技术PPT课件
- 医院2022年度内部控制工作方案.doc
- 转盘轴承综合知识介绍
评论
0/150
提交评论