模型设定课件_第1页
模型设定课件_第2页
模型设定课件_第3页
模型设定课件_第4页
模型设定课件_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1

模型设定

2§5.1计量经济学模型的设定偏误一、模型设定偏误

如果所建立的计量经济学模型与真实的经济关系不一致,模型就出现了所谓的“设定偏误”。对于正确设定的模型,一个最基本的信息是:其参数估计值的符号必须与理论预期或基于现实观察的经验预期相一致。3消费函数:Ct为消费支出,Yt表为收入——凯恩斯的绝对收入假定模型假定边际消费倾向不变:

考虑到边际消费倾向递减:

(5.1.1)

(5.1.2)或

(5.1.3)——基于预期因素的模型

(5.1.4)二、模型设定偏误的类型4设定偏误主要有两个来源:不适当的解释变量:漏掉了必要的解释变量或包含了不必要的解释变量。不适当的函数形式。5§5.2模型设定偏误的后果一、模型拟合不足如果模型中漏掉了必要的解释变量,称之为模型拟合不足。若消费函数的“真实”的模型是(5.1.4),而选择了模型(5.1.1)(5.1.1)

(5.2.1)

问题:误差并不是真正的随机误差,它包含遗漏解释变量的影响6后果:

现有解释变量系数的OLS估计量是有偏的、非一致的。

如果解释变量之间相关,会导致现有解释变量与扰动项相关,表现出内生性。影响:

遗漏的解释变量对被解释变量的部分影响由现有解释变量来解释。表现:7问题的一般化:如果“真实”的模型为:(5.2.2)

却被错误地设定为:(5.2.3)

则:其中:是和样本相关系数的函数。和有相同的符号。=0时,=0。(5.2.4)

8其他影响:由于拟合不足模型的误差项不是真正的随机误差项,我们对的估计也是错误的。对参数估计量方差的估计也是有偏的。基于参数的置信区间和显著性检验很可能产生误导性的结论。9二、模型过度拟合

如果模型包含了多余的解释变量,称之为模型过度拟合。如果“真实”的消费函数模型应该是(5.1.1),但我们却选择了模型(5.1.4):(5.1.4)

(5.2.5)

问题:估计了一个不需要估计的参数模型(5.1.4)的误差项实际上是真正的误差项减去,即:10具体影响:误差项满足经典假定,模型的参数估计量是无偏的。问题本质:估计了一个实际上不必估计的参数不会导致误差项与解释变量之间相关,不影响参数OLS估计量的无偏性。拟合过度模型OLS估计量的方差会增大:多余的解释变量和模型中必要的解释变量总是存在一定的相关性,部分变化信息重复。重复信息的影响难以在解释变量间准确分解,导致系数估计精度下降。OLS估计量仍然是线性无偏的,但是,估计量的方差会增大,除非多余解释变量与其他解释变量的样本相关系数为0(在现实中几乎不可能出现)表现:11消费函数(5.2.6)(5.2.7)其中:是和的样本相关系数。只要和的样本相关系数不为0,多余解释变量的加入就会导致系数估计量方差的增大。在模型(5.1.4)中,的方差为:在模型(5.1.1)中,的方差为:12其他影响:拟合不足和过度拟合在实证分析中并没有明显的优劣差异。由于过度拟合模型的误差项是真实的随机误差项,我们对的估计是正确的。相应地,参数的置信区间和显著性检验仍然有效,但由于估计量的方差增大,统计推断的精度会下降。13三、不正确的函数形式

“真实”的消费函数是(5.1.3),但选择了模型(5.1.1)或(5.1.2)。

——所估计的经济关系与现实的经济关系不一致。模型(5.1.2)和(5.1.3)都能够反映边际消费倾向递减的特征。

——“真实”模型不可知的,二者之间如何选择?基于样本数据进行检验14§5.3模型误设的检验一、过度拟合的检验对有疑问的解释变量进行显著性检验。一个可疑变量:t检验。多个可疑变量:F检验。目的:判定过度拟合的假设是否成立,不是筛选解释变量。显著性检验不能作为模型设定时解释变量取舍的主要依据。15(5.3.1)

T=28

t检验结果表明可以拒绝解释变量的系数为0。不存在过度拟合的问题。消费函数:t统计值4.31525.72793.1316p值0.00020.00000.004416二、拟合不足的检验

检验方法:LM检验(拉格朗日乘数检验)。

(5.3.2)(5.3.3)(5.1.1)和至少一个不为0拟合不足进行检验的假设:消费模型备选模型17F检验的问题:无约束模型的误差项是经典误差项且满足正态性假定,有限样本中不一定能够满足。大样本的检验统计量——LM检验统计量。(5.3.4)判定系数判定规则:对给定的显著性水平,LM统计值大于临界值,就拒绝原假设,否则不拒绝。

(1)对(5.1.1)进行OLS估计,得到方程的残差(2)对原方程解释变量和被怀疑为遗漏的变量作辅助回归:18

(5.3.6)

t统计值-6.19050.4808-6.11711.3673p值0.00000.63500.00000.1842

N=28拒绝原假设,(5.1.1)遗漏了必要的解释变量或者或者兼而有之,即存在拟合不足的问题。举例:19三、拉姆齐的RESERT检验

拉姆齐的RESERT检验可用于模型函数形式的检验,也可用于模型拟合不足的检验。(2)以对作图,观测近似函数关系。(3)将相应的函数形式加入原回归方程,建立新的辅助回归方程。(4)对新加入的解释变量进行联合显著性检验。若拒绝新解释变量联合不显著的原假设,则认为模型设定存在偏误。

(1)估计(5.1.1),得到和检验步骤:

(5.1.1)消费函数20-80-60-40-2002040604008001,2001,6002,0002,4002,800

图5.3.1

和的对应关系

辅助回归方程举例:21(5.3.9)OLS估计结果为:t统计值2.438331.0749-5.9849p值0.02190.00000.0000T=29待检验假设为:结论:系数估计值t检验的p值为0.0000,拒绝原假设,认为模型(5.1.1)存在拟合不足或函数形式误设。22四、非嵌套模型的检验

非嵌套关系:模型的解释变量之间没有完全的包容关系,一个模型不是另一个模型的约束形式这种关系。非嵌套模型之间进行选择:戴维森和麦金农的J检验。23基本思想:(2)建立辅助回归:(3)对的系数进行显著性检验。若拒绝其系数为0,则拒绝A为真的原假设,选择B。反之,选择模型A。(5.1.2)(5.1.4)(5.3.11)反过来,假设B为真,A为备选模型。进行上述步骤(1)~(3)的检验。模型A:模型B:

假设A为真,B为备选模型。

(1)估计模型B,得被解释变量的拟合值24举例:假设A为真,B为备选模型。(5.3.10)t统计值4.31525.72793.1316p值0.00020.00000.0044T=28(2)辅助方程OLS估计结果:

t统计值0.60623.2833-7.13020.806p值0.55010.00310.00000.4278(5.3.12)T=28。(3)根据估计结果,不能拒绝的系数为0。不能拒绝A为真的原假设。(1)估计模型B25反过来,假设B为真,A为备选模型。

(5.3.14)t统计值0.21330.18611.36736.1171p值0.83290.85390.18420.0000T=28辅助回归方程OLS估计结果为。

系数t统计值的p值为0.0000,拒绝该系数为0,拒绝原假设结论:选择模型A而拒绝模型B。26不足之处两个模型都可能被拒绝或者两个模型都不能拒绝。若出现这样的情形,需借助其他信息进行进一步地分析。27§5.4样本数据导致的模型设定问题一、随机测量误差鉴于技术和成本等因素的制约,难以避免统计数据的误差。影响:(1)解释变量存在随机测量误差的影响(2)被解释变量存在随机测量误差的影响28(5.4.1)(5.4.2)问题:

与相关影响:解释变量的回归系数估计量是有偏的,对误差项方差的估计和回归系数方差的估计也是有偏的。(与模型拟合不足相似)举例:消费函数:(1)解释变量Y存在随机测量误差:29(2)被解释变量存在随机测量误差(5.4.3)(5.4.4)影响:回归系数估计量仍是无偏的,但估计量方差增大,估计精度下降。(与模型过度拟合相似)问题:与不相关但包含了测量误差30二、奇异样本数据问题

4567891011048121620XY奇异值

图5.4.1样本奇异值

样本奇异值:显著地偏离样本回归线的样本观测值31影响OLS估计量对奇异样本数据很敏感。残差不再具有正态性。32

t值(32.5819)17.0191N=80剔除奇异样本数据后:t值(45.5700)24.5884N=79举例:原数据的OLS估计的结果为:33如图:奇异样本点位于回归线右下方,样本回归线斜率减小,截距增大34

图5.4.3含有奇异样本点时的残差直方图

图5.4.4剔除奇异样本点的残差直方图

奇异样本点剔除后,对残差进行JB检验不能拒绝残差服从正态分布的原假设。35检测方法:最简便易行的方法:观察样本图形或残差图。如果某个样本点具有数值非常大的残差,基本上就可确认为一个奇异样本点。图5.4.5含有奇异样本点时的残差图

36§5.5关于模型设定偏误问题的蒙特卡洛仿真实验

蒙特卡洛(Monte-Carlo)模拟基本思想:(1)设定参数数值,随机生成解释变量和随机误差项的数值,得到仿真样本。(2)对仿真样本进行估计。(3)保持参数值不变,大量重复这一过程,将估计值与设定的参数真值进行比较,直观考察估计量的偏误和精度。37一、模型拟合不足的仿真实验1.解释变量相关时:(1)设定真实的总体回归模型,生成仿真样本数据。(5.5.1)设定:,,。从均匀分布(0,5)中随机抽取,为从正态分布N(5,2)中随机抽取的值加上0.5

。误差项从标准正态分布中随机抽取。样本容量设定为100。

38(2)如果漏掉了一个解释变量,拟合不足的模型为:基于仿真样本,分别对(5.5.1)和(5.5.2)进行OLS估计,得到估计值:、、、、。(3)大量重复,观测参数估计值的偏离情况。(5.5.2)393456789255075100125150175200真值截距的估计(真值为5)0.80.91.01.11.21.31.41.51.6255075100125150175200真值b.斜率系数的估计(真值为1)

图5.5.1拟合不足模型与正确设定模型的估计结果(相关)

影响:当模型漏掉了必要的解释变量时,截距和系数的估计值都显著地偏离真值。402.解释变量不相关时

样本仍从均匀分布(0,5)中随机抽取。

样本仍从正态分布N(5,2)中随机抽取。参数真值和其他变量数据生成过程不变重新进行实验,结果见图5.5.2。413456789255075100125150175200真值截距的估计(真值为5)0.70.80.91.01.11.21.3255075100125150175200真值b.斜率系数的估计(真值为1)图5.5.2拟合不足模型与正确设定模型的估计结果(、不相关)

影响:系数的估计值是围绕真值波动的,近似等于真值。但截距的估计值仍明显偏离真值。42二、模型拟合过度的仿真实验

估计两个模型,两个模型的OLS估计量都是无偏的,但是(5.5.1)的参数估计量将有较大的方差。过度拟合的模型:(5.5.1)。

解释变量从均匀分布(0,5)随机抽取,从正态分布N(5,2)中随机抽取的值加上0.5,即和相关。从标准正态分布中随机抽取。重复次数为200。以(5.5.2)作为真实模型,生成的样本数据。回归

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论