第4章 经典模型f.doc_第1页
第4章 经典模型f.doc_第2页
第4章 经典模型f.doc_第3页
第4章 经典模型f.doc_第4页
第4章 经典模型f.doc_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第4章 经典模型4.1 经典假定4.2的抽样分布4.3 高斯-马尔科夫定理和普通最小二乘估计量的性质4.4 标准的计量经济学符号4.5 总结与练习 经典计量经济模型与古希腊 回归一词是由古希腊数学家弗朗西斯高尔顿(Francis Galton)所提出,译者注。.没有什么关系,甚至与亚当斯密的经典经济思想也没有什么关系。取而代之,经典一词是指一系列相当基本的假定,要求这些假定成立是为了使普通最小二乘(OLS)估计量被认为是从回归模型中所能得到的“最优”估计量。当这些假定中的一个或多个不成立时,其他的估计方法(如在第九章中将要介绍的广义最小二乘法)有时会优于OLS。 因此,回归分析中最重要的工作之一就是要确定这些经典假定对于某个特定方程是否成立。如果成立,OLS就是最优的估计方法。否则,必须权衡另外的估计方法的优点和缺点。这些估计方法通常是当某个特殊假定不满足时对OLS的调整。就这个意义来说,本书余下的大多数内容就是处理这样一个问题:当某一个经典假定不满足时,我们该如何做。由于计量经济学家要花大量时间来分析对经典假定的违背,因此,对于他们来说,认识和理解这些假定是极其重要的。4.1 经典假定 为使OLS估计量成为最优估计量,经典假定必须满足。由于他们在回归分析中的重要性,本章将这些假定以表格加上文字说明的形式列出来。随后的章节将研究这些假定被违背并介绍能产生更好估计量的估计技术。经典假定.回归模型是线性的,被正确设定,并且有一项附加的误差项。.误差项的总体均值为零。.所有的解释变量与误差项不相关。.误差项的观测值互不相关(无序列相关)。.误差项具有不变方差(无异方差)。.没有一个解释变量是其他任何解释变量的完全线性函数(无完全多重共线性).误差项服从正态分布(该假定是选择性的,但通常被采用)。 称满足假定的误差项为经典误差项。如果再加上假定,误差项便称为经典正态误差项。.回归模型是线性的,被正确设定,并且有一项附加的误差项。回归模型被假设为线性的: (4-1)线性回归模型的假定并不要求潜在的理论是线性的2经典假定中回归模型是“线性的”,技术上是要求模型“对回归系数而言是线性的”。我们将在7.2节中学习模型对回归系数而言是线性的含义,尤其是与对变量而言是线性的模型作比较。在该节中,我们将涵盖变量是非线性的方程的回归分析应用,但是,系数是非线性的方程的回归分析应用超出本书范围。例如,指数函数: (4-2)这里,e为自然对数的底数。对该方程两边取自然对数,变换成: (4-3)如果变量重新表述为,方程就变成线性形式: (4-4)在方程(4-4)中,的OLS估计量的性质仍然成立,因为该方程是线性的。另外两个性质也必须满足。首先,我们假定方程被正确设定。如果方程存在遗漏变量或者函数形式误设,这类问题会阻碍模型的良好运行。其次,我们假定有一个随机误差项被加到方程中。误差项必须是一个可加的附加项,且不能被模型中的任何变量相乘或相除。.误差项的总体均值为零。正如我们在1.2.3节中所指出,为描述应变量不能被模型所解释的变异,计量经济学家在回归方程中加上一项随机误差项。这一误差项的每一个观测值完全是随机决定的。阐述这一概念的最好方法也许是把误差项看成是从随机变量的分布中抽取的,如图4-1所示:见原书p90 图4-1具有零均值的误差项分布随机误差项的观测值被假定是从具有零均值的随机变量分布中抽取的。如果经典假定满足,误差项的期望值(均值)则等于0。经典假定认为分布的均值为零。也就是说,当考虑随机误差项的所有可能值的全部即总体时,总体均值应为零。对于小样本,误差项的均值不可能正好为零,但随着样本容量趋向于无穷大,样本均值趋向于零。为弥补的总体均值可能不为零,在方程中加上常数项可以迫使任何回归中的的均值为零。从本质上说,常数项等于中不能被自变量解释的固定部分,而误差项等于中不能被解释的随机部分。尽管误差项不可能被观察,但假设我们可以观察到误差项,对于理解常数项的存在如何迫使样本误差的均值为零具有指导意义。考虑一个典型的回归方程: (4-5)例如,如果的均值为3而不是零,那么。3这里,如同第一章,表示紧随其后括号内的期望值(均值)。这样就等于随机误差项减去3后的期望值。在这个例子中,由于定义了,因此有。你可以这样认为,期望值就是某一随机变量所具有的长期均值的最佳猜测。如果将常数项加上3,同时将误差项减去3,便得到: (4-6)由于方程(4-5)和(4-6)等价(为什么?),。方程(4-6)可被写成具有零均值误差项的形式: (4-7)这里,。方程(4-7)满足经典假定。这种形式总是被假设应用于真实模型。因此,一旦方程中包含常数项,并且其余经典假定也得到满足,第二条经典假定也就满足。.所有的解释变量与误差项不相关。它是假定解释变量的观测值的确定独立于误差项。所有的解释变量()被认为不是由所讨论的回归方程所决定的。如果一个解释变量与误差项相关,OLS估计量很可能把一些实际由误差项所引起的的变异归因于由解释变量所引起。例如,如果解释变量与误差项正相关,估计的回归系数可能大于(向上偏误)没有正相关时的系数估计。因为OLS估计程序会错误地把由引起的的变异归因于,因此,确保解释变量与误差项不相关是重要的。违背这一假定的一个重要经济应用就是具有联立属性的任何模型。对于大多数经济应用,存在着几个相关联的命题,当把他们看成是一组时,就意味着形成一个回归方程系统。在大多数情况下,相关联的方程应该被联立而不是分别考虑。不幸的是,这样的联立方程组违背了经典假定。为理解为什么,让我们看一个例子。在一个简单的凯恩斯宏观经济模型中,消费的增加(也许是由于未预期到的偏好变化所引起)将增加总需求,于是导致总收入的增加。然而,收入的增加也会引起消费的增加,因此,消费与收入是相互依赖的。注意,消费函数中的误差项(这个误差项是由未预期到的偏好变化所引起的)和消费函数中的解释变量现在一起变动。其结果是违背了经典假定,误差项不再与所有解释变量不相关。我们在第14章中详细讨论这种情形。.误差项的观测值互不相关。误差项的观测值是相互独立抽取的。如果误差项的一个观测值与另一观测值存在系统的相关,那么用OLS得到回归系数的精确标准误的估计值会变得更加困难。例如,如果来自于一个观测值的为正,并且它增加了另一观测值的也为正的概率,那么误差项的这两个观测值就是正相关。这种相关违背了经典假定。在经济应用中,这一假定对时间序列模型最为重要。在时间序列模型中,假定是说,误差项在某一时期的增加(例如,随机冲击),并不会以任何方式在另一时期的误差项中显示出来,也不会影响误差项的该期值。但在某些情况下,该假定是不现实的,因为随机冲击有时会持续一段时期。从整个样本观测值来看,如果与相关,那么误差项被称为序列相关(或自相关),假定被违背。详细讨论见第9章。.误差项具有不变方差。误差项的观测值是从具有不变方差(离散程度)的分布中抽取的。也就是说,误差项的观测值被假定是从独立的分布中连续地抽取(如图4-1所示)。另一种情况是,误差项分布的方差会随着每一观测值或观测值范围的变化而变化。见原书p92 图4-2误差项的方差随着变量的增加而增加(异方差)经典假定不满足的一个例子是误差项的方差随着的增加而增加。一般来说,在这种情况(称为异方差)下,值越大,观测值离真实回归线就越远;越小,观测值离真实回归线就越近。例如,在图4-2中,误差项的方差随着变量的增加而增加,这种情形违背了经典假定。误差项的实际值虽然不能直接观测到,但由于误差项的分布不满足不变方差性,这就导致OLS产生了回归系数的标准误的不精确估计。在经济应用中,假定很可能在横截面数据中被违背。例如,假设你正在研究50个州的教育支出,因为纽约州和加利福尼亚州要比新罕布什尔州和内华达州大,所以大州的随机误差项要比小州的随机误差项大。像纽约这样较大的州,教育支出中不能被解释的变异就会比像新罕布什尔州这样较小的州大。违背经典假定的情形被称为异方差,详细的讨论见第10章。.没有一个解释变量是其他解释变量的完全线性函数。两个自变量之间的完全共线性意味他们实际是相同的变量,或者其中一个是另一个的倍数,和(或)一个常数加到另一个变量上。也就是说,一个解释变量的相对变动会被另一个解释变量的相对变动完全匹配,尽管他们变动的绝对值有可能不相同。因为一个解释变量的每一次变动都会被另一解释变量的相对变动所匹配,所以OLS估计程序就不能把这些变量区别开来。许多完全共线性例子(如果涉及到的自变量超过两个,则称为多重共线性)是研究者没有考虑到自变量之间的等同(或识别,译者注)问题(基于定义的等价性)而导致的后果。通过从方程中删去其中一个完全共线性变量,这个问题能够很容易被纠正。什么是完全多重共线性的例子呢?假设你要建立一个关于你所在城市轮胎销售店的利润模型,在这个模型中,你把每个商店的年轮胎销售量(以美元计)和每个商店的年销售税作为自变量。由于这些轮胎商店在同一个城市中,他们将支付相同比率的销售税,因此,各个商店支付的销售税将是他们的总销售量(以美元计)的一个相同比率。如果销售税率是7%,那么每个轮胎商店支付的总税收正好是其销售量的7%。这样,销售税就是销售量的完全线性函数,你将会面对完全多重共线性!当两个自变量相加总是等于第三个自变量,或者自变量之一具有零方差时,完全多重共线性也会出现。对于完全多重共线性,OLS计算程序(或任何其他估计方法)将不能估计出共线性变量的系数(除非存在一个圆型的误差)。完全多重共线性在实际应用中很难遇到,但即便是不完全多重共线性也会引起估计问题。详见第8章。.误差项服从正态分布。尽管我们已经假设误差项的观测值是从具有零均值(假定)和具有不变方差(假定)的分布中独立抽样(假定)的,但我们几乎没有谈及它的分布形状。假定认为误差项的观测值是从正态分布中抽取的(正态分布具有对称形式,类似于“塔”型4原文为bell,可能是指大海中装有钟的浮标塔,意译为塔型,译者注。,如图4-3所示)。见原书p95 图4-3 正态分布尽管所有的正态分布都是对称的,类似于“塔”形,但这并不意味着他们必须具有相同的均值和方差。分布1的均值为0,方差为1,而分布2的均值为2,方差为0.5。如图所示,当均值发生变化时,整个分布会发生平移,当方差增大时,分布就会变得具有厚尾特征。;正态性假定并非OLS估计所要求,它主要是应用于假设检验中。假设检验是用被估计的回归系数来考察有关经济行为的假设。例如,决定在某一特定的范围内,需求曲线是富有弹性还是缺乏弹性。假设检验是第5章的标题,若没有正态性假定,第5章中大多数小样本检验都是无效的。尽管假定是可选择的,但由于以下原因,通常还是建议在除前述六个假定外,再加上正态性假定。1.误差项可以被认为是许多次要影响因素(或误差,此处指没有被解释变量所解释的误差,译者注)的和。随着这些次要影响因素的数量变大,误差项的分布倾向于接近正态分布。5这是因为中心极限定理。该定理阐明,大量独立的、同分布的随机变量,不管他们服从什么分布,如果不同随机变量的数量足够大,这些随机变量的均值(或总和)倾向于正态分布。2.只有在误差项服从正态分布(或者样本非常大)时,我们在第5章中发展起来的统计量和统计量才有应用价值。图4-3显示了具有不同均值、方差的正态分布是如何不同。在正态分布中,均值为0,方差为1;在正态分布中,均值为2,方差为0.5。当均值不同时,整个分布就会移动。例如,由于分布的均值为2,大于分布的均值,所以分布在分布的右边。当方差不同时,分布就会变得厚尾或者尖峰。例如,相对于分布,分布更紧凑地密集在其均值周围,因为分布有较小的方差。随机地从分布中抽取的观测值将比随机地从分布中抽取的观测值更接近它的均值,而从分布的抽取的观测值远离其均值可能更大 。在图4-3中,分布表示所谓的标准正态分布,因为它是均值为零,方差为1的正态分布。这是一个在统计表中给出的常用分布,例如,附录B-7表。通常,正态分布的参数以紧凑的形式列出来:。对分布,其符号就是,代表一个均值为0,方差为1的正态分布。4.2的抽样分布“对于学生,不能过分地强调理解抽样分布概念的重要性”6 Peter Kennedy, A guide to Econometrics (Cambridge: MIT press, 2003), p.418如同误差项服从概率分布那样,的估计量也服从概率分布。事实上,不同的样本数据会产生不同的估计值。不同样本的值的概率分布就称为的抽样分布。回忆一下,的估计量就是一个公式,例如,方程(2-4)的OLS公式,该公式告诉你如何计算。的值就是根据给定的样本,由该公式计算得到。对于一个给定的总体,由于研究者通常仅有一个样本,因此,计量经济学的初学者常常假定回归分析只能产生的一个估计值。然而,事实上,来自于相同总体的不同样本都会产生不同的估计值。所有可能的样本集有一个相同的分布,该分布具有均值和方差。尽管在大多数实际应用中,我们面对的是从总体抽取的唯一样本,但我们仍需要讨论的抽样分布性质。务必记住,抽样分布是指不同值的分布,这些值来自不同的样本,而不是同一样本。因为误差项的正态分布同样意味着的OLS估计量也是正态分布,所以这些被假定为正态分布。我们来看一个抽样分布的例子,假设你决定建立一个回归模型,用来解释你所在学校去年毕业生的起始薪水,你把它看成是他们在你们学校取得的GPA分数的函数: (4-8)现在,我们把重点放在的抽样分布上。如果你选择一组包含25个学生的样本,并得到他们的薪水和成绩数据,你用OLS估计方程(4-8)7原书误为(4-4),译者注,从而得到的一个估计值,如此等等。但是,如果你选择第二组学生样本,并做同样的估计,情况会是怎样呢?你用第二组样本得到的和从第一组样本得到的会正好一样吗?不是!你的估计值明显依赖你所选择的样本。如果你的随机样本中偶然包含几个高薪水的毕业生,的估计值就会相当高。如果另一组样本偶然包含了一个失业的毕业生,估计值就会低。结论是,对于抽取的不同样本,几乎可以肯定得到不同的。因为不同的样本包含不同的学生,而不同的学生可能有不同的特征。本质上,正如误差项的观测值所具有的分布那样,所有可能的估计值都存在一个具有均值和方差的分布。因此,如果你选择了5组不同的样本,你极有可能得到5个不同的。例如,你可能得到:第一个样本: =8 612第二个样本: =8 101第三个样本:=11 355第四个样本:=6 934第五个样本:=7 994均 值: =8 599每一组样本产生一个真实总体的估计值(假设真实总体为8 400),并且,所有可能样本所得到的的分布都有它们自己的均值和方差。对于一个“良好”的估计方法,我们希望所有估计的的抽样分布的均值等于真实总体,即8 400。这种情况被称为无偏性。尽管我们5个样本的均值为8 599,但如果我们用足够多的样本并计算了足够多的,的均值最终会接近8400,这种情况是可能的。因此,根据方程(4-8),由OLS估计得到的就形成了他们自己的分布。每组样本观测值就会产生一个。像任何其他分布一样,所有可能样本估计值的分布只有一个均值和方差。当我们在下一节讨论这些估计量的性质时,我们其实是在讨论产生于大样本(一个抽样分布)的估计量的性质,记住这一点很重要。均值的性质估计值的分布的一个理想性质就是它的均值要等于被估计系数的真实值,能得到这样估计值的估计量就被称为无偏估计量。如果的抽样分布的期望值等于的真实值,估计量就是无偏估计量。 (4.9)虽然实际上只有一个值被观察到,但无偏的性质是有用的。这是因为相对一个来自于不以真值为中心的分布的估计值而言,来自于无偏分布的估计值更有可能接近真实值(假定相同方差)。如果一个估计量产生的不以真实的为中心,该估计量就是有偏估计量。不能保证每个来自无偏估计量的估计值都会优于每个来自有偏估计量的估计值。因为相对于有偏估计值,一个特定的无偏估计值偶然会更远地偏离真实值8技术上说,由于一个估计只有一个值,所以一个估计值就不可能是无偏(或有偏)。在另一方面,“由一个无偏估计量产生的估计值”一词太过于麻烦,特别是在一页中重复10次的时候。因此,许多计量经济学家用“无偏估计值”作为“由一个无偏估计量产生的单个估计值”的简称。这种情况的发生也许是偶然的,也许是有偏估计量具有更小的方差。然而,如果没有关于估计值分布的其他任何信息,我们更愿意选择无偏估计值,而不是有偏估计值。方差的性质正如我们希望的分布要以真实总体为中心那样,我们同样也希望的分布要尽可能狭窄(或精确)。一个以真实值为中心,但方差极大的分布几乎没有什么用处,因为任何给定的估计值都极有可能远离真实的值。对于具有较小方差的的分布,估计值就有可能接近抽样分布的均值。为清楚理解这一点,比较图4-4中的分布和分布(两个都是的无偏估计)。分布比分布的方差大,所以分布不如分布精确。为了比较,我们同时画出了一个有偏分布(分布)。注意,有偏意味着分布的期望值位于真实的左边或右边。见原书p100 图4-4的分布不同的的分布具有不同的均值和方差。例如,分布和都是无偏的,但分布比分布有更大的方差。分布比分布的方差小,但它是有偏的估计。通过扩大样本容量,可以减小的分布的方差。这样也增加了自由度,因为自由度等于样本容量减去被估计的回归系数或参数的个数。在其他情况不变的条件下,随着观察值个数的增加,的分布会更紧凑地密集在它的样本均值周围,并且抽样分布的方差趋于减小。尽管相对于5个样本来说,15个样本并不必然会产生一个更接近于真实总体的估计,但这样的结果仍是极有可能的。因此,更大的样本应该尝试。图4-5描述了当真实等于1时,来自于5个和15个观测值的的OLS估计量的抽样分布。更大样本产生的抽样分布确实更紧凑的密集在的周围。在计量经济学中,我们常常依赖于一般的趋势。偶然的因素、随机发生的事件总是存在于估计回归系数的过程中。无论你的估计技术有多好,某些估计值总是会偏离真实值。然而,如果回归系数估计值的分布集中在真值的周围,并且有一个尽可能小的方差,那么,这些偶然的因素就不太可能导致一个效果很差的估计值。如果一个分布集中在某个值周围,而这个值不是真实的(即是有偏的),那么,更小的方差意味着大多数的抽样分布是集中在一个错误值的周围。然而,如果该值与实际中通常不知道的真值相差不大,那么,优良的精确估计值仍然可以得到。通常使用一种称为均方误(MSE)的方法,对不同的估计技术进行比较,就可以判断通过降低分布的方差是否足以抵消这种偏差。均方误等于方差加上偏差的平方。MSE越低,效果越好。最后重要的是,随着误差项方差的增加,的分布的方差也会增加。的方差增加的原因是:的方差越大,就越可能经常地观察到异常的值,误差项在决定的大小时所起的作用就越重要。的标准误由于被估计的系数的标准误,即是的估计的方差的平方根,因此,样本容量以及我们所提到的其他因素同样影响。例如,样本容量的增加引起下降。样本容量越大,估计的回归系数越精确。4.3高斯马尔科夫定理和OLS估计量的性质高斯马尔科夫定理证明了OLS估计量的两个重要性质,所有高级计量经济学教材都证明了该定理。对该定理有兴趣的读者可以参考习题8以及附录A的答案。然而,对于回归使用者来说,更重要的是明白这一定理的含义,而不是能够证明它。高斯马尔科夫定理认为:给定经典假定(对于本定理,正态性假定不是必需的),在的所有线性无偏一类估计量中,的普通最小二乘估计量的方差最小,k=0,1,2,K 将这一定理陈述为“OLS是BLUE”也许能够最容易使你记住高斯马尔科夫定理,这里BLUE表示“最优(即Best,此处含义指最小方差(Minimum variance或Mv)是指BLUE中的B,译者注)线性(Linear, BLUE 中的L,译者注)无偏估计量(Unbiased Estimator, BLUE中的UE,译者注)”。对于那些可能会忘记“最优”代表最小方差的学生,记住“OLS是MvLUE” (将最小方差记为Mv,译者注)也许更好,但该短语不易记住。 如果某一方程系数的估计值是无偏的(即每一个被估计的回归系数是由真实总体系数的无偏估计量估计得到),那么,,(k=0,1,2,,K)。 如上所述,最优意味着每个具有最小方差(在的所有可能的线性无偏一类估计量中)。具有最小方差的无偏估计量被称为有效的,该估计量具有有效性的性质。 高斯马尔科夫定理要求七个经典假定中的前六个都满足。如果再加上第七个经典假定,即误差项服从正态分布的假定后,高斯马尔科夫定理的结论得到加强,因为在所有可能的估计量而不仅仅是线性的估计量中,OLS是最优的(最小方差)无偏估计量。换句话说,如果七条假定都被满足,OLS就是“BUE”。正是这一假定也使得OLS估计量等于另一估计量即最大似然估计量(将在13章中讨论)。给定七条经典假定,OLS系数估计量具有如下性质:1.他们是无偏的,也就是。这一性质意味着系数的OLS估计值围绕在被估计参数的总体真实值的周围。2.他们具有最小方差性。对于无偏分布来说,系数估计值的分布尽可能紧凑地或狭窄地围绕在真实参数值的周围。对于每一个被估计的系数,没有其它无偏估计量比OLS量的方差更低。3.他们是一致的。随着样本容量趋近无穷,估计值收敛于真实总体参数。换句话说,随着样本容量增大,方差越来越小,每一个系数的估计值越来越接近被估计系数的真实值。4.他们服从正态分布。这样,基于正态分布的不同统计检验方法适用于这些估计值,正如我们在第5章所做的那样。在方程中其他自变量不变的情况下,如果七条经典假定都满足,用OLS来计算值,那么,一个回归系数的估计就可以表述为:在其它自变量保持不变时,由一个自变量增加一个单位,对应变量所产生的影响的(无偏的、具有最小方差的)估计值。这样的估计值是从以真实总体系数为中心的估计值的分布中抽取的,并且对于所有无偏分布来说,该分布具有最小方差。4.4 标准计量经济学符号尽管4.2节用图形的形式描述了中心趋势和离散程度,然而本节还是列出了通用于计量经济学文献中的有关这些概念的符号。的抽样分布的中心趋势的度量用表示,读作“贝塔-帽的期望值”, 它可以被认为是所有的均值。某随机变量的期望值就是该变量的总体均值(观测值的概率加权平均值)。的方差通常用来度量的抽样分布的离散程度。有几个可供选择的符号来表示方差,包括和。每一个都可以读作“贝塔-帽的方差”,表示抽样分布的离散程度。表4-1分别列出了用以表示不同总体(真实)参数和相应估计值(基于样本)的几种可供选择的符号。再次回顾表4-1,真实系数的估计为。由于这一估计值依赖于真实函数中的随机误差项,所以它是随机的。这样,基于的分布,有一个抽样分布。如同我们通常假定的,如果是正态分布,那么也服从正态分布。表4-1 常用的符号总体参数(真实值,但不可观测) 估计值(可以从样本中观测)回归系数被估计的回归系数被估计系数的期望值误差项的方差或误差项的估计方差或误差项的标准差方程的标准误(估计的)或被估计系数的方差或被估计系数的估计方差或被估计系数的标准差或被估计系数的标准误或误差或扰动项残差(即误差项的估计值,这是从不严格意义上理解)两个总体参数,均值和方差,充分描述了的分布。均值表示抽样分布中心趋势的度量。在无偏的条件下,。方差(也可以是方差的平方根,称为标准差)就是抽样分布离散程度的度量。估计值的方差是一个总体参数,在实际中不能被观测到。取而代之,用来估计它,也可写作。顺便说一下,要注意真实的方差为零。这是因为仅存在一个真实的,不存在的一个分布。这样,以上就定义了估计的系数的方差的估计,它可以被观测(对于给定样本它可以计算,译者注)到。估计系数的真实方差不可以被观测到,并且真实系数的实际方差为零。系数估计值的估计方差的平方根就是的标准误,。在假设检验中,我们会广泛的应用它。4.5 总结1.七条经典假定指的是,回归模型是线性的,并且有一个均值为零、与解释变量不相关的误差项。误差项的观测值与回归元的观测值不相关,同时,它具有不变方差和服从正态分布(可选择)的性质。此外,解释变量之间一定不能相互存在完全线性函数的关系。2.估计量的两个最重要性质是无偏性和最小方差性。当被估计系数的期望值等于真实值时,这种估计量就是无偏的。在给定的一类估计量(例如无偏估计量)中,如估计值分布的方差在所有估计量中最小,则最小方差性成立。3.给定经典假定,回归系数的OLS估计量被证明具有最小方差性、线性性和无偏性(或最优线性无偏估计量,BLUE)。这就是高斯-马尔可夫定理。当一个或多个经典假定不成立时(除去正态假定),尽管在某些时候OLS仍然能够提供比我们在随后章节中所讨论的其他可供选择的估计技术更好的估计值,但它不再是BLUE。4.因为的OLS估计量的抽样分布是BLUE,所以它具有令人满意的性质。而且,随着被观测样本数量的增加,的抽样分布中的方差(或离散程度)的度量值随之下降。5.在满足经典假定的模型中,假定方程中其他自变量保持不变,用OLS估计的回归系数所度量的是,当自变量增加一个单位时,对应变量所产生的影响的(无偏的、最小方差的)估计。6.本节列出了计量经济文献中常用的标准符号。表4-1列出了常用于回归分析中一系列较为复杂的符号。作为复习资料,读者应该定期复习它。练习:(偶数题号的答案见附录A)1.不要参考书本(或你的笔记),写出下面各项的意义,再把你的答案和书本作比较。 a 经典假定 b 经典误差项c 标准正态分布d e 无偏估计量f BLUEg 抽样分布2.下面哪对自变量会违反假定?(即,哪对变量之间是完全线性函数?)a (你班上学生)右脚鞋的尺码与左脚鞋的尺码。b(美国过去30年内)消费与可支配收入c 与2d 与3考虑下面估计的回归方程(括号内表示标准误) (0.05) (1.00)这里:=t年的玉米产量(蒲式耳/英亩) =t年的施肥密度(磅/英亩) =t年降雨量(英寸)a 根据和对的影响,详细说明方程中系数0.10和5.33的意义。b常数项-120,真的意味玉米的产量可能为负吗?如果不是,那么该估计值是什么意思?C 假设你被告知,的真实值是0.20,这表示该估计值是有偏的吗?详细说明理由?d假设你被告知该方程并不满足所有经典假定,因而不是BLUE,这是否意味着,真实的一定不等于5.33,为什么是或为什么不是?4 高斯-马尔可夫定理表明OLS是BLUE,因此,我们当然希望系数估的计值具有无偏性和最小方差性。然而,假设你只能在这两者之间选一个:a 如果你必须选一个,你是愿意选一个具有无偏性而没有最小方差性的估计值,还是选一个有偏的而具有最小方差的估计值呢? 解释你的理由。b存在让你改变a小题答案的情况吗?(提示:一个有偏的或没有最小方差性的估计值会带来什么后果?)c在变化的偏差和不具有最小方差的估计值之间,你能够想到一种系统的选择方法吗?5 在1993年,Edward Saunders 发表一篇论文。该文检验了股票市场被华尔街天气影响的可能性。应用19621989年的日数据,他估计了含有下列显著变量的方程。(括号内为标准差) (0.01) (0.0006) (0.004) (0.0002)N=6911(日) 这里:=t日的道-琼斯工业股票价格指数变化的百分率 =t日的资本收益或损失的日指数 =虚拟变量。如果t日在一月,=1,否则等于0。 =虚拟变量。如果t日是星期一,1,否则等于0。=1,当天空中多云时间小于或等于20%时;=-1,当天空中多云时间为100%时;否则等于0。a. Saunders在他报告的回归结果中并没有包括常数项的估计值。哪个经典假定支持你可以不用花太多时间去分析常数项的估计值?请解释。b. 如果你决定在方程中增加一个虚拟变量,该虚拟变量在t日为星期二、星期三、星期四或星期五时取值为1,否则取值为零。这时,会违反哪条经典假定?(提示:股票市场在周末不交易)。c.详细说明和的系数的意义,在说明时要考虑到方程中用滞后的(后一时期)是有理论依据的。d. 变量度量了第t天从日出到日落时间内,天空中多云时间的百分比。它反映在纽约接近占总数85%的下雨天里,这些天多云的比例是100%这一事实。是虚拟变量吗?作者在使用该变量时,做了什么假定(或结论)?他对方程作了什么约束?e. Saunders认为他的这些发现对股票市场完全理性的假定提出了疑问。仅基于包括在我们所讨论问题中作者的一小部分工作,你是否同意作者的观点?为什么?6 考虑一个随机变量,它的分布是,也就是具有均值为零,方差为0.5的正态分布。从该分部中抽取一个大于1或小于-1的观测值的概率是多少?(提示:回答这个问题,你需要把该分布转换成一个标准正态分布(均值为0,标准差为1),然后参考本书后面的表B-7,该表介绍了如何使用这一转换)。7. W. Bowen和T.Finegan9 W. G. Bowen and T. A. Finegan, “Labor Force Participation and Unemployment,” in Arthur M. Ross (ed.), Employment Policy and Labor Markets (Berkeley: University of California Press, 19

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论