《计量经济学》课件资料整理.doc_第1页
《计量经济学》课件资料整理.doc_第2页
《计量经济学》课件资料整理.doc_第3页
《计量经济学》课件资料整理.doc_第4页
《计量经济学》课件资料整理.doc_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计量经济学第一章一、计量经济学定义。计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科。它是经济理论、统计学和数学三者的结合。二、建立与应用计量经济学模型的主要步骤。(一)理论模型的设计1.确定模型所包含的变量 2.确定模型的数学形式 3.拟定理论模型中待估参数的理论期望值(二)、样本数据的收集(三)、模型参数的估计(四)、模型的检验(五)、模型的应用三、理论模型的设计所包含的三部分工作。(一)、确定模型所包含的变量在单方程模型中,变量分为两类。作为研究对象的变量,也就是因果关系中的“果”,是模型中的被解释变量;而作为“原因”的变量,是模型中的解释变量。确定模型所包含的变量,主要是指确定解释变量。可以作为解释变量的有下列几类变量:外生经济变量、外生条件变量、外生政策变量和滞后被解释变量。 如何正确地选择解释变量?1、需要正确理解和把握所研究的经济现象中暗含的经济学理论和经济行为规律。2、选择变量要考虑数据的可得性。3、选择变量时要考虑所有入选变量之间的关系,使得每一个解释变量都是独立的。(二)、确定模型的数学形式 选择模型数学形式的主要依据是经济行为理论。在数理经济学中,已经对常用的生产函数、需求函数、消费函数、投资函数等模型的数学形式进行了广泛的研究,可以借鉴这些研究成果。也可以根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,由散点图显示的变量之间的函数关系作为理论模型的数学形式。如果无法事先确定模型的数学形式,那么就采用各种可能的形式进行试模拟,然后选择模拟结果较好的一种。(三)、拟定理论模型中待估参数的理论期望值 理论模型中的待估参数一般都具有特定的经济含义,对于它们的数值范围,即理论期望值,可以根据它们的经济含义在开始时拟定。这一理论期望值可以用来检验模型的估计结果。 拟定理论模型中待估参数的理论期望值,关键在于理解待估参数的经济含义。例如在生产函数理论模型中有4个待估参数、和A。其中,是资本的产出弹性,是劳动的产出弹性,近似为技术进步速度,A是效率系数。根据这些经济含义,它们的数值范围应该是: 01, 01, 1, 00。四、常用的样本数据类型。样本数据质量。(一)、几类常用的样本数据 1、 时间序列数据:是一批按照时间先后排列的统计数据。 2、截面数据:是一批发生在同一时间截面上的调查数据。 3、虚变量数据:也称为二进制数据,一般取0或1。虚变量经常被用在计量经济学模型中,以表征政策、条件等因素。(二)、样本数据的质量 1、完整性,即模型中包含的所有变量都必须得到相同容量的样本观测值。 2、准确性,有两方面含义,一是所得到的数据必须准确反映它所描述的经济因素的状态,即统计数据或调查数据本身是准确的;二是它必须是模型研究中所准确需要的,即满足模型对变量口径的要求。例如,在生产函数模型中,作为解释变量的资本、劳动等必须是投入到生产过程中的、对产出量起作用的那部分生产要素,以劳动为例,应该收集生产性职工人数,而不能以全体职工人数作为样本数据。 3、可比性,也就是通常所说的数据口径问题。统计范围口径的变化和价格口径的变化,必须进行处理后才能用于模型参数的估计。计量经济学方法,是从样本数据中寻找经济活动本身客观存在的规律性,如果数据是不可比的,得到的规律性就难以反映实际。 4、一致性,即母体与样本的一致性。例如,用企业的数据作为行业生产函数模型的样本数据,用人均收入与消费的数据作为总量消费函数模型的样本数据。 五、计量经济学模型必须通过哪四级检验?(一)、 经济意义检验主要检验模型参数估计量在经济意义上的合理性。方法是将模型参数的估计量与预先拟定的理论期望值进行比较,包括参数估计量的符号、大小、相互之间的关系,以判断其合理性。(二)、统计检验 检验模型的统计学性质。应用的统计检验准则有拟合优度检验、变量和方程的显著性检验等。(三)、计量经济学检验 检验模型的计量经济学性质。通常最主要的检验准则有随机误差项的序列相关检验和异方差性检验,解释变量的多重共线性检验等。(四)、模型预测检验包括1、稳定性检验:扩大样本重新估计 2、预测性能检验:对样本外一点进行实际预测六、计量经济模型成功的三要素。 (一)、理论,即所研究的经济现象的行为理论,是计量经济学研究的基础。 (二)、方法,主要包括模型方法和计算方法,是计量经济学研究的工具与手段,是计量经济学不同于其它经济学分支学科的主要特征。 (三)、数据,反映研究对象的活动水平 、相互间联系以及外部环境的数据,或更广义讲是信息,是计量经济学研究的原料。 这三方面缺一不可。七、相关关系与因果关系的区别与关系。相关关系,是指两个以上的变量的样本观测值序列之间表现出来的随机数学关系,用相关系数来衡量。 因果关系,是指两个或两个以上变量在行为机制上的依赖性,作为结果的变量是由作为原因的变量所决定的,原因变量的变化引起结果变量的变化。因果关系有单向因果关系和互为因果关系之分。具有因果关系的变量之间一定具有数学上的相关关系。而具有相关关系的变量之间并不一定具有因果关系。八、计量经济学模型的应用领域。 (一)、结构分析 经济学中的结构分析是对经济现象中变量之间相互关系的研究。它研究当一个变量或几个变量发生变化时会对其它变量以至经济系统产生什么样的影响。 结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。(二)、经济预测(三)、政策评价 政策评价是指从许多不同的政策中选择较好的政策予以实行,或者说是研究不同的政策对经济目标所产生的影响的差异。计量经济学模型,揭示了经济系统中变量之间的相互联系,将经济目标作为被解释变量,经济政策作为解释变量,可以很方便的评价各种不同的政策对目标的影响。 主要有三种方法。一是工具目标法。二是政策模拟。三是最优控制方法。(四)、检验与发展经济理论 一是按照某种经济理论去建立模型,然后用表现已经发生的经济活动的样本数据去拟合,如果拟合很好,则这种经济理论得到了检验。这就是检验理论。 二是用表现已经发生的经济活动的样本数据去拟合各种模型,拟合最好的模型所表现出来的数量关系,则是经济活动所遵循的经济规律,即理论。这就是发现和发展理论。九、计量经济学的建模方法主要有哪些?计量经济学的建模方法包括传统的和非传统的计量经济建模方法。传统的主要包括平均经济回归(AER)和误差设定。非传统的主要包括Leamer的模型选择方法、伦敦经济学院的模型选择方法。(一)、平均经济回归(AER):是一种向模型增加变量的重复过程,它的运用所依循的原则是节省性、识别性、拟合优度、理论一致性和预测功效。(二)、误差设定:主要包括误差类型、误差观测、误差影响和误差检验。第二章、计量经济学的基础工具一、矩阵知识初步二、概率与统计初步1.基本概念:样本空间、总体、样本点、事件、随机变量、概率的古典形式、概率的性质2.概率密度函数:对于随机变量X的每一个可能的取值x, 通过一个对应关系f,存在一个唯一的数y=f(x) 0,1与之对应,则称f(x)是X的密度函数。当X是离散随机变量时,密度函数称为概率分布率即:f(x)=P(X=x).3.分布函数:记住几个重要的分布函数的定义、密度函数及性质4.条件密度与边缘密度函数:5. 随机变量的数字特征及性质6.样本及样本空间三、统计推断1.统计推断:在现实中,人们常常从所研究的对象即总体中抽取一部分个体即样本,根据样本的情况来推断总体的某些特征,即从局部推断整体状况,这在统计学上就称为统计推断。在统计推断问题中,推断的形式会根据问题的需要而不同。如在测量模型中,要估计测量对象的真值,通常用样本均值估计,这类问题称为点估计。但有时我们需求得的变化范围,这就是区间估计问题,还有一类问题需要利用样本判断某个结论的真伪,这就是假设检验问题。统计推断有三大基本任务:点估计,区间估计,假设检验。2.点估计:点估计就是通过样本函数估计总体中某些未知数字特征或确定总体的某些未知参数,这样的函数经常称为统计量。(1)定义:设h是总体的未知参数,X=(x1xn)是总体的一个样本,若统计量=(X)用于估计未知参数h,则称为h的估计量,用样本观测值x=(x1xn)替代X得到估计量的取值,称为参数的估计值,用(X)估计h的统计问题称为参数估计(2)常用的方法:矩估计法;最小二乘、极大似然,非参数估计等。(3)判断估计优劣的标准:无偏性,相合性,有效性。3.假设检验:考虑如下问题:将情况基本相似的两组病人随机地分配到A治疗方法与B治疗方法,观测的结果为:A 有效46,无效 48;B 有效34,无效60. 据此能说明A方法优于B法吗?注意产生疗效率差的原因有: 抽样误差;(2)总体率的差即本质差要说明究竟是哪种原因,就必须利用假设检验方法基本思想:在某种原假设成立时,利用适当的统计量和给定的显著水平,构造一个小概率事件,如果这个事件发生了,就认为原假设不成立,可以拒绝原假设接受备择假设假设检验的步骤:(1)建立检验假设,确定检验水平(2)确定检验统计量,在零假设条件下,计算检验统计量的样本值(3)计算P值,作出统计推断,p值定义为在零假设成立时,检验统计量不小于(或不大于)检验统计量的样本值的概率,一般地:p ,拒绝原假设,接受备择假设,p ,不拒绝原假设。四、优化理论基础第三章一、 线性回归模型(一)线性回归模型的特征:1、 通过引入随机误差项,将变量之间的关系用一个线性随机方程来描述,并用随机数学的方法来估计方程中的参数;2、在线性回归模型中,被解释变量的特征由解释变量与随机误差项共同决定。随机误差项主要包括哪些因素的影响?(1)在解释变量中被忽略的因素的影响; (2)变量观测值的观测误差的影响;(3)模型关系的设定误差的影响;(4)其它随机因素的影响。回归分析的目的是,根据样本回归方程(SRF) 估计总体回归方程(PRF)。总体回归方程(PRF)说明被解释变量Y的平均状态(总体条件期望)随解释变量X变化的规律。由于变量间关系的随机性,回归分析关心的是根据解释变量的给定值,考察被解释变量的总体均值,即当解释变量取某个确定值时,与之统计相关的被解释变量所有可能出现的对应值的平均值。(二)线性回归模型的普遍性1、实际经济活动中的许多问题,都可以最终化为线性问题,所以,线性回归模型有其普遍意义。2、即使对于无法采取任何变换方法使之变成线性的非线性模型,目前使用得较多的参数估计方法非线性最小二乘法,其原理仍然是以线性估计方法为基础。3、线性模型理论方法是计量经济学模型理论方法的基础。线性的含义:线性回归模型是计量经济学模型的主要形式,许多实际经济活动中经济变量间的复杂关系都可以通过一些简单的数学处理,使之化为数学上的线性关系。将非线性模型转化为线性模型的数学处理方法变量置换例如,描述税收与税率关系的拉弗曲线:抛物线 s = a + b r + c r2 c0 s:税收; r:税率设X1 = r,X2 = r2, 则原方程变换为 s = a + b X1 + c X2 c0 变量置换仅用于变量非线性的情况。 函数变换例如,Cobb-Dauglas生产函数:幂函数 Q = AKaLbQ:产出量,K:投入的资本;L:投入的劳动方程两边取对数: ln Q = ln A + a ln K + b ln L(3)级数展开(三)、线性回归模型的基本假设1、线性回归模型在上述意义上的基本假设(1)解释变量X1,X2,Xk 是确定性变量,不是随机变量;解释变量之间互不相关。(2)随机误差项具有均值和同方差。即 E(mi)=0 i=1,2, ,n Var (mi)=sm2 i=1,2, ,n(3)随机误差项在不同样本点之间是独立的,不存在序列相关。即 Cov(mi, mj)=0 ij i,j= 1,2, ,n(4)随机误差项与解释变量之间不相关。即 Cov(Xji, mi)=0 j=1,2, ,k i=1,2, ,n (5)随机误差项服从均值、同方差的正态分布。即 miN(0, sm2 ) i=1,2, ,n2、重要提示(1)几乎没有哪个实际问题能够同时满足所有基本假设;(2)通过模型理论方法的发展,可以克服违背基本假设带来的问题;(3)违背基本假设问题的处理构成了单方程线性计量经济学理论方法的主要内容: 异方差问题(违背同方差假设);序列相关问题(违背序列不相关假设) 共线性问题(违背解释变量不相关假设);随机解释变量(违背解释变量确定性假设)二、一元线性回归模型的参数估计(一)、普通最小二乘法(OLS)给定一组样本观测值Xi, Yi(i=1,2,n),要求样本回归方程尽可能好地拟合这组值,即样本回归线上的点与真实观测点的“总体误差”尽可能地小。1、 最小二乘法给出的判断标准是:二者之差的平方和最小。21)(iniYYQ-=2101)(iniXYbb+-2、参数估计的离差形式(deviation form)注:在计量经济学中,往往以小写字母表示对均值的离差(deviation)。2、 随机误差项的方差的估计量记为第i个样本观测点的残差,即被解释变量的估计值与观测值之差。则随机误差项方差的估计量为:(二)、最大或然法(ML)最大或然法( Maximum Likelihood, ML) ,也称最大似然法,是不同于最小二乘法的另一种参数估计方法,是从最大或然原理出发发展起来的其它估计方法的基础。1、 基本原理:对于最小二乘法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得模型能最好地拟合样本数据。 对于最大或然法,当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。将该或然函数极大化,即可求得到模型参数的极大或然估计量。由于或然函数的极大化与或然函数的对数的极大化是等价的,所以,取对数或然函数如下:可见,在满足一系列基本假设的情况下,模型结构参数的最大或然估计量与普通最小二乘估计量是相同的。但是,随机误差项的方差的估计量是不同的。(三)、参数估计量的概率分布与随机项方差的估计可以证明:总体方差2s的无偏估计为222-=neis在总体方差2s的无偏估计量2s求出后,估计的参数0b和1b的方差和标准差的估计分别是:1b的样本方差:=221)(ixVarsb;1b的样本标准差:=21)(ixSsb0b的样本方差:=2220)(iixnXVarsb;0b的样本标准差:=220)(iixnXSsb(四)、参数估计量的性质1、线性性(linear):即是否是另一随机变量的线性函数;参数估计量 是Yi的线性函数2、无偏性(unbiased):即它的均值或期望值是否等于总体的真实值;参数估计量 的均值(期望)等于模型参数值。即3、有效性(efficient):即它是否在所有线性无偏估计量中具有最小方差。证明最小方差性:(五)、实例现欲研究某市城镇居民1995年2002年人均可支配收入和人均消费性支出之间的关系。表1给出了某市城镇居民1995年至2002年期间各年度的人均可支配收入和人均消费性支出的数据。 表1 某市有关统计资料 单位:元年份人均可支配收入人均消费性支出1995428336371996483939191997516041851998542543311999585446162000628049982001685953592002770360301 理论模型的设计 我们首先通过散点图来观察一下,住宅房地产需求量与居民收入之间是否存在关系。由图1可见,可以用线性回归模型来描述该市城镇居民人均可支配收入和人均消费性支出之间的关系。在本例中,城镇居民人均可支配收入为解释变量,用X来表示;人均消费性支出为被解释变量,用Y来表示,则描述某市城镇居民人均可支配收入和人均消费性支出之间关系的线性回归模型的理论模型为: i=1,2,n在本例中,影响人均消费性支出的因素,除了居民人均可支配收入之外,还可能有消费品的价格水平、银行存款利率、消费者的偏好,政府的政策,需求者对未来的预期等等多种因素。我们这里仅分析居民人均可支配收入对人均消费性支出的影响,其他各因素的影响,就被包含在随机误差项中。2估计人均消费性支出对人均可支配收入的线性回归方程依据1995年2002年的样本数据,运用普通最小二乘法离差形式的参数估计式对进行估计: 表2 参数估计计算表年序号142833637-1517.4-997.42302426.91513391.9248393919-961.4-715.4924241.9687743.6351604185-640.4-449.4410080.1287768.5454254331-375.4-303.4140906.4113879.455854461653.6-18.42875.6-985.4662804998479.6363.6230040.1174403.67685953591058.6724.61120686.9767106.18770360301902.61395.63619981.92655351.0合计46403370758751239.96198658.9 根据表2合计栏的数据及以上关于和的计算结果可得: 则依据1995年2002年的样本数据,可得描述该市城镇居民人均可支配收入和人均消费性支出之间依存关系的线性回归方程:该结果给出了该市城镇居民人均可支配收入和人均消费性支出之间依存关系的具体形式。表明,当居民人均可支配收入增加1元时,人均消费性支出将平均增长0.7083元。这里之所以讲“平均”,是因为是其与给定的值对应的许多可能取值的平均值。离差形式的中间计算也可不用计算表,而采用如下的简捷式计算: 式中, n为样本容量。习题的书写格式: (i=1,2,n) 统计意义:当X增加1个单位时,Y平均增加0.7083个单位。经济意义:当居民人均可支配收入增加1元时,人均消费性支出将平均增长0.7083元。三、多元线性回归模型的参数估计(一)、多元线性回归模型多元线性回归模型的一般形式为:习惯上把常数项看成为一个虚变量的系数,在参数估计过程中该虚变量的样本观测值始终取1。这样:模型中解释变量的数目为(k+1)。(二)、多元线性回归模型的参数估计最简单的多元线性回归模型是二元线性回归模型。二元线性回归模型的一般形式为: (i=1,2,n)其参数的最小二乘估计量如下: 、称偏回归系数。的数值结果表明,当保持不变时,每增加1个单位,Y平均增加个单位;的数值结果表明,当保持不变时,每增加1个单位,Y平均增加个单位。(三)、参数估计量的性质1、线性性:$()B=-XXXY12、无偏性:BBE=)(证:NXXXBNXBXXXYXXXB-=-=-111)()()()(于是:BNEXXXBNXXXEBEBE=-=-=-)()()()()(113、有效性:若*B是B的任一线性无偏估计量,则有:)()(*-BBBBEBBBBE(四)、样本容量问题1、最小样本容量:所谓“最小样本容量”,即从最小二乘原理和最大或然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。样本最小容量必须不少于模型中解释变量的数目(包括常数项)。即2、满足基本要求的样本容量 虽然当 时可以得到参数估计量,但除了参数估计量质量不好以外,一些建立模型所必须的后续工作也无法进行。经验表明,当时t分布较为稳定,检验才较为有效。所以,一般经验认为,当或者至少时,才能满足模型估计的基本要求。(五)、多元线性回归模型实例例如,对我国19912000年的消费模型进行估计。根据我国19912000年的人均居民消费额Y(千元),人均国内生产总值X1(千元),前一期人均居民消费额X2(千元)的有关数据计算出: Yi=22.1 X1i=47.5 X2i=19.5 Yi2=56.21 x1i2=31.83 x2i2=7.27 x1ix2i=14.89 yix1i=15.28 yix2i=7.24 yi2=7.37 n=10 其中 , (1) 对我国19912000年的消费模型进行估计 结果表明,当前一期人均居民消费额()保持不变时,人均国内生产总值()每增加1千元,人均居民消费额(Y)平均增加0.339千元;当人均国内生产总值()保持不变时,前一期人均居民消费额()每增加1千元,人均居民消费额(Y)平均增加0.302千元。(六)、Beta系数在多元线性回归模型中,我们有时需要考察对于被解释变量来讲,哪个解释变量更重要,即需要比较各个解释变量的相对重要性,如果各解释变量的计量单位不同,就不能直接应用偏回归系数进行比较,因为偏回归系数的取值受解释变量计量单位的影响。我们需要对偏回归系数加以调整,以便进行多元回归模型中各解释变量对被解释变量相对重要性的比较,如以下介绍的Beta系数、弹性系数。Beta系数的计算如下: (j=1,2,k)表示变化一个标准差时,将使变化多少标准差。 它通过解释变量的标准差与被解释变量的标准差的比例对估计的偏回归系数进行调整,可用于直接比较多元回归模型中各解释变量的相对重要性。在前例中x1i2=31.83 x2i2=7.27 yi2=7.37 ,则X1 及X2的Beta系数如下: 统计意义:解释变量X1变化一个标准差时,将使被解释变量Y有0.705个标准差的变化。经济意义:19912000年,我国人均国内生产总值变化一个标准差时,会使人均居民消费额有0.705个标准差的变化。统计意义:解释变量X2变化一个标准差时,将使被解释变量Y有0.300个标准差的变化。经济意义:19912000年,我国前一期人均居民消费额变化一个标准差时,会使人均居民消费额有0.300个标准差的变化。由此可见,就这一样本数据而论,人均居民消费额对于人均国内生产总值变化的敏感程度大于对前一期人均居民消费额变化的敏感程度。(七)、弹性系数弹性系数的计算如下: 表明在变量平均值周围,每变动1%,将使变动几% 。其与解释变量的计量单位无任何关系,很适宜进行多元回归模型中各解释变量相对重要性的比较。在前例中, n=10Yi=22.1 X1i=47.5 X2i=19.5,则 表明在变量平均值周围, 人均国内生产总值(X1)每变动1%,将使人均居民消费额(Y)变动0.729%。表明在变量平均值周围, 前一期人均居民消费额(X2)每变动1%,将使人均居民消费额(Y)变动0.266%。由此可见,就这一样本数据而论,人均居民消费额对于人均国内生产总值变化的敏感程度大于对前一期人均居民消费额变化的敏感程度。(八)、相关分析1 简单相关系数:简单相关系数描述两个变量之间的线性关系密切程度。在二元回归分析中,各个变量之间的简单相关系数的计算公式如下:(1) Y与X1的相关系数(2)Y与X2的相关系数 (3)X1与X2的相关系数在前述关于我国19912000年消费模型的算例中,我国人均居民消费额Y(千元)与人均国内生产总值X1(千元)的相关系数为:我国人均居民消费额Y(千元)与前一期人均居民消费额X2(千元)的相关系数为: 人均国内生产总值X1(千元)与前一期人均居民消费额X2(千元)的相关系数为:计算结果表明,我国人均国内生产总值(X1)比前一期人均居民消费额(X2)对人均居民消费额(Y)的影响大些。2、偏相关系数:它是在控制或消除其它变量影响的情况下,衡量多个变量中的某两个变量之间的真实相关程度的指标。在二元回归分析中,可以根据简单相关系数计算偏相关系数如下: (1)当X2 保持不变时,Y与X1之间的偏相关系数: (2)当X1 保持不变时,Y与X2之间的偏相关系数: (3)当Y 保持不变时,X1与X2之间的偏相关系数: 偏相关系数的取值范围在-1至+1之间。对于前述我国19912000年的消费模型算例,有:即,当前一期人均居民消费额X2 保持不变时,我国人均居民消费额Y与人均国内生产总值X1之间的真实相关程度为0.9771。(其值小于相应的简单相关系数)即,当人均国内生产总值X1保持不变时,我国人均居民消费额Y与前一期人均居民消费额X2之间的真实相关程度为0.8919。(其值小于相应的简单相关系数)即,当我国人均居民消费额Y 保持不变时,人均国内生产总值X1与前一期人均居民消费额X2之间的真实相关程度为-0.7774。(其符号与相应的简单相关系数相反,且绝对值减小。)上述计算结果显示,各个偏相关系数均小于相应的简单相关系数,X1与X2之间的偏相关系数甚至与相应的简单相关系数符号相反,其原因是偏相关系数排除了其他变量的影响而单独反映两个变量之间相关关系的密切程度。它反映了多个变量中的某两个变量之间的真实相关程度。偏相关系数的计算结果表明,对于被解释变量“我国人均居民消费额”来讲, “人均国内生产总值”是比“前一期人均居民消费额”更重要的解释变量。3复相关系数复相关系数用于度量被解释变量与方程中所有解释变量之间共同的相关程度。一般用表示,复相关系数总是取正值。在二元回归分析中,复相关系数的计算公式如下: 在前述我国19912000年的消费模型算例中,我国人均居民消费额Y与人均国内生产总值X1、前一期人均居民消费额X2之间共同的相关程度为: 比较各解释变量的相对重要性偏回归系数Beta系数弹性系数偏相关系数当其它解释变量保持不变时,某一解释变量变化一个单位而使被解释变量平均改变的数值。 计量单位不同时不能直接比较表示变化一个标准差时,将使变化多少标准差。可直接比较表明在变量平均值周围,每变动1% , 将使变动几% 。与解释变量的计量单位无任何关系,很适宜回答上述问题。在消除其它变量影响的情况下,衡量多元回归模型中某两个变量之间的相关程度。用来确定多元回归模型中不同变量的相对重要性。表示当X2不变时,Y与X1的真实相关程度。相关分析和回归分析 相关分析是判断变量之间是否具有相关关系的数学分析方法,通过计算变量之间的相关系数来实现。 回归分析也是判断变量之间是否具有相关关系的一种数学分析方法,它着重判断一个随机变量与一个或几个可控变量之间是否具有相关关系。(九)、虚拟变量问题带常数项的计量模型引入虚拟变量个数原则: 如果一个定性变量有m种互斥的属性,则引入m-1个虚拟变量。四、多元线性回归模型的统计检验我们所要进行的统计检验包括两个方面,一方面检验回归方程对样本数据的拟合程度,通过可决系数来分析;另一方面检验回归方程的显著性,通过假设检验对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断,包括对回归方程线性关系的检验和对回归系数显著性的检验。 (一)、拟合优度检验:顾名思义,是检验模型对样本观测值的拟合程度。1、总体平方和、残差平方和和回归平方和 : TSS为总体平方和(Total Sum of Squares),反映样本观测值总体离差的大小;ESS为回归平方和(Explained Sum of Squares),反映由模型中解释变量所解释的那部分离差的大小;RSS为残差平方和(Residual Sum of Squares),反映样本观测值与估计值偏离的大小,也是模型中解释变量未解释的那部分离差的大小。 TSS=RSS+ESS 2、拟合优度检验统计量:可决系数R2和校正可决系数(1)可决系数 用可决系数进行拟合优度检验,可决系数的计算公式为: ,该统计量越接近于1,模型的拟合优度越高。在应用过程中我们会发现,如果在模型中增加一个解释变量,模型的解释功能增强了,可决系数计算公式中的分子回归平方和就会增大,因而就增大。这就给人一种错觉:似乎要使模型拟合得好,就必须增加解释变量。但是,在样本容量一定的情况下,增加解释变量必定使得自由度减少。所以,用以检验拟合优度的统计量必须能够防止这种倾向,我们可以用自由度来调整 ,用来表示调整后的可决系数,以剔除解释变量数目与样本容量的影响,使具有不同样本容量和解释变量数目的回归方程可以进行拟合优度的比较。(2)校正可决系数对于前述一元回归例题, 结果表明,在Y的总变差中,有99.65%可以由解释变量X(或回归方程)做出解释,回归方程对于样本观测点拟合良好。也就是说,城镇居民的人均消费性支出的变化,有99.65%是由人均可支配收入决定的。二元回归例题的可决系数为:这表明,在人均居民消费额的总变差中,有99.87%可以由人均国内生产总值和前期人均居民消费额做出解释,回归方程对于样本观测点拟合很好。校正判定系数为:统计意义:用方差而不用变差,考虑到自由度,剔除解释变量数目与样本容量的影响,使具有不同样本容量和解释变量数目的回归方程可以对拟合优度进行比较。(二)、变量显著性检验1、关于假设检验(1)假设检验是统计推断的一个主要内容,它的基本任务是根据样本所提供的信息,对未知总体分布的某些方面的假设作出合理的判断。(2)假设检验的程序是,先根据实际问题的要求提出一个论断,称为统计假设;然后根据样本的有关信息,对假设的真伪进行判断,作出拒绝或接受假设的决策。 (3)假设检验的基本思想是概率性质的反证法。(4)概率性质的反证法的根据是小概率事件原理,该原理认为“小概率事件在一次试验中几乎是不可能发生的”。 2、变量显著性检验:即对回归系数的显著性进行检验,如果变量是显著的,那么回归系数应该显著地不为0。于是,在变量显著性检验中设计的原假设为: H0:bi=0而备择假设为: H1: bi0 其中 的下角标i,在一元回归模型中取值1:在二元回归模型中取值1、2。然后根据样本观测值和估计值,计算统计量:该统计量服从自由度为的分布,即 在统计量的算式中,为总体回归系数,为相应的参数估计量,为参数估计量的标准差。对于一元回归模型,其中为随机误差项方差的估计量,对于二元回归模型, 计算出统计量后,要选定一个显著性水平,结合自由度,由分布表(见附表5),查得临界值。如果计算出的统计量的绝对值,则在(1a)的置信概率下拒绝原假设。表明在(1a)的置信概率下,不是由这样的总体产生的,显著地不为0,即变量对被解释变量的影响是显著的;如果,则在(1)的置信概率下接受原假设H0,表明在(1)的置信概率下,bi与0没有什麽差别,即变量Xi对被解释变量的影响是不显著的。对前述一元例题的回归系数进行显著性检验:拒绝原假设,接受备择假设。表明在95%置信概率下,不是由这样的总体产生的,显著地不为0,即变量对被解释变量的影响是显著的;也就是说,在95%的置信概率下,城镇居民的人均可支配收入对于人均消费性支出的影响是显著的。对于前述二元例题,我们已经得到对我国19912000年消费模型的估计结果:现选定显著性水平,对偏回归系数(斜率)进行检验,已知yi2=7.37 拒绝,接受检验结果表明,在95%置信概率下,不是由这样的总体产生的,显著地不为0,即变量对被解释变量的影响是显著的;也就是说,在95%的置信概率下,人均国内生产总值对人均居民消费额的影响是显著的。 拒绝,接受检验结果表明,在95%置信概率下,不是由这样的总体产生的,显著地不为0,即变量对被解释变量的影响是显著的;也就是说,在95%的置信概率下,前一期人均居民消费额对本期人均居民消费额的影响是显著的。(三)、方程显著性检验1、F检验的思想F检验的思想来自于总离差平方和的分解式:TSS=ESS+RSS由于回归平方和ESS是解释变量X联合体对被解释变量Y的线性作用的结果,所以,如果ESS/RSS的比值较大,则X的联合体对Y的解释程度高,可认为总体存在线性关系,反之总体上可能不存在线性关系。因此,可通过该比值的大小对总体线性关系进行推断。进一步根据数理统计学中的定义,如果构造一个统计量 则该统计量服从自由度为(k,n-k-1)的F分布。 2、方程显著性F检验的步骤对回归方程线性关系显著性的检验采用F检验,检验依据样本估计的回归方程所体现的被解释变量与解释变量之间的线性关系在总体上是否显著成立,即是检验总体模型 i=1,2,n中的参数是否显著不为0。按照假设检验的原理与程序,首先提出假设,原假设为: 即模型线性关系不成立。备择假设为:(1) 对于一元线性回归模型,假设为:然后根据样本观测值和估计值,计算统计量的数值: 其中,为判定系数,为模型中解释变量的个数,为样本容量。F统计量服从自由度为的分布。选定一个显著性水平,查分布表(见本书附录),可以得到一个临界值。如果所计算的,则在(1)的置信概率下拒绝原假设,即模型的线性关系显著成立,模型通过方程显著性检验。如果所计算的,则在(1)的置信概率下接受原假设,即模型的线性关系显著不成立,模型未通过方程显著性检验。3、 方程显著性F检验的例题对前述得到的回归方程 进行线性关系显著性的检验,首先给出假设 选定显著性水平,本例中第一自由度,第二自由度,( 本例中解释变量数目=2,样本容量=10),查分布表,得到临界值拒绝,接受。在95%的置信概率下,模型的线性关系显著成立,人均国内生产总值和前期人均居民消费额在整体上对于人均居民消费额的解释作用是显著的。4、 t检验与F检验(1) 对于一元线性回归模型,F检验与t检验的假设均为:此时,两种检验是一致的。(2)但在多元回归情况下,两种检验说明的问题不同、作用不同,不能相互取代。5、关于拟合优度检验与方程显著性检验关系的讨论拟合优度检验和方程显著性检验是从不同原理出发的两类检验,前者是从已经得到估计的模型出发,检验它对样本观测值的拟合程度,后者是从样本观测值出发检验模型总体线性关系的显著性。可见,与R2同向变化:当R2 时,;当R2=时,为无穷大;R2越大,值也越大。因此,检验是所估计回归总显著性的一个度量,也是对 的一个显著性检验。即:检验原假设 ,等价于检验例如,前述求得二元回归例题的可决系数为,对其显著性进行检验: 所以,拒绝原假设 接受备择假设统计意义:在95%的置信概率下,回归方程可以解释的方差显著地大于未被解释的方差,显著地不等于0,不是由这样的总体产生的。经济意义:在95%的置信概率下,消费者平均收入和该商品价格在整体上对商品需求量的解释作用是显著的。五、单方程线性模型的区间估计(一)、参数估计量的区间估计1、2、如何缩小置信区间(1)增大样本容量n,因为在同样的样本容量下,n越大,t分布表中的临界值越小,同时,增大样本容量,还可使样本参数估计量的标准差减小;(2)提高模型的拟合优度,因为样本参数估计量的标准差与残差平方和呈正比,模型优度越高,残差平方和应越小。(3)提高样本观测值的分散度。 (二)、预测值的区间估计预测可分为点预测与区间预测。1、点预测是根据给定的解释变量,利用回归模型来估计预测期中相应的被解释变量。即可作为总体单值的预测估计值,也可作为总体均值E()的预测估计值。线性回归预测的点预测公式为:(对于一元回归)(对于二元回归)2、 区间预测是在一定置信概率的保证下,通过考察预测误差的范围,进而确定真实值Y0或E(Y0)可能被哪个区间范围所包含。预测值置信区间的推导:均值E()的预测区间为:其中: (对于一元回归) (对于二元回归) 表明当时,真实均值将以(1 )的置信概率被区间所包含。单值的预测区间为:(对于一元回归)(二元)表明当时,真实单值将以(1 )的置信概率被区间所包含。如果所拥有样本的容量大于或等于30,则可将上述各式中的t统计量改为正态分布统计量。例:已知2002年我国人均国内生产总值为8.75千元,2001年我国人均居民消费额为3.95千元,利用前面得到的回归方程,预测我国2002年的人均居民消费额。首先进行点预测: = 0.011+0.339*8.184+0.302*4.045 =4.007即,我国2002年的人均居民消费额的点预测估计值为4.007千元。然后进行区间预测: 0.026选定显著性水平,本例中的自由度为,n-k-1=10-2-1=7,查分布表,得到t分布的右侧临界值: 则人均居民消费额的的预测区间为: 统计意义:在9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论