




已阅读5页,还剩23页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章1.计量经济学含义:以经济理论为基础,以统计资料为材料,运用数理统计知识和计算机技术,建立计量模型,对经济变量进行定量分析,以验证经济理论、分析政策效果、或进行商业预测。2.计量经济学和其他学科关系 1、经济学,尤其是数理经济学,为其提供理论依据 2、经济统计学为其提供搜集加工整理统计资料的工具 但价格、收入、投资、储蓄等经济数据是不可控的非实验数据,存在测量误差、遗漏、设计错误等 3、数理统计为其提供假设检验的工具,以验证模型正确性 主要有概率、概率分布、随机变量、抽样、参数估计、假设检验和回归分析等内容,只有具备了一定的数理统计学基础,才能很好地掌握计量经济学。 4、线性代数3.经济计量学建模步骤 p2一、寻找研究的理论依据/设立一个理论假说 二、确定统计指标,搜集编制数据 明确变量对应的统计指标 数据分类: 时间序列数据:按时间跨度收集到的数据集合 横截面数据:某个时点上的数据集合 合并数据:时间序列数据和横截面数据的组合 数据来源:统计年鉴、统计类网站、数据公司三、建立数学模型 四、设立经济计量模型:引入误差项 自变量和因变量之间是统计关系,而不是确定的函数关系 解释变量:函数的自变量 被解释变量:函数的应变量五、采用适当方法,估计模型参数 六、进行检验,验证模型的适用性 经济检验:所估计参数的符号,大小是否符合理论等统计性检验: 拟合优度检验:回归线拟合真实值优劣程度 参数显著性检验:样本是否很好的代表了总体计量经济检验:回归模型前提条件的检验,例如多重共线性检验,异方差检验。预测性检验 本章考核要求 识记:计量经济学含义、统计数据分类、参数、斜率、截距、解释变量和被解释变量、随机误差项等基本概念。 领会:计量经济学与其他学科的关系,计量经济模型基本的建模步骤第二章1.求和符号的性质 p17 常数的n次求和为常数的n倍 常数可提到求和符号前 两个变量的求和等于对两个变量分别求和2.几个定义 1、实验: 例:测试某批共1000灯泡的使用寿命 2、总体:实验的所有可能结果的集合 例:该批灯泡中每个灯泡的使用寿命,以小时计 3、样本:由总体中抽出的若干个体的集合。 从该批灯泡中抽取100个灯泡,测试使用寿命抽取的原则:随机抽取。3.样本、总体和随机变量所谓样本就是N个相互独立且与总体同分布的随机变量数理统计的一个主要工作就是由样本去推断总体的数字特征。总结:总体可以表示为一个随机变量,样本就是N个与总体同分布的随机变量,总体分布 就是样本和总体的联结点。4.区间概率的计算5.数学期望有如下性质6.方差的性质常数的方差为零,var(k)=0随机变量加上一个常数不改变变量的方差 var(X+k)=var(X)随机变量常数倍的方差等于变量方差的常数平方倍 var(aX)=a2var(X) (随机变量线性变换的方差=?)如果两个随机变量相互独立,和之方差等于方差之和 var(X+Y)=var(X)+ var(Y) 返回 7.协方差 8.相关系数 、样本相关系数 9.注意(样本均值) 我们希望知道总体的一些数字特征,特别是均值,方差等。这只有在获得所有可能的结果时,才能得到。 例:灯泡的平均寿命通常只能得到关于总体的一个样本,我们的目标在于,通过获得的样本数据,对总体的数字特征进行估计,因此需要确定一个法则,将样本中我们关心的信息集中起来,这样的法则称为统计量,也称为估计量样本均值就是一个估计量,拿到样本后,依据样本均值的计算法则得到的具体数字称为估计值同时样本均值也是一个随机变量,样本均值的估计值依每次抽样不同而按概率取不同的值。该随机变量有它自己的均值和方差10.样本均值的均值和样本均值的方差 11.注意(样本方差) 样本方差同样是个估计量,由具体某个样本计算得到的样本方差的数值为估计值样本方差同样是个随机变量,有它自身的均值和方差 关于1/(n-1):可以用自由度的概念来解释 可以证明:样本方差的均值=总体方差的均值 即样本方差是总体方差的无偏估计。 样本方差存在量纲问题样本标准差sx:为样本方差的平方根 12.正太分布性质围绕均值u中心对称,曲线下总面积为1,钟形分布 P(xu)=0.5根据均值和方差,可求得随机变量落入任何区间的概率 阴影部分面积即为0.95,而1.96倍标准差的概率为0.025正态分布变量的线性变换仍然服从正态分布。两个正态分布变量的线性组合仍然服从正态分布。13.中心极限理论 注意:对随机变量x本身具体服从什么分布不做要求,只要相互独立,其和渐近于正态分布,主要是大量变量相加后,许多随机因素相互抵消的缘故。14.卡方的性质1)卡方分布只取正值2)卡方分布是斜分布,随着自由度的增大,逐渐对称并接近正态分布。3)两个服从卡方分布的独立随机变量,其和也服从卡方分布15.关于卡方分布的两个定理 16.t分布表示:性质:1)t分布和标准正态分布非常类似,对称分布。2) t分布均值为0,方差为k/(k-2),k为自由度当样本容量增大时, t分布方差快速趋向1 运用:总体方差已知时,用正态分布进行假设检验和统计推断,但当总体方差未知时,用t分布进行假设检验和统计推断17.分布表示: 性质:1)非负,斜分布2)自由度增大时,趋近与正态分布本章考核要求 领会估计量、估计值、总体各数字特征、样本各个数字特征 掌握各分布的随机变量的概率的计算第三章1.关于区间估计1)所得区间为随机区间,因为样本均值为随机变量2)这样的区间解读为:以这种方式构造出来的随机区间包含待估参数真值的概率为置信度, 例:设置信度95%,抽样100次,得到100个这样的区间,其中有95个区间一定包含u这个数值。3)如果我们预先猜测一个u的真值,而抽样得到一个样本均值,如果依据这个样本均值构造的区间没有包含我们预先猜测的值,发生这种情况的概率显著性水平4)一个样本均值有一个固定的区间,不可说这个区间包含待估参数真值的概率为95%。 5)关于精度,即区间宽度,在同样置信度下,我们希望区间越窄越好。即: 总体方差越小越好 样本容量越大越好6)同一个总体,置信度越高,则区间越宽2.对总体均值的估计 分为总体方差是否已知两种情形 方差已知,估计u的置信区间 总体分布未知:利用切贝谢夫不等式 若为大样本:依据中心极限定理 若为正态总体、小样本 方差未知,估计u的置信区间 若为大样本:依据中心极限定理和大数定律, 总体方差可用样本方差代替若为小样本但来自正态总体:利用t分布3.对总体方差的估计小样本下,正态分布总体,方差的置信区间的估计:利用卡方分布4.点估计量应具备的性质评价点估计量是否优良的的标准:1、线性 若估计量 是样本观测值的线性函数,则称该估计量为线性估计量 意义:线性估计量处理起来相对简单 样本均值就是一个线性估计量2、无偏性 估计量的均值=其对应的待估参数的真值(作图)。 意义:随机变量围绕其均值,即数学期望波动,估计量具备无偏性可使其尽量靠近对应的待估参数的真值样本均值就是一个无偏估计量3、有效性 同一个参数的所有无偏估计量中,方差最小的那个估计量称为有效估计量方差衡量了数据的离散程度,估计量具备有效性,即方差最小,可使其尽量靠近对应的待估参数的真值4、小结:最佳线性无偏估计量 最佳线性无偏估计量():在所有线性无偏估计量中,方差最小的估计量评价点估计量是否优良的的标准5、一致性5.假设检验 判断标准:小概率事件原理:如果一事件发生的概率很小,则我们称该事件在一次试验中为不可能事件 方法:1、置信区间法 步骤:给定一个置信度作区间估计,给出相应的置信区间给出零假设(即设定待估参数的值)如果零假设落在置信区间之外,则拒绝零假设;反之接受零假设/无法拒绝零假设 零假设所设定的待估参数的值落在置信区间之外,这是一个小概率事件,在一次试验中为不可能事件,我们与其信零假设为真,不如信其为假(但拒绝零假设,不意味着零假设一定为假) 两类错误:我们做出判断的依据是一组样本数据,因而假设结果不可能绝对正确,原因来自抽样误差弃真错误/第一类错误:零假设为真,但检验结果把他拒绝了,这类错误的概率为取伪错误/第二类错误:零假设为假,但检验结果把他接受了2、显著性检验法 通过构造一个统计量,比较该统计量和临界值的大小来判断零假设是否成立 步骤:提出零假设和备则假设 (备则假设分单边和双边,此处只考虑双边情形)根据样本信息,构造统计量Z 此时要确定该统计量服从何种分布,即到底要用哪一个分布来做假设检验确定显著性水平,查对应的概率表得到临界值(此处为双边假设的临界值)比较|z|和临界值的大小。返回 如果是双边假设,当|z|待估参数个数假定7:解释变量 X值有变异性即X有一个相对较大的取值范围如果X只在一个狭窄的范围内变动,则无法充分估计X对被解释变量Y的系统影响。例:如果收入差异不大,我们无法观察支出Y的变动假定8 :如果有多个解释变量,要求解释变量间没有很强的线性关系无多重共线性假定的意义:如果满足这些假定,则高斯-马尔可夫定理成立:在所有线性无偏估计量中,普通最小二乘(OLS)估计量有最小方差。这使得OLS估计量有着优良的性质可以进行统计推断完全满足这些假定的方程在现实中是不存在的,但这些假定为我们提供了一个比较的基准,本课其他部分主要是围绕假定不被满足时,分析后果,提出解决办法2. ols估计量的概率分布 p129假设检验需要指明总体参数(即总体回归系数)的估计量(即样本回归系数)服从何种分布 如同需要指明样本均值服从何种分布,才可对总体均值进行统计推断一样。样本回归系数是Y的线性函数,因此其概率分布取决于Y,而Y的概率分布取决于随机误差项3. 稻草人假设回归分析是要判断解释变量X是否是被解释变量Y的一个显著性的影响因素。在一元线性模型中,就是要判断X是否对Y具有显著的线性性影响。这就需要进行变量的显著性检验计量经计学中,主要是针对变量的参数真值是否为“零”来进行显著性检验的。即 这样的零假设也称为“稻草人假设”,如果稻草人假设成立,说明解释变量X不是被解释变量Y的一个显著性的影响因素4.拟合优度检验P134对样本回归直线与样本观测值之间拟合程度的检验。度量拟合优度的指标:判定系数(可决系数)R2 几个概念:对于所有样本点,则需考虑这些点与样本均值离差的平方和 拟合优度:回归平方和ESS/Y的总离差TSS5. 一些结论:对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间) (1)样本容量n越大,预测精度越高(2)样本容量一定时,置信带的宽度当在X均值处最小,其附近进行预测(插值预测)精度越大;X越远离其均值,置信带越宽,预测可信度下降。(3)样本方差越小,预测精度越高 本章逻辑我们需要进行: 参数显著性检验 拟合优度检验 回归总体线性检验而高斯-马尔科夫定理给出了进行统计检验的信息而高斯-马尔科夫定理的成立需要一些假定条件=猫嘎的分割线=第六章 多元线性回归模型多元回归模型第一节 多元线性回归的模型的表示和基本假定一、一般线性回归模型的基本表示方法函数形式矩阵形式二、偏回归系数三、古典(经典)假定假定1:随机扰动项的零均值假定或假定2:随机扰动项的零均值假定的同方差假定假定3:无自相关假定(多元线性回归模型)假定4、随机扰动项与解释变量不相关(相互独立)或假定5、正态性:随机扰动项服从正态分布 线性回归模型:例:一元线性回归模型:6、无多重共线性,即假定各解释变量之间不存在线性关系(注:多元线性回归模型才有无多重共线性的假定) 该式成立,X至少有K阶子行列式不为零,表明解释变量之间不存在线性相关关系。第二节 多元线性回归的参数的OLS估计及其性质一、参数的 OLS估计 基本思想(原则):寻找实际值与拟合值的离差平方和为最小的回归直线。 例如:多元线性回归模型的“残差平方和”为: 要使“残差平方和”达到最小,其充分条件是即: 化简得正规方程组 二、参数估计量的性质 在满足基本假设的情况下,总体参数b的普通最小二乘估计具有:线性性、无偏性、有效性。 即高斯- 马尔可夫定理一样成立 1、线性性:2、无偏性4、小结:估计量的统计性质3)最小方差性:三、ols估计量的概率分布假设检验需要指明总体参数(即总体回归系数)的估计量(即样本回归系数)服从何种分布。如同需要指明样本均值服从何种分布,才可对总体均值进行统计推断一样。样本回归系数是Y的线性函数,因此其概率分布取决于Y,而Y的概率分布取决于随机误差项。有了样本回归系数的OLS估计量的分布信息,就可以利用它进行总体回归系数的统计推断。1、正态性假定:随机误差项服从正态分布,随机扰动项代表了未引入模型的随机影响之和,依据中心极限定理,大量独立同分布的随机变量之和趋向于正态分布第三节 多元线性回归的统计检验一、拟合优度检验 p1581、多元判定系数R2多元判定系数和一元判定系数的计算方法是一样的:因为判定系数的计算只和被解释变量Y有关,和解释变量X无关。2、调整后的多元判定系数(p165)多元判定系数R2存在一个问题:当解释变量个数增多时候,离差平方和RSS至少不会增大,则多元判定系数R2一般会随着增大解释变量个数增多而增大。1)可决系数随解释变量个数的增加而增大。易造成错觉:要模型拟合得越好,就应增加解释变量。然而增加解释变量会降低自由度,减少可用的样本数。并且有时增加解释变量是不必要的;2)导致解释变量个数不同模型之间对比困难;可决系数只涉及变差,没有考虑自由度。因此在比较同一被解释变量,但又不同个数的解释变量的模型的时候, R2存在不合理的地方调整后的多元判定系数性质二、对回归参数进行假设检验:显著性检验法(p135)多元线性回归的 参数的显著性检验1、同为稻草人假设2、自由度为n-k-1,k为解释变量个数3、得到t值后和临界值比较,当t值大于临界值,则拒绝零假设三、对联合假设的检验(p161)回归方程的显著性检验F检验(检验因变量和诸自变量之间是否存在显著的线性关系)1、检验的假设:3、根据样本数据,计算F统计量的值 变差来源平方和自由度方 差回 归残 差总 变 差拟合优度检验和F检验的对比:1)拟合优度检验和F检验都是对回归方程显著性的检验,都是把总离差TSS分解成回归平方和ESS与残差平方和RSS,并在此基础上构造统计量进行检验。F检验零假设成立等价于判定系数为零2)模型对观测值的拟合程度越高,模型总体线性关系的显著性就越高。3)区别:F检验有精确的分布。第七章 回归方程的函数形式本章示范如何将一些非线性模型转换为线性模型,有何特殊用途。第一节 对数-对数模型用于测量弹性(p181)一、对数-对数模型含义方程两边变量以对数形式出现(注意参数依然是线性的)二、对数-对数模型用于测量弹性1、回顾弹性的含义需求的价格弹性含义:商品价格每变动1%,带来需求量变动的百分比,即两个相对变动的比值2、对对数-对数模型进行全微分我们可以看到此时弹性(,)在模型中作为回归参数,是不变的,所以我们也称双对数模型为固定弹性模型或者不变弹性模型。三、对数-对数模型的假设检验1、视为和普通线性回归相同2、(了解)但是正态性假定发生了变化四、线性模型和双对数模型的比较1、不能单纯根据判定系数或者调整后的判定系数的大小来选择模型注意:只有被解释变量相同的模型,判定系数或 调整后的判定系数的比较才有意义。2 、一元回归可通过观察散点图来选择模型 3 、应从实际出发选择模型, 例如经济理论表明变量间的关系确实是不变弹性的,则选择对数- 对数线性模型。 五、例题:P186,例9-2,C-D生产函数被解释变量:实际GDP解释变量:资本:资本存量劳动投入:就业人数LNY=-1.6524+0.34LNL+0.86LNKT (-2.73) (1.83) (9.06)R2=0.995解释:系数含义:0.34表示为劳动的产出弹性,劳动投入每增加1%,带来产出增加0.34%(纠正书本错误),0.86表示资本的产出弹性,意义类似资本的产出弹性远大于劳动的产出弹性,为资本投入驱动的经济体系规模经济特征:0.34+0.85=1.18,1.181,为规模报酬递增经济R2=0.995,回归拟合程度很高(未报告调整后的R2)返回第二节 半对数模型测度增长率(P188)一、半对数模型含义方程的某一边采用对数形式,另一边为线性形式二、半对数模型测度增长率第三节 其他模型一、双曲线/倒数模型1、定义:2、双曲线函数应用1)当两个参数都大于零时,函数曲线如右图,生产的平均固定成本函数具有此形状。Y: 平均固定成本X: 产量2)当B1 0,B2 0时,函数曲线如右图,恩格尔消费函数具有此形状。Y:在某一商品上的消费支出X:消费者收入3)当B1 0时,函数曲线如右图,菲利普斯函数具有此形状。Y:工资增长率(后来演化为通胀率)X:失业率3、例题 P194,9-6,菲利普斯曲线二、 多项式回归模型1、定义Y=B1 +B2X +B3 X2 +B4X3+多项式回归模型的变量间不存在多重共线性,视同多元线性回归返回2、例题p198 例题9-9三、其他关于过原点回归p199-只有在充分理论保证之下才能使用过原点的回归关于度量单位的说明:p200-所有回归的判定系数相同 -度量单位的变动会带来截距或斜率的不同 Y 单位不变,如果把X 的单位扩大10倍 ,导致X 的数值缩小10倍,为了维持Y不变,斜率需要扩大10倍。第八章 包含虚拟变量的回归第一节 虚拟变量含义 P212一、虚拟变量(dummy variable)对某个定性因素人为赋值,成为能进入模型的变量。 例:解释薪酬差异,设以教育年限X1 、工作经验( 工作年数)X2 ,“ 性别” 三个变量来解释 :对于性别,设置虚拟虚拟变量D:= 0,男性 = 1,女性 Y=b0+b1X1 +b2X2 b3D 当b3能够通过t检验时,说明性别对薪酬有影响,即存在性别歧视 二、方差分析模型(ANOVA)(方差分析模型在其他社会科学中使用较多) :特别的,当回归中解释变量都是虚拟变量时,此类模型称为方差分析模型。P212Y=b0+b1D1+b2D2三、协方差模型(ANCOVA)解释变量有定性变量也有定量变量.(P217)Y=b0+b1 X1 +b 2X2b3 D四、小结 1)虚拟变量是一用以反映质的属性的一个人工变量,通常记为D 。 2)虚拟变量D 只取0 或1 两个值 3)设D=0, 即取值为0 的那一类称为基准类/ 基础类/ 参照类/ 比较类 4)虚拟变量引入模型,可以直接使用OLS,不会带来新的估计问题。第二节 虚拟变量设定一、虚拟变量设置原则1、模型中只有一个两分定性变量p217例如性别定性变量,只有两种分类,引入一个虚拟变量即可,设置虚拟变量D:=0,男性=1,女性不可引入两个虚拟变量,否则引起多重共线性2、模型中一个定性变量,该变量具有多种分类,p218即多分定性变量假定根据横截面数据,我们做个人旅游支出Y对其收入X和学历的回归,学历这个定性变量,可分为:中学以下、中学、大学三个层次,如何设置虚拟变量? 我们有如下选择引入一个虚拟变量DD= 2,大学;=1,中学;=0,中学以下回归方程为:Y=b0+b1 X1 +b2 D引入三个虚拟变量D1=1,大学;=0,其他D2=1,中学;=0,其他D3=1,中学以下;=0,其他回归方程为: Y=b0+b1 X1 +c1D1 +c2 D2+ c3 D3引入二个虚拟变量D1=1,大学;=0,其他D2=1,中学;=0,其他Y=b0+b1 X1 +c1D1 +c2 D2 3、小结一个定性变量如果有m中类型,则应当引入m-1个虚拟变量。-一个2分定性变量只需引入一个虚拟变量,一个有3种类型的定性变量需要引入二个虚拟变量,因为:一个虚拟变量有二个取值, 本身可以代表二个类型。4、模型中有多个定性变量 p221例:性别、种族和教育年限一起解释薪酬这里有两个两分定性变量,肤色和种族可引入两个虚拟变量 例:性别、肤色和工龄、学历(3 种类型)一起解释薪酬 性别、肤色分别引入2 个虚拟变量,学历引入2 个虚拟变量 例题 :P221 10-18:性别、种族对收入的影响 二、虚拟变量进入模型方式1、“加法”方式:Y=b0+b1 X1 +b2 D加法方式意味着引入的虚拟变量或者说定性因素,仅对截距产生影响,对斜率没有影响P217,10-8, 加法方式引入性别虚拟变量意味着隐含一个假定: 男女的性别差异对边际消费倾向没有影响,为b1。 即对斜率没有影响,仅对截距产生影响2、“ 乘法”方式虚拟变量也会对斜率发生影响 Y = b0+(b1b2D)X1 - = b0+b1X1b2DX13、加法方式、乘法方式混合进入模型(P223,比较两个回归)Y= b0+b1X1+ b2 DX1 + b3DP223,比较两个回归得:一致回归:截距和斜率都没有差异平行回归:斜率没有差异,截距不同并发回归:截距没有差异,斜率不同相异回归:截距和斜率都不同4、交互影响(交叉项)(p222)对于方程10-18 ,其样本回归线Y=-0.26-2.36 D2-1.73 D3+0.80X,隐含假定了不同性别下,种族变量对收入的影响是一样的。同样的,不同种族下,性别变量对收入的影响也是相同的。 为了检验两个定性变量的联合影响,引入交叉项: Y=b1+b2 D2 +b 3D3 b4 D2D3 b5 X+u 结果:P222,交互影响之例第三节 虚拟变量技术的特殊应用一、检验模型的结构稳定性利用来自同一个总体的不同的样本数据,估计同一形式的模型,如果估计得到的参数之间存在显著差异,则称模型为不稳定的虚拟变量技术可以用来检验模型稳定性例题:P225例10.4,关于储蓄率的研究二、调整数据的季节波动(P227)许多用月度数据或季度数据表示的经济事件序列数据,呈现出季节变化的规律假期的旅游需求通常需要从时间序列数据将这种季节波动的影响剔除虚拟变量技术可以消除这种季节波动第九章 多重共线性第一节 多重共线性含义及其形成的原因一、完全多重共线性含义 p266对于回归:Y=b0+b1 X1+b2X2+biXi当Xi 和可以表示为其他解释变量之间的线性组合的时候,称为回归存在完全的多重共线性。 当解释变量间存在完全线性关系时,无法获得所有参数的估计值;也就无法进行统计推断。二、不完全多重共线性含义p268对于回归:Y=b0+b1 X1+b2X2+biXi当Xi和其他解释变量之间接近完全线性相关,我们称为回归存在不完全多重共线性。实践中很少碰到完全共线性情形;从现在起,我们所说的多重共线性是指不完全多重共线性。“多重”的含义:不但解释变量和被解释变量间存在线性关系,解释变量间也存在线性关系。三、多重共线性形成的原因(补充)1、经济变量间运动的共同趋势:一些时间序列的经济变量间容易出现同步增长或同步下降的趋势生产函数的回归中,劳动和资本投入是一起增长的,他们之间很容易存在多重共线性2、模型设定原因(略)3、样本资料的原因:例:作电力消费关于收入和住房面积的回归,收入和住房面积间存在高度相关返回第二节 多重共线性的后果 p270一、总述理论后果:注意,即便样本数据中存在多重共线性,ols估计量依然是blue(因为在证明高斯-马尔科夫定理时没有用到无多重共线性假定),但是:1)无偏性是一个重复抽样性质,但在实践中很难得到大量重复样本。 2)虽然依然是ols 估计量具备最小方差性,但该方差绝对数值较大。 3)多重共线性本质上是一个样本回归现象。 非实验得到的经济数据普遍存在多重共线性。 二、完全共线性的后果(补充)1、无法估计参数2、所估计参数的标准差无穷大三、多重共线性(即不完全多重共线性)的后果 p2711、所估计参数的方差和标准误的绝对数值较大,随会着变量间相关程度的增大而快速增大 由于方差变大,我们会得到更宽的置信区间/ 或者更小的t 值(标准差相比数据中不存在多重共线性时增大了) 2、判定系数较高,但t 值并不都是统计显著的 3、可以估计出参数,但换为另一个样本时,参数的估计值会发生很大的变化,即参数估计不稳定Y=145.37-2.7975X2-0.3191X4Y=100.56-2.5164X2-0.1695X44、另外,容易出现回归系数符号和理论不符合的情形第三节 多重共线性的检验多重共线性在经济数据,尤其在时间序列数据中是普遍存在的,只是程度不同,有一些经验法则可以用于多重共线性的检验检验注意:如果回归结果仅用于预测,多重共线性的存在不会影响预测一、R2或者调整后的R2较大, F检验很显著,但显著的t统计量不多,这是多重共线性的典型特征有可能出向F 检验很显著,但每个t 统计量都不显著的情形 二、解释变量间两两高度相关,可以说明存在多重共线性方法:计算线性回归模型中解释变量X2,X3, ,Xk 两两的简单相关系数,得相关系数矩阵(观察两两之间的线性相关性是否密切)。但如果解释变量间相关度不高,并不能肯定不存在多重共线性(因为有可能是复杂的相关)三、偏相关系数检验(略)四、 辅助回归判定系数测度法第四节 多重共线性的修正方法方法:计算模型中每个解释变量Xi 对其余解释变量的辅助回归一、直接删除不重要的变量如果某个变量的引入引起多重共线性,本身不是重要变量,则直接删除这个变量二、获取额外的数据或者新的样本换一批数据,新的数据里面的多重共线性可能并不严重三、重新考虑模型:是否遗漏重要变量变换函数形式:例如将线性回归变换为双对数模型四、利用先验信息 例1 :能源需求 例2 :综合运用横截面数据和时间序列数据 五、变量变换1)把总量指标变为人均指标2)把名义变量变为实际变量3)改用差分形式则模型变为因为经济时序数据中,做了差分的变量,其相关性比原变量的相关性弱,即多重共线性的程度有明显的降低。但变化后的模型中的随机误差项可能出现序列相关(注意:该方法慎用)。 六、逐步回归法首先,用因变量Y对每一个解释变量Xi分别进行回归,从中确定一个基本回归方程。 然后,逐一引入其它解释变量,重新再作回归,逐步扩大模型的规模。引入每个新变量之后,如果1)拟合优度得以改进(提高),而且每个参数统计检验显著,则引入的变量保留;2)拟合优度无明显提高甚至下降,对其它参数无明显影响,则舍弃该变量。 3)拟合优度提高,但方程内其它参数的符号和数值明显变化,可以肯定产生了严重多重共线性。注意:这时对于3), 需考察变量间线性相关的形式和程度,经过经济意义的综合权衡,在线性相关程度最高的两个变量中,略去其中对因变量影响较小,经济意义相对次要的一个,保留影响较大,经济意义相对重要的一个。此时不宜轻率舍去新引入变量,否则会造成模型设定偏误和随机项与解释变量相关的后果。第十章 异方差第一节 异方差的概念和形成原因 p287一、异方差的含义经典线性回归模型的一个假定就是:随机扰动项方差相同二、异方差形成原因:几个例子1、研究储蓄率:Y=b0+b1 X;Y-储蓄,X-个人可支配收入随着人们可支配收入X的提高,个人对于如何支配其收入选择余地增大,所以高收入家庭之间的储蓄行为的差异要比低收入家庭之间储蓄行为的差异来的大p286图13-1b,此种类型的异方差称为递增异方差2、做生产函数回归时,由于规模经济等因素的影响,容易产生异方差3、模型如果遗漏重要变量,也会形成异方差(举例)4、样本数据中出现异常值就产生异方差5、横截面的数据非常容易出现异方差第二节 异方差的后果p290一、OLS估计量在数据存在异方差时依然是线性无偏估计量(回想:证明OLS估计量具有线性、无偏性时没有用到同方差假定,或者说,线性、无偏性和是否同方差无关)二、OLS估计量在数据存在异方差时,不再具有最小方差性,或者说,OLS估计量不再是BLUE。OLS估计量在存在异方差时不再是BLUE注意:第三条是没有考虑到异方差,强行回归三、存在异方差,而忽视异方差,根据常用的OLS估计量方差公式计算得到的方差是有偏的,但是我们无法得知是高估还是低估了估计量的正式方差。五、综上所述:在数据存在异方差的情形下,t检验和F检验的结论不再可靠 例如:OLS 回归得到的t 值比实际上的t 值偏大或者偏小都有可能,我们无法相信t 检验的结果 小结:和多重共线性后果的比较1、样本数据存在多重共线性时的OLS估计量依然是BLUE,但存在异方差时的OLS估计量不再是BLUE2、样本数据存在多重共线性时,OLS估计量的方差随着多重共线性严重程度的增大而快速增大,带来更小的t值,导致参数容易变得不显著;但存在异方差时,是导致更小的t值还是更大t值是不一定的。返回第三节 异方差的检验p292一、残差的图形检验:将残差对其相应的解释变量的观察值描图如果例:对于回归Y=b0+b1 X1+b2X2 ,如果怀疑异方差和X2相关,做残差平方e2和X2的散点图P293,图13-6, X2为X 轴, 残差平方e2 为Y轴的 散点图也可作:Y 为x 轴, 残差平方e2 为Y轴的 散点图)。返回残差散点图例无趋势,满足假定。误差随 的增加而增加000误差呈规律性变化,原因可能是模型不适合,也可能是缺少某些重要值变量0二、PARK检验/帕克检验帕克(Park)检验 先做OLS 回归,不考虑异方差性问题。 从OLS 回归中获得,作下述回归:如果b统计上显著,就表明数据中有异方差性,如果不显著,则可接受同方差假设。三、Glejser/格里瑟检验思路:由于具体的异方差的形式未知 ,用普通最小二乘法的残差的绝对值对各解释变量建立各种回归模型, 检验回归系数是否为零。 Glejser曾提出如下模型形式四、GOLDFELD-QUANDT检验/戈德菲尔德匡特检验适用范围:异方差为递增异方差或递减异方差情形思想:将样本一分为二,分别回归,以此分别构造残差平方和,做F检验,考察这两个子样本的方差是否相同。步骤:例:对于回归Y=b0+b1 X1+b2X2 ,如果怀疑异方差和X2相关,且为递增或递减异方差1、排序:将样本按X2大小自小到大排序2、挖去中间c项观测值,构造两个子样本,两个子样本容量都为(n-c)/2五、怀特(White)检验 怀特检验不需要排序,且适合任何形式的异方差。 怀特检验的基本思想与步骤(以二元为例):然后做如下辅助回归 可以证明,在同方差假设下:(*) R2为(*)的可决系数,h为(*)式解释变量的个数,表示渐近服从某分布。第四节 存在异方差时的补救措施一、加权最小二乘法(WEIGHTED LS,WLS)二、模型变换法模型变换法是对存在异方差的总体回归模型作适当的代数变换,使之成为满足同方差假定的模型 , 进而运用OLS方法估计参数。通过对具体经济问题的经验分析,事先对异方差给出合理的假设原模型变换法的过程, 则对原模型进行变换,即用 去乘以模型的两边,变换后的模型具有同方差性。三、“一般解决法”(模型的对数变换)Log 10=1Log 100=2Log 1000=3在计量经济学实践中,计量经济学家偏爱使用对数变换解决问题,往往一开始就把数据化为对数形式,再用对数形式数据来构成模型,进行回归估计与分析。 因为:对数形式可以减少异方差和自相关的程度。 对数变换的效果减少差异第十一章 自相关第一节 自相关的定义和形成原因P243-246一、自相关的含义经典线性回归模型的一个假定是无自相关,即随机扰动项之间不存在相关关系自相关:随机扰动项之间存在相关关系,即随机扰动项之间相互影响理解自相关含义:二个例子1)产出对于资本和劳动投入的回归中如果某个季度发生了罢工,影响了当季产出,并且如果这个季度的罢工这个随机扰动,影响了下一季度的产出,这就被称为自相关:两个季度的产出的波动有相关性2)分析家庭支出和家庭收入关系的横截面数据时: 一个家
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 咨询工程师考试黑钻押题及完整答案详解【名校卷】
- 中级银行从业资格之中级银行业法律法规与综合能力能力测试备考题及完整答案详解(网校专用)
- 软件定义网络-第7篇-洞察及研究
- 重难点解析京改版数学9年级上册期末试题附答案详解【培优】
- 咨询工程师全真模拟模拟题【网校专用】附答案详解
- 自考公共课题库试题【夺冠系列】附答案详解
- 财富管理行业客户需求与服务升级对财富管理行业的启示与建议报告
- 中级银行从业资格之中级银行业法律法规与综合能力预测复习(考试直接用)附答案详解
- 环保公司成本核算管理细则
- 环保公司公证办理管理规定
- 2025年中国智慧养殖行业市场占有率及投资前景预测分析报告
- 电影院安全生产与安全管理规定制度
- 废气处理合同协议
- 镁铝合金行业前景
- 2025-2030中国余热回收行业市场现状供需分析及投资评估规划分析研究报告
- 无人机物流配送服务手册
- 见证取样送检计划方案
- 二年级上册语文课内阅读理解每日一练(含答案)
- 2025-2030年中国功率器件市场发展趋势规划研究报告
- 基层管理培训课程
- 宇宙飞船的发射与回收技术分析
评论
0/150
提交评论