版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2021-9-28金融与统计学院3一、虚拟变量基本含义一、虚拟变量基本含义(dummy variable)虚拟变量又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。 现实的经济活动中,影响应变量的因素除可以直接获得实际观测数据的定量变量外,还包括一些定性(属性)因素。许多经济变量能够定量度量,如:商品需求量、价格、收入、产量等。有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮
2、)销售的影响等等。为了在模型中反映这些定性因素的影响,提高模型的精度,需要将它们“量化”这种“量化”通常通过引入“虚拟变量”来完成。根据这些因素的属性类型,构造只取“0”或“1”的人工变量虚拟变量(Dummy Variables),记为D。例如,反映文程度的虚拟变量可取为例如,反映文程度的虚拟变量可取为:一般地,在虚拟变量的设置中:基础类型、肯定类型取值为1;比较类型,否定类型取值为0。虚拟变量的作用:定性因素定量化非本科本科01D2021-9-28金融与统计学院6二、虚拟变量的设置原则二、虚拟变量的设置原则每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果有m个定性变量,只在模
3、型中引入m-1个虚拟变量。 例:已知冷饮的销售量Y除受k种定量变量的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可: 则冷饮销售量的模型为: 在上述模型中,若再引入第四个虚拟变量 则冷饮销售模型变量为:其它秋季其它夏季其它春季010101321iiiDDD其它冬季014iDiiiikikiiDDDXXY332211110 此时,引入了四个虚拟变量,将会陷入虚拟变量陷阱,产生完全多重共线性问题。iiiiikikiiDDDDXXY44332211110不指定其虚拟变量的那一组称为基组、基准、控制组、比较组、参照组或者省略组。基准组的选择取决于研究者的选择,或
4、者所研究问题的特殊性。所有其它组都与基组进行比较。2021-9-28金融与统计学院9分离异常因素的影响。分离异常因素的影响。例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。 检验不同属性类型对因变量的作用。检验不同属性类型对因变量的作用。例如工资模型中的文化程度、季节对销售额的影响。 提高模型的精度。提高模型的精度。相当于将不同属性的样本合并,扩大了样本容量(增加了误差自由度,从而降低了误差方差) 三、虚拟变量的作用三、虚拟变量的作用2021-9-28金融与统计学院11加法方式加法方式在所设定的计量经济模型中,根据问题中定性变量的影响作用,按
5、照虚拟变量设置规则,直接加入适当的虚拟解释变量,此时,虚拟解释变量与其他解释变量是相加关系。加法形式引入虚拟解释变量,作用在于改变模型的截距水平。加法方式引入虚拟解释变量的基本假设:定性解释变量对于应变量的影响,仅体现在不同属性(类型)回归模型的截距项,即仅影响不同属性模型的平均水平,而不影响不同属性模型的相对变化。只有一个定性解释变量(方差分析模型);一个定量解释变量和一个两种属性定性解释变量;一个定量解释变量和一个两种以上属性定性解释变量;一个定量解释变量和两个定性解释变量的计量经济模型。只有一个定性解释变量(方差分析模型) 如居民年可支配收入模型: 模型的含义在于,在其他因素不变的条件下
6、,男性与女性的年可支配收入是否存在差别。代表女性。代表男性,为虚拟变量,。为居民的年可支配收入其中,01iiiiiiiDDDYDY)0|() 1|(iiiiiDYEDYE:女性年平均可支配收入:男性年平均可支配收入满足古典假设时,有:当误差项。于改变模型的截距水平虚拟解释变量的作用在,支配收入的部分。因此入不同于女性年平均可支配收则代表了男性年平均可配收入,而系数支代表了女性的年平均可因而,模型的截距项一个定量解释变量和一个两种属性定性解释变量 如:职工薪资模型 该模型中,假定误差项满足古典假设,则女性。代表代表男性,表性别为虚拟解释变量代代表工作年限,代表职员的年薪水,其中,01210iii
7、iiiiiiDDDXYDXYXDXYEXDXYEiiiiiii10120)0,|()() 1,|(女职员的薪水为:男职员的薪水为:存在显著差异。员的平均薪金水平是否行检验,以判断男女职的统计显著性进验对可以通过传统的回归检。的平均薪水水平相差的变化率一样,但两者工平均薪水对工作年限同的截距。即,男女职斜率,但有不,则两个函数有相同的假设2220 年 薪Y 男 职 工 女 职 工 工 龄X一个定量解释变量和一个两种以上属性定性解释变量 如,在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中,大学及其以上。模型设定为为虚拟解释变量。代表个人收入,代
8、表个人保健支出,其中,DXYDDXYiiiiiii231210其他大学及以上其他高中01D01D21iiiiiiiiiXDDXYEXDDXYEXDDXYE13021120211021) 1, 0,|()0, 1,|()0, 0,|(大学及以上:高中:高中以下:人保健支出函数为:学及以上教育水平下个以下、高中、大满足古典假设时,高中随机误差项何意义如图:,则上述三个函数的几假定23 大学及以上 保健 高中 支出 高中以下 收入一个定量解释变量和两个定性解释变量的计量经济模型 如,考虑性别和学历的职工薪资模型。本科以下学历。,表本科及以上学历男性代变量:(表学历)为虚拟解释代表女性;代表男性,量:
9、表性别)为虚拟解释变(代表工作年限,代表职员的年薪水,其中,0101111231210222iiiiiDDDDDDXYDDXY 于是,不同性别、不同学历职工的平均薪金分别为:i32iii3iii2iiiiiX)1D, 1D,X|Y(EX)1D,0D,X|Y(EX)D, 1D,X|Y(EX)D,D,X|Y(E1021102110211021000)(平均薪水:男职工本科以上学历的)(平均薪水:女职工本科以上学历的)(平均薪水:男职工本科以下学历的平均薪水:女职工本科以下学历的结论:通过对前述模型进行扩展,可以推广到多个定量解释变量和多个定性解释变量(两个或两个以上属性)的情形。2021-9-28
10、金融与统计学院21乘法方式乘法方式加法方式引入虚拟变量,考察模型截距的截距的不同。而在不同。而在许多情况下,往往是斜率有变化,或斜率、截距同时发生变化或斜率、截距同时发生变化。斜率的变化可通过以乘法的方式引入虚拟斜率的变化可通过以乘法的方式引入虚拟变量变量:所设定的计量经济模型中,将虚拟解释变量与其他解释变量相乘作为新解释变量,以达到调整设定模型斜率系数的目的。作用:结构变化检验、交互效应分析、分段线性回归回归模型的比较结构变化检验、邹至庄检验(Chow Test)例:研究改革开放前后居民储蓄收入总量关系时(1950-2008),设定模型:改革开放以后。代表代表改革开放以前,拟解释变量:为虚代
11、表收入总额,代表储蓄总额,其中,)()(10*111131210DDDXYXDDXYiiiiii的关系为:储蓄和收入满足古典假设时,得到当随机误差项i后发生变化。改革开放前收入总量关系是否在可以判定储蓄的显著性,和)中回归系数通过检验回归模型(成为斜率差异系数。成为截距差异系数,其中,)(以前:)()()(以后:323210131201*, 0|, 1|iiiiiiXXDYEXXDYE交互效应分析 考虑服装年支出费用模型:代表本科以下学历。以上学历,代表本科及为虚拟解释变量:表男性;代代表女性,为虚拟解释变量:代表年收入,代表服装年支出费用,其中,)(010114321022211iiii21
12、21iDDDDDDXY*XDDDDYiiiiiiiiiiiiiXX,D,D|YEXX,D,D|YEXX,D,D|YEXX,D,D|YE40214102142021432102100011011)(男性本科以下:)()(女性本科以下:)()(男性本科及以上:)()(女性本科及以上:满足古典假设时,得到当随机误差项效应是否存在。性检验,可以判断交互的显著释变量系数借助于交互效应虚拟解的交互效应系数。异系数,成为本科女性服装年均支出的截距差为本科及以上女性群体数;年均支出的截距差异系为本科及以上群体服装出的截距差异系数;为女性群体服装年均支其中:3321 因此,设定计量经济模型时,不能忽视统因此,设
13、定计量经济模型时,不能忽视统计显著的交互效应变量,否则将会导致模计显著的交互效应变量,否则将会导致模型的设定偏差。型的设定偏差。分段线性回归 如,某公司为了激励销售人员,按其销售额计提奖励:当销售额在某一目标水平以上或以下时,计提奖励的方法不同。假设:当销售额低于给定的目标水平时,计提的奖励额与销售额呈线性关系;当销售额等于或高于目标水平时,计提的奖励额与销售额呈线性关系,但线性关系更陡峭。建立模型为:。时,;时,变量:为虚拟额。为事先确定的目标销售为销售额,为奖励额度,其中,)()(01*210iiiiiiiiiiiiiiiiDXXDXXDXXYXXDXY*iXXY变”。出是否存在“突界水平
14、就可判断在所设定的临的统计显著性,)中(只要利用样本数据检验)()()(:销售额不低于)(:销售额低于满足古典假设时,有:当随机误差项*ii*iiiii*iiiii*iiX*XXY1D,X|YEXXD,X|YEX221201002021-9-28金融与统计学院29结 论如果要描述各种类型模型在截距水平上的差如果要描述各种类型模型在截距水平上的差异,则可用加法方式引入虚拟解释变量;异,则可用加法方式引入虚拟解释变量;如果要描述各种类型模型在斜率水平上的差如果要描述各种类型模型在斜率水平上的差异,则可用乘法方式引入虚拟解释变量。异,则可用乘法方式引入虚拟解释变量。虚拟解释变量只是简单指出在其它解释
15、变量虚拟解释变量只是简单指出在其它解释变量不变时,被解释变量可能存在的差异,但不不变时,被解释变量可能存在的差异,但不能给出导致差异存在的原因。能给出导致差异存在的原因。一个人或者在劳动力行列中或者不在,从一个人或者在劳动力行列中或者不在,从而劳动力参与这个应变量只能取两个值:而劳动力参与这个应变量只能取两个值:如果这个人在劳动力行列中,则取值如果这个人在劳动力行列中,则取值1 1;如果不在其中则取值如果不在其中则取值0 0。考察学院教授是不是属于工会成员,则工考察学院教授是不是属于工会成员,则工会会员资格这个应变量就是一个取值会会员资格这个应变量就是一个取值0 0或或1 1的虚拟变量:的虚拟
16、变量:0 0表示非工会会员,表示非工会会员,1 1表示工表示工会会员。会会员。这些例子的一个特性是,应变量属于仅这些例子的一个特性是,应变量属于仅要求回答是或否这样一种类型;就是说要求回答是或否这样一种类型;就是说它是二分类的。处理二分类变量有四种它是二分类的。处理二分类变量有四种模型:模型:线性概率模型(线性概率模型(Linear Probability Linear Probability ModelModel)对数单位模型(对数单位模型(Logit ModelLogit Model)概率单位模型(概率单位模型(Probit ModelProbit Model)托比单位模型(托比单位模型(
17、Tobit ModelTobit Model)虚拟被解释变量(响应变量)不仅仅局虚拟被解释变量(响应变量)不仅仅局限于是或否的二分类型。限于是或否的二分类型。2021-9-28金融与统计学院33一、线性概率模型为了建立概念,构造如下模型:该模型把二分变量Y表达为解释变量X的函数。像(*)这样的模型称为线性概率模型。表示家庭年收入该家庭不拥有住房该家庭拥有住房其中,iiiiiX01Y(*)XY10因为,Y在给定X下的条件期望可解释为在给定X下事件(家庭拥有住宅)将发生的条件概率,即(*)X)X|Y(E)(E)X|Y(Piiiiii1001,则有假定模型(*)的条件期望事实上可解释为Y的条件概率。
18、条件概率必须落在0与1之间。iiiiiiiiiiiiPX)X|Y(E*)*(*P)P1(P)Y(E0YP1YP10011)两式,有)和(比较(有则由数学期望的定义,概率”(即事件不发生)的“率”(即事件发生)的概“令线形概率模型的估计将会面临三个问题:1、误差项非正态性;2、误差项的异方差性;4、可疑的拟合优度系数不成立。、103)X|Y(Eii1 1、误差项非正态性、误差项非正态性 为了统计推断的目的我们假设误差项服为了统计推断的目的我们假设误差项服从正态分布,但在线性概率模型中误差项从正态分布,但在线性概率模型中误差项干扰的正态性不成立,而是服从两点分布。干扰的正态性不成立,而是服从两点分
19、布。因为因为iiiiiiiiiXYXYXY101010011时,时,有对参数估计不会有很大影响,OLS估计量为无偏估计量。随样本容量的增大,OLS点估计量的概率分布趋近于正态分布。因此,可以直接对线性概率模型进行OLS估计。2 2、干扰项的异方差性、干扰项的异方差性 (* * * * *)式表明误差项的方差具有异方)式表明误差项的方差具有异方差性差性)(则,概率为时,概率为时,*)1 ()(,1011101010iiiiiiiiiiiiiiPPVarPXYPXYXY解决异方差问题的一个方法是进行数据变解决异方差问题的一个方法是进行数据变换,将模型(换,将模型(* *)两边除以)两边除以*)*(
20、*1)1 ()|(1)|(10iiiiiiiiiiiiiiwwXwwYwPPXYEXYE即(* * * * * *)中的误差项为同方差,但权数)中的误差项为同方差,但权数w w是未知的。为了估计是未知的。为了估计w w,可采用两步法:,可采用两步法:模型的参数。回归,得到原线性概率行)做数据变换,然后进对(、用;回归,得到)进行、对(OLS*w 2)Y(Yw OLS*iiii113、 不被满足0(/)1iiE YX0Y1Y10Y)X|Y(Eiiiii时取时取法为:之间。解决办和不一定在的估计值114、可疑的拟合优度系数定性响应回归模型中,决定系数大多位于0.2至0.6之间,仅有少数情况时会比较
21、高。因此:在定性因变量的模型中应避免使用决定系数作为一种摘要统计量。2021-9-28金融与统计学院43线性概率模型在逻辑上不是一个很有吸引力的模型,因为它假定:概率P是X的线性函数,随着X的变化,即X对P的边际或增补效应一直保持不变,而无论X的变化在何种水平上发生。这显然不现实。因此,需要的是具有如下二分性质的模型:二、Logit模型(Logistic regression)概率P随X变化而变化,但不超出0-1范围;P和X之间是非线性的,即:随着X变小,概率P趋于零的速度越来越慢;随着X增大,概率P趋于1的速度也越来越慢。因此,我们将讨论满足这些条件的对数单位模型(Logit Model)和
22、概率单位模型(Probit Model)。2021-9-28金融与统计学院45解释住房所有权对收入的线性关系时的线性概率模型曾是:其中,其中X为收入,而Y1表示家庭拥有住房,但现在考虑如下住房所有权的表达式: :其中,iiiiPXXYE10)| 1()(*1111)| 1()(10iiZXiieeXYEPiiXZ102021-9-28金融与统计学院46方程(*)代表一个(累积)逻辑斯蒂分布函数为名的模型。估计时,需要将(*)化为线性形式进行估计。)满足前述的两点要求因此,方程(只见为非线性关系。与)且;变化到从,变化到从)随着该模型中*XP210PX1iiii2021-9-28金融与统计学院4
23、7拥有住房的概率为P,则不拥有住房的概率为1-P:)()两边取对数,得()(进一步地,*XZPPLnL*eeePPee)X|Y(EPiiiiZZZiiZZiiiiiii1011111111111012021-9-28金融与统计学院48(*)中,P/(1-P)称为机会比率,即所研究事件(属性)“发生”(或“具有”)与“没有发生”(或“不具有”)的概率之比(一个家庭将拥有住房的概率对不拥有住房的概率之比。)(*)中,机会比率的对数L不仅对X为线性,而且对参数也是线性。L被称为对数单位模型(Logit Model)。2021-9-28金融与统计学院49对数单位模型的特点概率。,而是拥有住房本身的利于
24、拥有住房的机会比不是有水平,我们向估计的并)对于给定的某一收入值的大小;时测度了当)截距比如何变化;机会利于拥有住房的对数着收入变化一单位,有的变化,即随每单位变化导致的给出)斜率系数本身并不是;为线性,但概率对)的限制;,不受变到从,变到从)5LX4LX3PXL210L10P0011把对数单位模型写成如下形式:如果对这个模型用微观数据或个体数据直接估计会遇到一些问题,例如当P=1或P=0时,L取不到有意义的值,在这种情形下只有用最大似然估计求解(Eviews、Minitab等软件有固定的过程完成)。另外一种估计方法,当我们拥有的数据如下表所示时可以用OLS求解。)(*XZPPLnLiiiii
25、101右表是家庭收入、对应的家庭总数和拥有住房的家庭数量表:XNn6408850121060181380281510045207036256539305033354030402520根据上表计算出对应每个收入水平,拥有住房的概率值根据估计的P可以得到估计的对数单位线性模型。iiiNnP)(*XPPLnLiiii101不能用OLS直接估计(*),因为随机误差项的性质还没考虑。随机误差项的满足如下分布:模型存在异方差。考虑使用加权最小二乘法,权重为:)P(PN,Niiii11021iiiiiii)P(PN,PP112得到:代替用2021-9-28金融与统计学院54估计对数单位模型的步骤:1 1、对
26、每一收入水平,计算拥有住房的概率、对每一收入水平,计算拥有住房的概率。2 2、求每一的对数单位、求每一的对数单位3 3、作如下变换、作如下变换消除异方差,其中。消除异方差,其中。4 4、OLSOLS估计上式。估计上式。5 5、按普通最小二乘法建立置信区间和假设检验。、按普通最小二乘法建立置信区间和假设检验。iXiiiPn N12iiiiiiiw Lww Xw ulniL /(1iP)iPiXiiiwN P(1)iP2021-9-28金融与统计学院55三、Probit模型为了解释二分应变量,有必要使用适当CDF。对数单位模型使用的是累积逻辑斯蒂函数,实际应用中发现正态CDF效果也不错。使用正态C
27、DF的估计模型通常称为概率单位模型。引入概率单位模型有两种途径:一是模仿前面逻辑斯蒂函数的形式,直接用正态分布函数替换;二是依据麦克法登(2000年诺贝尔经济学奖年诺贝尔经济学奖)的效用理论或行为的理性选择引入概率单位模型。2021-9-28金融与统计学院56下面根据效用理论或行为的合理性来阐明使用概率单位模型的动机。I表示一种不可观测的效用指数,X表示收入,仍然研究家庭拥有住房的概率。则不可观测的效用函数表示为:当效用指数I越大时,家庭拥有住房的概率越大。)(*XIiii10假定:),(Nt*dtedte)I(F)II(P)Y(PPIIIIIIiiXtItii*ii*i*i*i*i10212
28、11102222其中,)(的概率为:即件下,家庭拥有住房,服从正态分布的假定条在住房。有住房;否则,不拥有时,该家庭拥,当界值存在一个效用指数的临( )iiPF I12iiIX1iP*Pr()iiII( )iiPF I1( )iiIFP1iP(a)(b)根据(*)可以得到:。和估计出,然后采用计算出由后的调查数据,便可以如果我们有经过分组以101011OLSIPX)P(F)I(FIiiiiii概率单位模型的估计步骤:无多大价值。样本下有效,同时,在大检验,但得到的结果只)用普通方式进行假设;和估计出最后结果数据转换或用要进行存在异方差性,因而需)由于随机误差项作为应变量的观测值;)用;表中得到
29、,从标准正态分布函数)根据;从分组数据中计算出21R5WLS4I3IP2P)i0iiiii2021-9-28金融与统计学院61对数单位模型与概率单位模型比较对数单位模型与概率单位模型比较虽然对数单位模型和概率单位模型给出性质相同的结果,但是两个模型参数的估计值不可直接比较。一般两者参数有如下关系:LPM的系数与对数单位模型的系数有如下关系:probititlog.6250含有截距项不含截距项25. 0.itlogLPMitlogLPM2502502021-9-28金融与统计学院62实际应用中,大多选用Logit模型(对数单位模型)。2021-9-28金融与统计学院63四、Tobit Model
30、(Tobins probit)Tobit模型是Probit模型的拓展Tobit是经济学家、1981年诺贝尔经济学奖获得者J托宾(James. Tobin) 1958年在研究耐用消费品需求时首先提出的一个经济计量学模型。Tobit模型的一个重要特征是,解释变量Xi 是可观测的(即Xi 取实际观测值),而被解释变量Yi只能以受限制的方式被观测到, 即观察到的Yi 取值被限制在一定范围内, 具体来讲“无限制”观测值均取实际的观测值,“受限”观测值均截取为某一特定值。2021-9-28金融与统计学院65测量误差测量误差应变量存在观测误差应变量存在观测误差自变量存在观测误差自变量存在观测误差参数估计值是
31、无偏的,但非有效出现随机解释变量。参数估计有偏、非有效、非一致。2021-9-28金融与统计学院66一、应变量中的观测误差11101010)(E*XXY*YYYYXY*XYiiiiiiii*iii*ii*iii*i典假设,有由于随机误差项满足经)()()()变成于是,原模型(代替:观测变量不可直接观察,可利用由于表示当前收入。表示永久性消费支出,其中)(对模型:2021-9-28金融与统计学院67因此,虽然应变量中的测量误差不影响参数估计及其方差的无偏性,但这时所估计的方差,要大于没有测量误差时的方差。22222i1i11x)(Var*x)(Var*)中:模型()中:模型(的方差也不相同:差不
32、同,但由于两个模型的标准2021-9-28金融与统计学院68二、解释变量X中的观测误差)()()()变为:则模型(代替:不可观测,因而用由于表示永久收入。表示当前消费支出,其中,)(假定模型是:*zXwXwXY*wXXXXXY*XYiiiiiiiiii*iii*i*iii*ii1011010102021-9-28金融与统计学院69去意义。将使得对参数的估计失相关的后果极其严重,与)()()(),()()()()(不相关,因为:与假定不相关。但不能且与为零均值、序列独立,假定iiwiiiiiiiiiiiiiiiiiiXzwwEXEXEzEzEXzCovwEzEE,wEXzw00002111202
33、1-9-28金融与统计学院70进一步讨论发现因此,当测量误差出现在解释变量中时,参数的一致性估计成为不可能。都是有偏估计。即使样本容量再大,1221111limpXw2021-9-28金融与统计学院71三、测量误差存在性的检验豪斯曼检验(Hausman Test):先对原方程进行回归,讨论分析;当怀疑某一自变量X有测量误差时,找出该变量的工具变量Z,将该自变量关于其工具变量回归,求出其残差序列( sed_X );将该残差变量加入原回归模型的自变量中,重新做回归,对残差变量sed_X的系数进行t检验;原假设为H0:X不存在测量误差,作出X有无测量误差的判断。2021-9-28金融与统计学院73一
34、、计量经济建模的传统观点被称为平均经济回归(AER)建模思想是:从含有一定个数的回归元的一个模型开始,经过诊断,然后把越来越多的变量加到模型中来。(从简单到复杂)韩德瑞(D.F.Hendry)的建模思想是由一般到简单,即由尽可能多变量进行约化,直到最后几个能通过检验的变量。(从一般到简单)2021-9-28金融与统计学院74好模型的判断标准(AER方法):节省性;以实用为标准,模型尽可能简单节省性;以实用为标准,模型尽可能简单识别性;识别性;同一参数必须有一个确定的估计值同一参数必须有一个确定的估计值拟合优度;拟合优度;拟合优度是评价模型好坏的标准之一拟合优度是评价模型好坏的标准之一理论一致性
35、;正确的系数符号,以保证模型能给出理论一致性;正确的系数符号,以保证模型能给出合理的经济意义上的解释。合理的经济意义上的解释。预测功效。预测是计量经济模型一个很重要的功能预测功效。预测是计量经济模型一个很重要的功能。2021-9-28金融与统计学院75二、设定误差的类型漏掉相关变量包含无关变量错误的函数形式2021-9-28金融与统计学院764i4iii4i4iiiiiiiiiiiiiiiiXvvXXXXYXvvXXYXXXY此时的误差项)包含无关变量:此时的误差项)漏掉相关变量。假设真实的函数为:以立方总成本函数为例332210332210332210212021-9-28金融与统计学院77
36、iiiiiXXXYln3332210)错误的函数形式:2021-9-28金融与统计学院78三、设定误差的后果漏掉相关变量包含无关变量2021-9-28金融与统计学院79漏掉相关变量110010102110222110)(、)(本容量多大,都有:非一致估计。即无论样的有偏、是、相关,则与)如果(则其后果为:而用如下模型拟合:掉但实际研究过程中,漏假设真实模型是:EEXX1vXYXXXY1iiiiiii2021-9-28金融与统计学院80检验失效。正确结论,即估计量的检验无法得到法正确估计,导致参数)随机误差项的方差无(方差的有偏估计;的方差是)(仍然是有偏的;不相关,此时与)即使(t43XX21
37、10212021-9-28金融与统计学院81包含无关变量不是有效估计量;)(的无偏的;、是、估计量)参数的(则其后果为:而用如下模型拟合:加一个无关的解释变量但实际研究过程中,增假设真实模型是:110102211021102OLS1vXXYXXYiiiiiii2021-9-28金融与统计学院82两种设定误差的后果比较遗漏有关变量。遗漏有关变量。参数估计量有偏非一致,参数估计量有偏非一致,随机误差项的方差估计亦不正确,致使区随机误差项的方差估计亦不正确,致使区间估计和假设检验都得不到正确的结论。间估计和假设检验都得不到正确的结论。包含无关变量。包含无关变量。参数估计量无偏且一致,参数估计量无偏且
38、一致,随机误差项的方差估计量为非有效的估计随机误差项的方差估计量为非有效的估计量,参数的统计推断精度降低。量,参数的统计推断精度降低。因此,不能简单认为与其略掉有关变量不因此,不能简单认为与其略掉有关变量不如含有无关变量。如含有无关变量。2021-9-28金融与统计学院83四、设定误差的检验对多余变量的侦查名义与真实的显著水平对遗漏变量和不正确的函数形式的检验2021-9-28金融与统计学院84侦查多余变量依据。的取舍是否有理论上的些变量在模型中,而不考虑这型之外,显著的就包含除在模验不显著的变量都被排这样意味着凡是参数检检验来建立模型。因为和用但是,切记不可反复使检验。是否成立,可使用验是否
39、应属于模型,即检和)要检验的显著性;)检验检验(接用是否应属于模型,可直)要检验某个变量对于模型:FtFXX2)(setX1XXXYhkhkkkkkiiiii033221102021-9-28金融与统计学院85对遗漏变量和不正确函数形式的检验的残差图为:则使用如下数据,得到)(或者用线性函数拟合:)(如果用二次函数拟合:)(的总成本函数为:、残差分析:假设真实aXYbXXYcXXXYiiiiiiiiiiii10221033221012021-9-28金融与统计学院86产出Y总成本X119322263240424452576260727482979350104202021-9-28金融与统计学院87图形表明,如果模型遗漏了相关变量或者设定了错误的函数形式,则其残差图必定会呈现明显的样式。2021-9-28金融与统计学院882、DW检验从假定的模型求得从假定的模型求得OLS残差;残差;如果认为假定模型中遗漏了自变量(如果认为假定模型中遗漏了自变量(Z),则将残则将残差按差按Z递增排列;递增排列;从这样排列的残差计算从这样排列的残差计算d统计量;统计量;查查DW表:如果表:如果d值显著,即可接受模型误设的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026江西南昌市社会福利院招聘备考题库含答案详解(满分必刷)
- 2026安徽芜湖无为市人才发展有限责任公司代无为市城控集团招聘2人备考题库含答案详解ab卷
- 结核菌素作用机制的分子与细胞学研究
- 2026中国科大图书馆劳务派遣岗位招聘2人备考题库【历年真题】附答案详解
- 2026重庆市万州区沙河街道办事处公益性岗位招聘1人备考题库附答案详解【巩固】
- 2026春季河北邯郸市教育局市直学校选聘博硕人才300人备考题库及参考答案详解(完整版)
- 2026广西北海市第二中学(北京八中北海分校)临聘教师招聘2人备考题库附答案详解【黄金题型】
- 纸基包装研发趋势
- 2026江苏无锡鑫山北投资管理有限公司招聘2人备考题库带答案详解(轻巧夺冠)
- 2026浙江宁波报业传媒集团有限公司招聘编辑1人备考题库附答案详解(巩固)
- 癫痫预测模型的泛化能力提升策略研究
- 小学统计与概率培训课件
- 2026届陕西省高三二模高考数学模拟试卷试题(含答案详解)
- 2025年保密知识测试试题库及答案
- 知情同意与拒绝治疗
- 【2025年】军事知识竞赛题库及答案
- 血液透析患者的血压管理
- 中国2型糖尿病防治指南(2024年版)解读
- 2025年西藏自治区中考地理试卷(含答案)
- 2025年福建法院书记员面试题(含答案)
- 2026年政治一轮复习备考策略分享
评论
0/150
提交评论