




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第五讲内生性内生性产生的原因及解决方案OLS经典假设
所有的解释变量Xi与随机误差项彼此之间不相关。若解释变量Xi和ui相关,则OLS估计量是非一致的,也就是即使当样本容量很大时,OLS估计量也不会接近回归系数的真值。当解释变量和随机误差项相关时,模型存在着内生性问题。内生性产生的原因及解决方案在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”。这与一般经济学理论中的定义有所不同。1。与误差项相关的变量称为内生变量(endogenousvariable)。2。与误差项不相关的变量称为外生变量(exogenousvariable)。内生性产生的原因及解决方案造成误差项与回归变量相关(内生性)的原因很多,但我们主要考虑如下几个方面:遗漏变量偏差变量有测量误差双向因果关系。内生性产生的原因及解决方案遗漏变量偏差内生性产生的原因及解决方案内生性产生的原因及解决方案变量有测量误差测量数据正确时:假设方程为:当存在测量误差时:方程为:所以我们有:内生性产生的原因及解决方案可知,误差项中包含所以可以得到:如果则回归结果有偏,非一致我们假设则有内生性产生的原因及解决方案结论:1。由于2。回归的性质决定于w的标准差内生性产生的原因及解决方案双向因果关系之前我们假定因果关系是从回归变量到因变量的(X导致了Y)。但如果因果关系同时也是从因变量到一个或多个回归变量(Y导致了X)的呢?如果是这样的话,因果关系是向前的也是“向后”的,即存在双向因果关系,如果存在双向因果关系,则OLS回归中同时包含了这两个效应,因此OLS估计量是有偏的、非一致的。内生性产生的原因及解决方案可以推导出:内生性产生的原因及解决方案检验方法:豪斯曼检验检验豪斯曼检验(Hausmanspecificationtest)H0:所有解释变量均为外生变量。H1:至少有一个解释变量为内生变量。
quietlyreglw80s80expr80tenure80iqeststoreolsquietlyivregress2slslw80expr80tenure80(s80iq=medkwwmrtage)eststoreivhausmanivols,若Hausman检验失效(检验统计量为负值),则使用dmexogxt,否则仍Hausman检验为主。内生性产生的原因及解决方案使用Davidson-MacKinnon检验xtivreg后使用dmexogxt*Davidson-MacKinnon(1993)检验
*H0:OLS和xtivreg都是一致的,即内生性问题对OLS的估计结果影响不大
xtivregtlsizendtstang(npr=tobinL1.npr),fe
dmexogxt
Davidson-MacKinnon检验得到F统计量的P值小于0.05,代表有内生性内生性产生的原因及解决方案遗漏变量偏差可采用在多元回归中加入遗漏变量的方法加以解决,但前提是只有当你有遗漏变量数据时上述方法才可行。双向因果关系偏差是指如果有时因果关系是从X到Y又从Y到X时,此时仅用多元回归无法消除这一偏差。同样,变量有测量误差也无法用我们前面学过的方法解决。因此我们就必须寻找一种新的方法。内生性产生的原因及解决方案二、内生性的解决方案
事实上,仅仅为了解决内生性问题,并不需要我们对内生性问题的缘起有很深入的理解。对于应用型的实证研究而言,我们只需要掌握解决内生性问题的具体方案即可。内生性问题的解决方案一共四种,理论上来讲,这四种方案应对内生性问题都很有效。但于我个人而言,我对四种方法的评价是有高低的,由高到低分别介绍如下。
内生性产生的原因及解决方案1.自然实验法所谓自然实验,就是发生了某些外部突发事件,使得研究对象仿佛被随机分成了实验组或控制组。这是我最喜欢的方法,只是自然实验需要寻找一个事件,并且这个事件只影响解释变量而不影响被解释变量。遇着这种事件是一种缘分,还要能识别出来,这对学者的眼光也是一种挑战。有很多文章声称使用了自然实验,但严格来讲,并没有做到对研究对象进行了随机分组。虽然如此,我对此类文章仍然很是喜欢。
内生性产生的原因及解决方案自然实验包括的要素有:一个政策措施(treatment),一个观察到的结果(outeome),一个对照组(contorlgoruP)。在评估“政策措施”对“结果”是否发挥作用时,对照组充当一个参照系。而一个“准自然实验”和自然实验的区别在于处理组和对照组的选取是否随机。这里的“结果”是以受政策影响的县和没有受政策影响的县之间在增长速度上的差异来衡量。简单连接改革措施和被直管县绩效的做法并不恰当。这样的做法无法排除其他政策或是整体经济的影响,因而是无法衡量改革真实效果的。17内生性产生的原因及解决方案2.双重差分法
Difference-in-Difference
(DID)一般称为双重差分法,或倍差法。倘若出现了一次外部冲击,这次冲击影响了一部分样本,对另一部分样本则无影响,而我们想看一下这次外部冲击到底有何影响,双重差分法就是用来研究这次冲击的净效应的。其基本思想是,将受冲击的样本视作实验组,再按照一定标准在未受冲击的样本中寻求与实验组匹配的对照组,而后做差,做差剩下来的便是这次冲击的净效应。双重差分法实际上是固定效应的一个变种,差分的过程实际上是排除固定效应的过程。ZERA在《计量论文写作和发表的黑客教程》有一个非常简明风趣的举例,我转述于此,以飨读者。内生性产生的原因及解决方案DifferenceindifferencemodelsMaybethemostpopularidentificationstrategyinappliedworktodayAttemptstomimicrandomassignmentwithtreatmentand“comparison”sampleApplicationoftwo-wayfixedeffectsmodel19内生性产生的原因及解决方案ProblemsetupCross-sectionalandtimeseriesdataOnegroupis‘treated’withinterventionHavepre-postdataforgroupreceivinginterventionCanexaminetime-serieschangesbut,unsurehowmuchofthechangeisduetosecularchanges20内生性产生的原因及解决方案DifferenceindifferencemodelsBasictwo-wayfixedeffectsmodelCrosssectionandtimefixedeffectsUsetimeseriesofuntreatedgrouptoestablishwhatwouldhaveoccurredintheabsenceoftheinterventionKeyconcept:cancontrolforthefactthattheinterventionismorelikelyinsometypesofstates21内生性产生的原因及解决方案ThreedifferentpresentationsTabularGraphicalRegressionequation22内生性产生的原因及解决方案DifferenceinDifferenceBeforeChangeAfterChangeDifferenceGroup1(Treat)Yt1Yt2ΔYt=Yt2-Yt1Group2(Control)Yc1Yc2ΔYc=Yc2-Yc1DifferenceΔΔYΔYt–ΔYc23内生性产生的原因及解决方案timeYt1t2Yt1Yt2treatmentcontrolYc1Yc2Treatmenteffect=(Yt2-Yt1)–(Yc2-Yc1)24内生性产生的原因及解决方案KeyAssumptionControlgroupidentifiesthetimepathofoutcomesthatwouldhavehappenedintheabsenceofthetreatmentInthisexample,YfallsbyYc2-Yc1
evenwithouttheinterventionNotethatunderlying‘levels’ofoutcomesarenotimportant(returntothisintheregressionequation)25内生性产生的原因及解决方案BasicEconometricModelDatavariesbystate(i)time(t)OutcomeisYitOnlytwoperiodsInterventionwilloccurinagroupofobservations(e.g.states,firms,etc.)26内生性产生的原因及解决方案ThreekeyvariablesTit=1ifobsibelongsinthestatethatwilleventuallybetreatedAit=1intheperiodswhentreatmentoccursTitAit--interactionterm,treatmentstatesaftertheinterventionYit=β0+β1Tit+β2Ait+β3TitAit+εit27内生性产生的原因及解决方案Yit=β0+β1Tit+β2Ait+β3TitAit+εitBeforeChangeAfterChangeDifferenceGroup1(Treat)β0+β1β0+β1+β2+β3ΔYt
=β2+β3Group2(Control)β0β0+β2ΔYc=β2DifferenceΔΔY=β328内生性产生的原因及解决方案MoregeneralmodelDatavariesbystate(i)time(t)OutcomeisYitManyperiodsInterventionwilloccurinagroupofstatesbutatavarietyoftimes29内生性产生的原因及解决方案uiisastateeffectvtisacompletesetofyear(time)effectsAnalysisofcovariancemodelYit=β0+β3TitAit+ui+λt+εit30内生性产生的原因及解决方案GroupeffectsCapturedifferencesacrossgroupsthatareconstantovertimeYeareffectsCapturedifferencesovertimethatarecommontoallgroups31内生性产生的原因及解决方案其中,d就是双重差分估计量,Y为研究的结局变量,右侧脚标中treatment和control分布代表干预组和对照组,t0和t1分别代表干预前和干预后。构造了差分估计量之后,就要根据不同的数据类型和不同的结局变量Y,分别选用相应的参数检验方法来进行建模。32内生性产生的原因及解决方案(1)适用于独立混合横截面数据独立混合横截面数据是在不同时点从同一个的大总体内部分别进行随机抽样,将所得的数据混合起来的一种数据集。该类数据的特点为每一条数据都是独立的观测值。通过将不同时点的多个观测值结合起来,从而可以加大样本量以获得更精密的估计量和更具功效的检验统计量;也可加入新的变量———时间(即干预前后),以便判断干预前后的差别。对于总体一致、范围较大、涉及不同时间点的调查研究,多收集此类数据33内生性产生的原因及解决方案34内生性产生的原因及解决方案35内生性产生的原因及解决方案36内生性产生的原因及解决方案(2)适用于综列数据面板数据的DID模型面板数据要求在不同时点调查相同的研究对象。它与独立混合横截面数据最大的不同在于,不同时点的观测值并不是独立分布的。这类数据的特点在于:由于研究的个体相同,一些不随时间改变的不可观测的因素(如个人特质等)对不同时点的观测值会产生影响,可以通过控制这些影响从而得到较为真实的结果;37内生性产生的原因及解决方案38内生性产生的原因及解决方案39内生性产生的原因及解决方案由于一般大规模的人群调查存在较大的变异性问题,仅在模型中纳入虚拟变量“分组(A)”、“时间(T)”是远远不够的。为了提高解释系数R2,需要加入其他可能影响被解释变量的因素,即控制除分组、时间变量以外的其他变量。40内生性产生的原因及解决方案sscinstalldiff
helpdiffdiffy,t(treated)p(t)robust如果有控制变量,可以利用cov()添加41内生性产生的原因及解决方案工具变量(instrumentalvariable,IV)回归是当回归变量X与误差项u相关时获得总体回归方程未知系数一致估计量的一般方法。我们经常称其为IV估计。其基本思想是:假设方程是:我们假设ui与Xi相关,则OLS估计量一定是有偏的和非一致的。工具变量估计是利用另一个“工具”变量Z将Xi分离成与ui相关和不相关的两部分。3.工具变量法内生性产生的原因及解决方案我们的工作就是要寻找相应的工具变量将解释变量分解成内生变量和外生变量,然后利用两阶段最小二乘法(TSLS)进行估计。内生性产生的原因及解决方案
工具变量的选取
一个有效的工具变量必须满足称为工具变量相关性和工具变量外生性两个条件:即
(1)工具变量相关性:工具变量与所替代的随机解释变量高度相关;
(2)工具变量外生性:工具变量与随机误差项不相关;
内生性产生的原因及解决方案一个合适的工具变量应该同时满足两个条件:第一要能很好地解释内生变量,也就是说工具变量和内生变量之间要足够相关;第二,工具变量要来自系统之外,即工具变量具备外生性。如果内生性表现为联立性问题,第二个标准尤其必要。虽然统计证据可以告诉我们工具变量和内生变量是否相关,但是其背后的因果链条和工具变量是否具备外生性的证明一样,必须依赖令人置信的逻辑推导。工具变量的外生性在回归中表现为和方程的残差项正交,即工具变量不会对方程被解释变量产生影响,如果产生影响则只能通过内生变量起作用。内生性产生的原因及解决方案两阶段最小二乘估计量若工具变量Z满足工具变量相关性和外生性的条件,则可用称为两阶段最小二乘(TSLS)的IV估计量估计系数ß1。两阶段最小二乘估计量分两阶段计算:第一阶段把X分解成两部分:即与回归误差项相关的一部分以及与误差项无关的一部分。第二阶段是利用与误差项无关的那部分进行估计。内生性产生的原因及解决方案一般IV回归模型因变量Yi。外生解释变量W1i、W2i、…Wri。内生解释变量X1i、X2i、…Xki。我们引入工具变量Z1i、Z2i、…Zmi。内生性产生的原因及解决方案第一阶段回归:利用OLS建立每个内生变量(X1i、X2i、…Xki)关于工具变量(Z1i、Z2i、…Zmi)和外生变量(W1i、W2i、…Wri)的回归,并得到所有回归结果的拟合值Xi_hat。第二阶段回归:用Xi_hat取代原有的Xi,与原有的外生变量Wi一起进行第二次回归,得到TSLS统计量βTSLS。注意:工具变量出现在第一阶段回归,但不出现在第二阶段回归。内生性产生的原因及解决方案引入工具变量的个数假设我们有n个内生解释变量,引入了m个工具变量,n和m的关系是什么?n=m恰好识别n<m过度识别n>m不可识别只有恰好识别和过度识别才能用IV方法估计。内生性产生的原因及解决方案两阶段最小二乘法的stata命令:ivregress2slsdepvar[varlist1](varlist2=instlist),r,first其中,“depvar”为被解释变量,varlist1为外生解释变量,varlist2为所有的内生解释变量集合,instlist为工具变量集合。选择项r表示使用异方差稳健的标准误,选择项“first”表示显示第一阶段的回归。内生性产生的原因及解决方案工具变量有效性的检验工具变量相关性工具变量相关性越强,也就是工具变量能解释越多的X变动,则IV回归中能用的信息就越多,因此利用相关性更强的工具变量得到的估计量也更精确。弱工具变量:如果虽然
但是弱工具变量几乎不能解释X的变动。内生性产生的原因及解决方案弱工具变量检验准则1.偏R2(Shea’spartialR2)含义:在第一阶段回归中,在控制外生变量影响的前提下,看其它变量对某内生变量的解释力,或者说,在第一阶段回归中,剔除掉外生变量的影响。2.最小特征值统计量F:经验上F应该大于10。Stata命令:estatfirststage,allforcenonrobust内生性产生的原因及解决方案3.Cragg-DonaldWaldF统计量4.Kleibergen-PaapWaldrkF统计量”
(当假定残差项不满足独立同分布时,就看这个来判断是否弱工具,原假设是弱工具,所以拒绝原假设就可以)F检验临界值表
CHIDISTF(12(自变量数据m),600(自由度df=n(样本数)-m-1))=87.06Stata命令:ivreg2内生性产生的原因及解决方案如果存在弱工具变量该怎么办?1.如果有很多工具变量,有部分强工具变量和部分弱工具变量,可以舍弃较弱的工具变量而选用相关性较强的工具变量子集。在stata中,可以使用ivreg2命令进行“冗余检验”,以决定选择舍弃哪个工具变量。(直观上,冗余工具变量是那些第一阶段回归中不显著的变量。)2.如果系数是恰好识别的,则你不能略去弱工具变量。在这种情况下,有两个选择:第一个选择是寻找其他较强的工具变量。(难度较大)内生性产生的原因及解决方案第二个选择是利用弱工具变量继续进行实证分析,但采用的方法不再是TSLS。而是对弱工具变量不太敏感的有限信息极大似然法(LIML)。在大样本下,LIML与2SLS是渐近等价的,但在存在弱工具变量的情况下,LIML的小样本性质可能优于2SLS。LIML的Stata命令为ivregresslimldepvar[varlist1](varlist2=instlist)内生性产生的原因及解决方案工具变量外生性的检验刚才我们提到:只有恰好识别和过度识别才能用IV方法估计。一个很重要的命题是:只有过度识别情况下才能检验工具变量的外生性,而恰好识别情况下无法检验。内生性产生的原因及解决方案过度识别约束检验基本思想:假设有一个内生回归变量,两个工具变量且没有包含的外生变量。则你可以计算两个不同的TSLS估计量:其中一个利用第一个工具变量,而另一个利用第二个工具变量。由于抽样变异性,这两个估计量不会相同,但如果两个工具变量都是外生的,则这两个估计量往往比较接近。如果由这两个工具变量得到估计非常不同,则你可以得出其中一个或两个工具变量都有内生性问题的结论。内生性产生的原因及解决方案识别标准:
Sargan统计量:ivregress2sls过程中,实际的工具变量(组)是x*与z*。Sagan检验即检验这些工具变量是否外生(是否与扰动项相关),原假设是这些变量都与扰动项不相关。利用残差对这些工具变量回归。
sargen检验的P值应该越大越好,一般超过0.1既可以说明不能拒绝工具变量有效的零假设,不宜接近于1,一般大于0.4就是危险信号,工具变量过多,导致检验结果不可信。
Sargan统计量服从自由度为L-k的卡方分布,查表。在excel中输入CHIDIST(x,iv-v),其中x是sargan统计量的值,iv是工具变量的秩,v是估计参数个数。回车。
内生性产生的原因及解决方案HansenJ统计量C统计量,说明采用工具变量的合理性过度识别检验的Stata命令:estatoverid内生性产生的原因及解决方案xtabond2alsoreportstestsofover-identifyingrestrictions--ofwhetherthe
instruments,asagroup,appearexogenous.
Forone-step,non-robustestimation,itreportstheSarganstatistic,whichistheminimizedvalueoftheone-stepGMMcriterionfunction.
TheSarganstatisticisnotrobusttoheteroskedasticityorautocorellation.
Soforone-step,robustestimation(稳健估计andforalltwo-stepestimation),xtabond2alsoreportstheHansenJstatistic,whichistheminimizedvalueofthetwo-stepGMMcriterionfunction,andisrobust.xtabond2stillreportstheSarganstatisticinthesecasesbecausetheJtesthasitsownproblem:itcanbegreatlyweakenedbyinstrumentproliferation.内生性产生的原因及解决方案究竟该用OLS还是工具变量法豪斯曼检验原假设为:H0:所有解释变量均为外生变量regyx1x2eststoreolsivregress2slsyx1(x2=z1z2)eststoreivhausmanivols,sigmamore内生性产生的原因及解决方案上述检验的缺点是,它假设在H0成立的情况下,OLS最有效率。但如果存在异方差,OLS并不最有效率(不是BLUE)。故传统的豪斯曼检验不适用于异方差的情形。此时可以使用杜宾-吴-豪斯曼检验(DWH),该检验在异方差的情况下也适用,更为稳健。stata命令:estatendogenous
为负值不存在内生性内生性产生的原因及解决方案例一Mincer(1958)最早研究了工资与受教育年限的正相关关系,但遗漏了“能力”这个变量,导致遗漏变量偏差。针对美国面板调查数据中的年轻男子组群(YoungMen’sCohortoftheNationalLongitudinalSurvey,简记NLS-Y),Griliches(1976)采用工具变量法对遗漏变量问题进行了校正。BlackburnandNeumark(1992)更新了Griliches(1976)的数据,即这个例子中将要使用的数据集grilic.dta。内生性产生的原因及解决方案该数据集中包括以下变量:lw(工资对数),s(受教育年限),age(年龄),expr(工龄),tenure(在现单位的工作年数),iq(智商),med(母亲的受教育年限),kww(在“knowledgeoftheWorldofWork”测试中的成绩),mrt(婚姻虚拟变量,已婚=1),rns(美国南方虚拟变量,住在南方=1),smsa(大城市虚拟变量,住在大城市=1),year(有数据的最早年份,1966—1973年中的某一年)。内生性产生的原因及解决方案这是一个两期面板数据,初始期为当以上变量有数据的最早年份,结束期为1980年。不带80字样的变量名为初始期,带80字样的变量名为1980年数据。比如,iq指的是初始期的智商,而lw80指的是1980年的工资对数。内生性产生的原因及解决方案(1)先看一下数据的统计特征。usegrilic.dta,clearsum(2)考察智商与受教育年限的相关关系。pwcorriqs,sig(3)建立如下方程:reglw80s80expr80tenure80内生性产生的原因及解决方案
继续对方程进行分析:我们发现了如下问题:1。遗漏变量问题:认为方程遗漏了“能力”这个变量,加入iq(智商)作为“能力”的代理变量。reglw80s80iqexpr80tenure80内生性产生的原因及解决方案2。测量误差问题:iq(智商)对“能力”的测量存在误差。3。变量内生性问题:s80可能与扰动项中除“能力”以外的其他因素相关,因此是内生变量。解决方法:引入四个变量med,kww,mrt,age,作为内生解释变量iq与s80的工具变量。然后使用TSLS方法进行回归。ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),first内生性产生的原因及解决方案也可以使用GMM估计方法使用两步GMM。
ivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage)使用迭代GMM。
ivregressgmmlw80expr80tenure80(s80iq=medkwwmrtage),igmm内生性产生的原因及解决方案几点注意事项:1。first选项的目的是显示TSLS第一阶段的结果,如果省略,则仅显示第二阶段的结果。2。命令的用法比较严格,将被解释变量和所有外生解释变量放到括号外面,内生解释变量放到括号里面,等号后面为所有工具变量。3。2SLS只能通过stata完成,利用定义手动计算的结果是错误的,因为残差序列是错误的。内生性产生的原因及解决方案4。不可能单独为每个内生变量指定一组特定的工具变量,而是给所有内生变量指定一系列工具变量。5。所有外生变变量都作为自己的工具变量。6。为了检验工具变量的外生性,本题为过度识别。7。在大样本下,IV估计是一致的,但在小样本下,IV估计并非无偏估计量,有些情况下偏误可能很严重。内生性产生的原因及解决方案弱工具变量检验检验方法:1。初步判断可以用偏R2(partialR2)(剔除掉模型中原有外生变量的影响)。
2。Minimumeigenvaluestatistic(最小特征值统计量),经验上此数应该大于10。这个方法类似于与书上的“第一阶段F统计量”。内生性产生的原因及解决方案工具变量外生性检验我们一般称为过度识别约束J检验。
检验工具变量是否与干扰项相关,即工具变量是否为外生变量。TSLS根据Sargan统计量进行过度识别检验。命令为:estatoverid检验工具变量的外生性。
H0:所有工具变量都是外生的。
H1:至少有一个工具变量不是外生的,与扰动项相关。内生性产生的原因及解决方案
ivregress2slslw80expr80tenure80(s80iq=medkwwmrtage),firstestatfirststage,allforcenonrobustestatfirststageestatoverid内生性产生的原因及解决方案究竟该用OLS还是IV解释变量是否真的存在内生性?假设能够找到方程外的工具变量。1。如果所有解释变量都是外生变量,则OLS比IV更有效。在这种情况下使用IV,虽然估计量仍然是一致的,会增大估计量的方差。2。如果存在内生解释变量,则OLS是不一致的,而IV是一致的。内生性产生的原因及解决方案4.
动态面板回归法基本思想是将解释变量和被解释变量的滞后项作为工具变量(IV)。其实,我是不认可这种处理方法,除非万不得已,我不推荐这种方法,我也不太相信这种方法能真正缓解内生性问题。内生性产生的原因及解决方案广义矩估计法:GMM基本思想:求解如下一般化目标函数,使之最小化
J(b_GMM)=n*g(b_GMM)'*W*g(b_GMM)
其中,W为权重矩阵在球型扰动项的假定下,2SLS是最有效的。但如果扰动项存在异方差或自相关,则广义矩估计方法效果更好。GMM方法又分为两步GMM法和迭代GMM方法。内生性产生的原因及解决方案异方差性是相对于同方差而言的。所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。对于模型
如果随机误差项的各期望值之间存在着相关关系,即
这时,称随机误差项之间存在自相关性(autocorrelation)或序列相关内生性产生的原因及解决方案有关GMM的Stata命令为ivregressgmmyx1(x2=z1z2)(两步GMM)ivregressgmmyx1(x2=z1z2),igmm(迭代GMM)estatoverid(过度识别检验)内生性产生的原因及解决方案例二reglwsexprtenurernssmsa,r
引入智商(iq)作为“能力”的代理变量,再进行OLS回归。reglwsiqexprtenurernssmsa,r内生性产生的原因及解决方案(2)由于用iq来度量能力存在“测量误差”,故iq是内生变量,考虑使用变量(med,kww,mrt,age)作为iq的工具变量,进行2SLS回归,并使用稳健标准误。ivregress2slslwsexprtenurernssmsa(iq=medkwwmrtage),rfirst(3)进行过度识别检验,考察是否所有工具变量均外生,即与扰动项不相关。
estatoverid内生性产生的原因及解决方案(4)我们怀疑(mrt,age)不满足外生性,故使用C统计量检验这两个工具变量的外生性。finditivreg2ivreg2lwsexprtenurernssmsa(iq=medkwwmrtage),rorthog(mrtage)(5)考虑仅使用变量(med,kww)作为iq的工具变量,再次进行2SLS回归。ivregress2slslwsexprtenurernssmsa(iq=medkww),rfirst内生性产生的原因及解决方案再次进行过度识别检验:estatoverid(6)弱工具变量检验estatfirststage,allforcenonrobust(7)为了稳健起见,下面使用对弱工具变量更不敏感的有限信息最大似然法(LIML):ivregresslimllwsexprtenurernssmsa(iq=medkww),r内生性产生的原因及解决方案(8)进一步考察弱工具变量问题,对工具变量kww进行冗余检验ivreg2lwsexprtenurernssmsa(iq=medkww),rredundant(kww)(9)利用豪斯曼检验判断是否存在内生解释变量。quireglwiqsexprtenurernssmsaeststoreols1quiivregress2slslwsexprtenurernssmsa(iq=medkww)estimatesstoreiv1hausmaniv1ols1,sigmamore内生性产生的原因及解决方案(10)由于传统的豪斯曼检验在异方差的情形下不成立,下面进行异方差稳健的DWH检验:estatendogenous异方差下也可以利用ivreg2命令进行文件的内生性检验:ivreg2lwsexprtenurernssmsa(iq=medkww),rendog(iq)内生性产生的原因及解决方案(11)如果存在异方差,则GMM比2SLS更有效率。为此,进行如下最优GMM估计。ivregressgmmlwsexprtenurernssmsa(iq=medkww)进行过度识别检验:estatoverid考虑迭代GMM:ivregressgmmlwsexprtenurernssmsa(iq=med
kww),igmm
内生性产生的原因及解决方案(12)结果的完整展现:
quireglwsexprtenurernssmsa,reststoreols_no_iqquireglwiqsexprtenurernssmsa,reststoreols_with_iqquiivregress2slslwsexprtenurernssmsa(iq=medkww),reststoretslsquiivregresslimllwsexprtenurernssmsa(iq=medkww),reststorelimlquiivregressgmmlwsexprtenurernssmsa(iq=medkww)eststoregmmquiivregressgmmlwsexprtenurernssmsa(iq=medkww),igmmeststoreigmmoutreg2[ols_no_iqols_with_iqtslslimlgmmigmm]usingoutput.doc,replaceseeout内生性产生的原因及解决方案遇到内生性问题如何处理1.使用内生解释变量的滞后变量作为工具变量。2.寻找有创意的工具变量。内生性产生的原因及解决方案内生性的其它解决办法(1)代理变量:某变量无法直接观测,而用其它变量替代。
(2)前定变量:用变量的前一期或前几期数据。
(3)面板数据模型。
到底如何对待内生性问题(1)需要重点考虑的问题之一;
(2)最好的收集数据之前就加以考虑,尤其是准备获取一手数据的情况下。如果考虑?应用经济理论。内生性产生的原因及解决方案本实例使用数据集“grilic.dta”。考察智商与受教育年限的相关关系:上表显示,智商(在一定程度上可以视为能力的代理变量)与受教育年限具有强烈的正相关关系(相关系数为0.51)。作为一个参考系,先进行OLS回归,并使用稳健标准差:内生性产生的原因及解决方案内生性产生的原因及解决方案其中expr,tenure,rns,smsa均为控制变量,而我们主要感兴趣的是变量受教育年限(s)。回归的结果显示,教育投资的年回报率为10.26%,这个似乎太高了。可能的原因是,由于遗漏变量“能力”与受教育正相关,故“能力”对工资的贡献也被纳入教育的贡献,因此高估了教育的回报率。引入智商iq作为能力的代理变量,再进行OLS回归:内生性产生的原因及解决方案内生性产生的原因及解决方案虽然教育的投资回报率有所下降,但是依然很高。由于用iq作为能力的代理变量有测量误差,故iq是内生变量,考虑使用变量(med(母亲的受教育年限)、kww(在“knowledgeoftheWorldofWork”中的成绩)、mrt(婚姻虚拟变量,已婚=1)age(年龄))作为iq的工具变量,进行2SLS回归,并使用稳健的标准差:内生性产生的原因及解决方案内生性产生的原因及解决方案在此2SLS回归中,教育回报率反而上升到13.73%,而iq对工资的贡献居然为负值。使用工具变量的前提是工具变量的有效性。为此,进行过度识别检验,考察是否所有的工具变量均外生,即与扰动项不相关:结果强烈拒绝所有工具变量均外生的原假设。考虑仅使用变量(med,kww)作为iq的工具变量,再次进行2SLS回归,同时显示第一阶段的回归结果:内生性产生的原因及解决方案内生性产生的原因及解决方案上表显示,教育的回报率为6.08%,较为合理,再次进行过度识别检验:接受原假设,认为(med,kww)外生,与扰动项不相关。进一步考察有效工具变量的第二个条件,即工具变量与内生变量的相关性。从第一阶段的回归结果可以看出,工具变量对内生变量具有较好的解释力。更正式的检验如下内生性产生的原因及解决方案内生性产生的原因及解决方案从以上结果可看出,虽然Shea’spartialR^2不到0.04,但是F统计量为13.40>10。我们知道,虽然2SLS是一致的,但却是有偏的,故使用2SLS会带来“显著性水平扭曲”(sizedistortion),而且这种扭曲随着弱工具变量而增大。上表的最后部分显示,如果在结构方程中对内生解释变量的显著性进行“名义显著性水平”(nominalsize)为5%的沃尔德检验,加入可以接受的“真实显著性水平”(truesize)不超过15%,则可以拒绝“弱工具变量”的原假设,因为最小特征值统计量为14.91,大于临界值11.59。总之我们有理由认为不存在弱工具变量。但为了稳健起见,下面使用对弱工具变量更不敏感的有限信息最大似然法(LIML):内生性产生的原因及解决方案内生性产生的原因及解决方案结果发现,LIML的系数估计值与2SLS
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- T/LNPSA 0003-2024步态和人脸融合采集通用技术要求
- 高三美术培训知识课件
- 山东中考英语真题含参考答案 -5套
- 离婚协议中财产评估与分割的独立第三方操作合同
- 物业服务公司员工安全责任与绿色生活承诺书
- 完整离婚协议补充书:财产分割及子女抚养协议修订
- 企业并购项目英文合同结构解析与风险防控
- 离婚协议中关于共同债务清偿及房产过户协议示范文本
- 离婚协议书样本(涵盖共同债务处理)
- 考研时间规划咨询服务合同
- 中国真空杯行业发展分析及发展趋势预测与投资风险研究报告2025-2028版
- 军训遇雨活动方案
- 意式轻奢软装设计
- 2025-2030年中国宠物服务行业市场深度调研及投资前景与投资策略研究报告
- 地质灾害风险评估与防治
- 物理实验安全培训
- 普通鱼缸买卖协议书
- T/CECS 10360-2024活毒污水处理装置
- 第三届全国技能大赛竞赛-无人机驾驶(植保)选拔赛备考试题库(附答案)
- 体重管理相关试题及答案
- 2026届高职单招考试大纲英语词汇(音标版)
评论
0/150
提交评论