李子奈《计量经济学》第三版例题及习题的stata解答_第1页
李子奈《计量经济学》第三版例题及习题的stata解答_第2页
李子奈《计量经济学》第三版例题及习题的stata解答_第3页
李子奈《计量经济学》第三版例题及习题的stata解答_第4页
李子奈《计量经济学》第三版例题及习题的stata解答_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二章例2.11(p24)(1)表2.1.2中E(Y|X=800)即条件均值的求法,将数据直接复制到stata中。程序:sum y if x=800VariableObsMeanStd. Dev.MinMaxy460534.78505561其他条件均值求法程序相同,sum是summarize 的缩写(横线表示最简省形式),显示变量的描述统计信息,包括:观测量数,均值,标准差,最小值,最大值,if是条件表达式。638程序:sum y if x=1100VariableObsMeanStd. Dev.MinMaxy6825121.698638968程序:sum y if x=1400VariableObsMeanStd. Dev.MinMaxy111045116.30918691210(2)图2.1.1的做法:程序:twoway(scatter y x )(lfit y x ),title(不同可支配收入水平组家庭消费支出的条件分布图)xtitle(每月可支配收入(元))ytitle(每月消费支出(元))xtick(500(500)4000)ytick(0(500)3500)Scatter表示散点图选项,lfit表示回归线,title表示题目,xtick表示刻度,(500(500)4000)分别表示起始刻度,中间数表示以单位刻度,4000表示最后的刻度。要注意的是命令中的符号都要用英文字符,否则命令无效。这个图可以直接复制的,但是由于我的软件出问题,只能直接剪切,所以影响清晰度。 例2.31(p37)将数据直接复制到stata中程序:(1)total xiyireturn listTotal表示求和,return list命令可以引用其中的数据,接下来在第一列生成一个新的变量代表xiyi的和,同样生成一个b代表xi平方的,a除以b即可得到batascalars: r(skip) = 0 r(first) = 1 r(k_term) = 0 r(k_operator) = 0 r(k) = 0 r(k_level) = 0 r(output) = 1 r(b) = 4974750 r(se) = 1507820.761894463g a=r(b) in 1total xi2return listg b=r(b) in 1di a/b .67(2) mean Yigen m=r(b) in 1mean Xig n=r(b) in 1di m-n*0.67142.4由此得到回归方程:Y=142.4+0.67Xi例2.62(p53)程序:(1)回归reg y x (2) 求X的样本均值和样本方差:mean xsum x ,d(d表示detail的省略,这个命令会产生更多的信息)di r(Var)(特别注意Var的大小写)10853528例2.6.2(P56)(1)reg Y X(2)图2.6.1的绘制:twoway (line Y X year),title(中国居民可支配总收入X与消费总支出Y 的变动图)第三章例3.2.2(p72)reg Y X1 X2例3.51(p85)g lnP1=ln(P1)g lnP0=ln(P0)g lnQ=ln(Q)g lnX=ln(X)drop lnX lnP1 lnP0 g lnXP0=ln(X/P0) g lnP1P0=ln(P1/P0) reg lnQ lnXP0 lnP1P0练习题13(p105)g lnY=ln(Y)g lnK=ln(K)g lnL=ln(L)reg lnY lnK lnL第二问:test b_lnk+b_lnl=1第四章例4.14 (P116)(1)回归g lnY=ln(Y)g lnX1=ln(X1)g lnX2=ln(X2)reg lnY lnX1 lnX2于是得到方程: lnY=3.266+0.1502lnX1+0.4775lnX2(2)绘制参差图:predict e, residg ei2=e2scatter ei2 lnX2,title(图4.1.3 异方差性检验图)xtick(6(0.4)9.2)ytick(0(0.04)0.24)predict在回归结束后,需要对拟合值以及残差进行分析,需要使用此命令。(3)G-Q检验sort X2drop in 13 /19reg lnY lnX1 lnX2 in 1/12reg lnY lnX1 lnX2 in 13/24di F=0.1911/0.0702(可以用字母替代)2.72364672.7222222(4)怀特检验(重新把原始数据出入)reg lnY lnX1 lnX2predict e ,residg e2=e2g lnX12=(lnX1)2g lnX22=(lnX2)2g lnX1X2=lnX1*lnX2reg e2 lnX1 lnX2 lnX12 lnX22 lnX1X2reg e2 lnX1 lnX2 lnX12 lnX22g lne2= ln(e2)reg lne2 lnX2 lnX22. predict m ,xb(和书上直接以差残作为权数是有区别的,理论上不能能以残差直接作为权数). predictnl n=exp(xb(). g wi=sqrt(n). vwls lnX1 lnX2,sd(wi)例4.21(老师有标准答案)reg Y Xpredict e,residtsset year time variable: year, 1978 to 2006 delta: 1 unitline e year,title(残差相关图)xtick(1978(5)2006)ytick(-3000(1000)3000)scatter e e1,title(残差相关图)xtick(-2000(1000)3000)ytick(-3000(1000)3000)g T=_ng T2=T2reg Y X T2reg e X T2 e1g e2=e_n-1reg e X T2 e1 e2prais Y X T2,rhotype(orrc)newey lnY lnX, lag(2)例4.3.1(P140)g lnX1=ln(X1)g lnX2=ln(X2)g lnX3=ln(X3)g lnX4=ln(X4)g lnX5=ln(X5)g lnY=ln(Y)reg lnY lnX1 lnX2 lnX3 lnX4 lnX5corr lnX1 lnX2 lnX3 lnX4 lnX5stepwise, pr(0.05) : reg Y X1 X2 X3 X4 X5或者stepwise, pe(0.05) : reg Y X1 X2 X3 X4 X5(逐步向前回归和逐步向后回归)reg lnY lnX1 lnX2 lnX3例4.41(P151)reg X1 X2 Zpredict v,residreg Y X1 X2 vivreg Y X2 (X1=Z) reg Y X1 X2第4章练习8(P154)(1)回归rename var1 Xrename var2 Yreg Y X(2)异方差判断(4种方法)predict e,residg e2=e2scatter e2 Xi通过观测散点图可知残差有明显的扩大趋势ii 通过怀特检验,原假设为同方差,p值0.05,拒绝原假设。上述两种方法证明存在异方差imtest,white(3)解决异方差predict e,residualsg e2=e2reg le2 Xpredict m,xbpredictnl h=exp(xb()reg Y X w=1/h练习题9(p155)g lnX=ln(X)g lnY=ln(Y)reg lnY lnX判断相关性:(通过e-t或者DW值)predict e ,residline e yearscatter e l.etsset year time variable: year, 1980 to 2007 delta: 1 unitestat dwatsonDurbin-Watson d-statistic( 2, 28) = .3793231表明有正自相关性。prais lnY lnX ,corcreg e lnX L.ereg e lnX L.e l2.ereg e lnX L.e l2.e l3.enewey lnY lnX, lag(2)g X1=X-L.Xg Y1=Y-L.Yreg Y1 X1estat dwatsonDurbin-Watson d-statistic( 2, 27) = .96084284-练习题10(P155)reg Y X1 X2 第五章例5.1.1(P160)reg Y1 X1reg Y2 X2tab(region),g(D)drop D1g DX=D2*Xreg Y X D2 DX例5.2.2(P168)(和书上的答案略有不同)g X1=X_n-1g X2=X_n-2g X3=X_n-3g X4=X_n-4g X5=X_n-5g X6=X_n-6g X7=X_n-7g lnX=ln(X)g lnX1=ln(X1)g lnX2=ln(X2)g lnX3=ln(X3)g lnX4=ln(X4)g lnX5=ln(X5)g lnX6=ln(X6)g lnX7=ln(X7)g lnY=ln(Y)g W0=lnX+lnX1+lnX2+lnX3+lnX4+lnX5+lnX6+lnX7g W1=lnX1+2*lnX2+3*lnX3+lnX*4+lnX5*5+lnX6*6+lnX7*7g W2=4*lnX2+9*lnX3+lnX4*16+lnX5*25+lnX6*36+lnX7*49reg lnY W0 W1 W2例5.2.2(P173)tsset year time variable: year, 1978 to 2007delta: 1 unitg Yt1=Y_n-1reg Y X P Yt1练习题5(P186)(和例5.2.3相似,具体步骤略)(1)估计Y*tsset year time variable: year, 1970 to 1991 delta: 1 unitg Yt1=Y_n-1reg Y X Yt1通过自回归模型的参数估计,可以得到Y*即理想的或长期的新建厂房企业开支。(2)存量调整模型(对数转换):g lnY=ln(Y)g lnYt1=ln(Yt1)g lnX=ln(X)reg lnY lnX lnYt1(3)以X*代表理想的销售量,用X和Xt-1表示,带入Y方程中,重新估计模型Y。通过整理得到0,1。(结果略)g Xt1=X_n-1reg Y X Xt1第六章例6.4.1(P215);(通过2SLS估计,其他方法略)tsset yearg Ct=C_n-1reg Y Ct Gpredict m,xb练习题8(P228)(2SLS)reg M Y Ppredict m,xbreg Y M C I1. 安装estout。最简单的方式是在stata的指令输入:ssc install estout, replaceEST安装的指导网址是:/bocode/e/estout/installation.html2.跑你的regression3.写下这行指令esttab using test.rtf,然后就会出现个漂亮的表格给你(WORD文档)。只要再小幅修改,就可以直接用了。这个档案会存在my documentstata下。如果你用打开的是一个stata do file,结果会保存到do文件所在文件夹中。如果要得到excel文件,就把后缀改为.xls或者.csv就可以了4.跑多个其实也不难,只要每跑完一个regression,你把它取个名字存起来:est store m1。m1是你要改的,第一个model所以我叫m1,第二个的话指令就变成est store m2,依次类推。5.运行指令:esttab m1 m2 . using test.rtf就行了。异方差的检验:Breusch-Pagan test in STATA:其基本命令是:estat hettest var1 var2 var3其中,var1 var2 var3 分别为你认为导致异方差性的几个自变量。是你自己设定的一个滞后项数量。同样,如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异方差性。White检验:其基本命令是在完成基本的OLS 回归之后,输入imtest, white如果输出的P-Value 显著小于0.05,则拒绝原假设,即不存在异方差性处理异方差性问题的方法:方法一:WLSWLS是GLS(一般最小二乘法)的一种,也可以说在异方差情形下的GLS就是WLS。在WLS下,我们设定扰动项的条件方差是某个解释变量子集的函数。之所以被称为加权最小二乘法,是因为这个估计最小化的是残差的加权平方和,而上述函数的倒数恰为其权重。在stata中实现WLS的方法如下:reg (被解释变量) (解释变量1) (解释变量2) aweight=变量名其中,aweight后面的变量就是权重,是我们设定的函数。一种经常的设定是假设扰动项的条件方差是所有解释变量的某个线性组合的指数函数。在stata中也可以方便地实现:首先做标准的OLS回归,并得到残差项;reg (被解释变量) (解释变量1) (解释变量2)predict r, resid生成新变量logusq,并用它对所有解释变量做回归,得到这个回归的拟合值,再对这个拟合值求指数函数;gen logusq=ln(r2)reg logusq (解释变量1) (解释变量2)predict g, xbgen h=exp(g)最后以h作为权重做WLS回归;reg (被解释变量) (解释变量1) (解释变量2) aweight=h如果我们确切地知道扰动项的协方差矩阵的形式,那么GLS估计是最小方差线性无偏估计,是所有线性估计中最好的。显然它比OLS更有效率。虽然GLS有很多好处,但有一个致命弱点:就是一般而言我们不知道扰动项的协方差矩阵,因而无法保证结果的有效性。方法二:HC SEThere are 3 kinds of HC SE(1)Huber-White Robust Standard Errors HC1, 其基本命令是:reg var1 var2 var3, robustWhite(1980)证明了这种方法得到的标准误是渐进可用(asymptotically valid)的。这种方法的优点是简单,而且需要的信息少,在各种情况下都通用。缺点是损失了一些效率。这种方法在我们日常的实证研究中是最经常使用。(2)MacKinnon-White SE HC2,其基本命令是:reg var1 var2 var3, hc2(3)Long-Ervin SE HC3,其基本命令是:reg var1 var2 var3, hc3约束条件检验:如果需要检验两个变量,比如x 与y,之间系数之间的关系,以检验两者系数相等为例,我们可以直接输入命令:test x=y再如检验两者系数之和等于1,我们可以直接输入命令:test x+y=1如果输出结果对应的P-Value 小于0.05,则说明原假设显著不成立,即拒绝原假设。序列相关性问题的检验与处理序列相关性问题的检验:首先,要保证所用的数据必须为时间序列数据。如果原数据不是时间序列数据,则需要进行必要的处理,最常用的方法就是:gen n=_ntsset n这两个命令的意思是,首先要生成一个时间序列的标志变量n(或者t 也可以);然后通过tsset 命令将这个数据集定义为依据时间序列标志变量n定义的时间序列数据。最直观的检验方式是通过观察残差分布,其基本步骤是在跑完回归之后,直接输入Predict error, stdp这样就得到了残差值;然后输入命令:plot error n会得到一个error 随n 变化的一个散点图。D-W检验对一阶自相关问题的检验:D-W检验是对一阶自相关问题的常用检验方法,但是如果实际问题中存在高阶序列相关性问题,则不能用这个检验方法。D-W 检验的命令如下:首先,输入回归命令,reg Variable1 Variable2 Variable3VariableM输出一个简单的OLS估计结果。然后,再输入命令:dwstat这时会输出一个DW统计量。通过与临界值之间的比较,可以得出结论。也可以执行如下命令estat durbinalt直接进行Durbin检验。Breusch-GodfreyTest in STATA检验高阶序列相关性:在得到一个基本回归结果和error 之后,我们假设这样一个关系:et = 0 + 1 et-1 + 2 et-2 + k et-p + 1 x1t + 2 x2t +k xkt +tBG检验的原假设是:H0:1 = 2 = p =0。其基本命令是:bgodfrey , lags(p)其中p是你自己设定的一个滞后项数量。如果输出的p-value 显著小于0.05,则可以拒绝原假设,这就意味着模型存在p阶序列相关性;如果输出的p-value 显著大于0.05甚至很大,则可以接受原假设,即不存在p阶序列相关性。处理序列相关性问题的方法GLS:常用的几种GLS方法:(1) Cochrane-Orcutt estimator 和Prais-Winsten estimator其基本命令是prais var1 var2 var3, corc(2) Newey-West standard errors其基本命令是newey var1 var2var3, lag(3)其中,lag(3)意思是对三阶序列相关性问题进行处理;如果需要对p阶序列相关性问题进行处理,则为lag(p)t因变量,g,f,c是自变量,_26存放了弟26个观测值,为需要预测的值reg t g f c if _n!=26点预测predict taxpredict if _n=26均值的区间预测predictnl py=predict(xb),ci(lb ub) l(95)因变量的区间预测adjust g=117251.9 f=24649.95 c=99.9,stdf ci level(95)Hausman检验是检验内生性的最常用的方法。它是通过比较一致估计量与有效估计量的Wald统计量。命令格式为:.hausman name-constistent name-efficent ,options其中,name-cosistent指一致估计的结果, name-efficent 指有效估计的结果。注意,一致、有效估计量的先后顺序不能改变。Option选项:constant计算检验统计量将常数也包括在内,默认值为排除常数allegs 利用所有方程进行检验,默认只对第一个方程进行检验skipeqs(eqlist) eqlist只能以方程名称而不能以方程序号表示equation(matchlist) 比较设定的方程。force 即使假设条件不满足仍进行检验df(#) 默认值为一致估计与有效估计的协方差矩阵的差的估计sigmamore 协方差矩阵采用有效估计量的协方差矩阵sigmaless协方差矩阵采用一致估计量的协方差矩阵tconsistent(string)一致估计量的标题tefficient(string) 有效估计量的标题工具变量估计命令格式:.ivregress esitimator depvar varlist1 varlist2=varlist_iv if in weight,options其中,estimator包括2sls,gmm,liml三种。varlist1为模型中的外生变量,varlist2为模型中的内生变量,varlist_iv为模型中的工具变量。Nonconstant不包括常数项Hascons用户自己设定常数项CMM 选项:wmatrix(wmtype)robust,cluster clustvar,hac kernel, unadjustedcenter权数矩阵采用中心矩igmm 采用迭代GMM估计eps(#) 参数收敛标准。默认值为eps(le-6)weps(#)权数矩阵的收敛标准。默认值为w eps(le-6)Vce(vcetype) unajusted,robust,cluster clustvar,bootstrap,jackknife,hac kernellevel(#)置信区间First 输出第一阶段的估计结果Small 小样本下的自由度调整.estat firststage ,all forcenonrobust该命令给出第一阶段的估计结果以及各种统计量,包括排除外生变量的相关性检验。All选项给出所有的拟合优度统计量。如果模型存在多个内生变量,则stata给出R2、偏R2、调整的R2 、F统计量;如果模型存在多个内生变量,则stata给出Shea偏R2和调整的偏R2。forcenonrobust给出最小特征值统计量及其临界值,即使采用稳健估计(这一检验的假设条件是误差项为独立正态分布)。estat overid,lag(#) forceweights forcenonrobust该命令给出了过度识别约束检验。如果使用2sls估计估计,则Stata给Sargans(1958)和Basmans(1960)卡方统计量,这也是Wooldridge(1995)稳健得分检验。 如果采用liml估计方法,则stata给出Anderson and Rubins(1950) 卡方统计量以及Basmann F统计量;如果采用GMM估计,则stata给出hansens(1982)J统计量。Lags(#)用于计算得分检验的HAC(异方差自相关一致)统计量的过程中进行去噪时设定滞后阶数。如果设定lag(0),则表示不进行去噪处理。默认选择为lag(1)。这一选择仅使用于2sls估计方法和设定vce(hac)选项情况。Forceweight表示即使采用aweights,pweights或iweights也进行检验。Stata仅对于fweights的情况进行检验,其他权数所得到临界值可能不准确。Forcenonrobust指在2sls或LIML估计中即使采用稳健标准差也进行Sargan and Basmann检验(这一检验的假设的假设条件是误差项为独立正态分布)。例子:log(wage)=a+b*educ+c*exper+d*expersq+u怀疑模型教育(educ)具有内生性问题,利用父母接受教育的年数(fatheduc,motheduc)作educ的工具变量估计上述模型。(1)利用2SLS估计模型.ivregress 2sls lwage exper expersq (educ=fatheduc motheduc),first第一阶段回归结果为:educhat=9.1+0.19fatheduc+0.16motheduc+0.05exper(21.34)(5.62)(4.39)(1.12)- 0.001expersq(-0.84)第二阶段的估计结果为:lwagehat=0.05+0.06educ+0.04exper-0.001expersq(0.12)(1.95)(5.29)(-2.24)(2)检验educ的内生性.quietlyivregiwage exper expersq educ=fatheduc motheduc.est store IV_reg.quietly regress lwage exper expersq educ.est store LS_reg.hausman IV_reg LS_reg可以得到hausman估计量=2.7,P值=0.44。接受原假设,即educ是外生的。(3)进行过度识别的约束检验.estat overid可得Sargan统计量=0.38,P值=0.54接受原假设。面板数据估计首先对面板数据进行声明:前面是截面单元,后面是时间标识:tsset company yeartsset industry year产生新的变量:gen newvar=human*lnrd产生滞后变量Gen fiscal(2)=L2.fiscal产生差分变量Gen fiscal(D)=D.fiscal描述性统计:xtdes :对Panel Data截面个数、时间跨度的整体描述Xtsum:分组内、组间和样本整体计算各个变量的基本统计量xttab 采用列表的方式显示某个变量的分布Stata中用于估计面板模型的主要命令:xtregxtreg depvar varlist if exp , model_type level(#) Modeltype模型beBetween-effects estimatorfeFixed-effects estimatorreGLS Random-effects estimatorpaGEE population-averaged estimatormleMaximum-likelihood Random-effects estimator主要估计方法:xtreg:Fixed-, between- and random-effects, and population-averaged linear modelsxtregar:Fixed- and random-effects linear models with an AR(1) disturbancextpcse :OLS or Prais-Winsten models with panel-corrected standard errorsxtrchh :Hildreth-Houck random coefficients modelsxtivreg :Instrumental variables and two-stage least squares for panel-data modelsxtabond:Arellano-Bond linear, dynamic panel data estimatorxttobit :Random-effects tobit modelsxtlogit : Fixed-effects, random-effects, population-averaged logit modelsxtprobit :Random-effects and population-averaged probit modelsxtfrontier :Stochastic frontier models for panel-dataxtrc gdp invest culture edu sci health social admin,betaxtreg命令的应用:声明面板数据类型:tssetsheng t描述性统计:xtsum gdp invest sci admin1.固定效应模型估计:xtreggdp invest culture sci health admin techno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma u 和sigma e),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F 统计量和相应的P 值2.随机效应模型估计:xtreggdp inv

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论