免费预览已结束,剩余7页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
Stata 回归简介2011-04-04 08:54 P.M.线性回归的命令有:regress y x1 x2 x3 (以y为被解释变量,x1,x2,x3为解释变量做回归;regress后第一个变量为被解释变量)regress y x1 x2 x3, robust (regression with robust standard errors)regress y x1 x2 x3 aweight=w (WLS,以变量w为权重)reg y x1 x2 x3,level(99) 返回回归报告中99%的置信区间。 set level 97 在以后的回归中都默认返回97的置信区间。 reg y x1 x2 x3,noconstant 无常数回归。xi: regress y x1 x2 i.catvar*x2 (被解释变量为y,解释变量为x1,x2,分类变量catvar生成的虚拟变量与x2的乘积。xi可以实现很复杂的带虚拟变量的回归。可使用help xi 命令来了解。)regress y x1 x2 (x z) (工具变量回归,工具变量是x和z)regress y x1 x2 if expin range (使用满足if exp和in range的观测做回归)线性回归的典型输出:Stata会报告如下结果:方差分解,整体显著性检验的F统计量及相应的p值,R平方,调整后的R平方,MSE的平方根(亦即对的估计),系数估计,系数估计的标准差,t值,显著性检验的p值,置信区间。回归后可以对系数做假设检验:对单个参数的检验test amount (检验amount的系数是否显著)test amount = 1 (检验amount的系数是否为1)对多个参数的检验test amount ratio (零假设为amount和ratio的系数都不显著)test amount=ratio (检验amount和ratio的系数是否相等)test amount + ratio=1 (检验amount和ratio的系数之和是否为1)回归后一般要做回归分析,检验是否存在异常的观测,以及是否有异方差,自相关,共线性。回归分析一般依据回归残差进行。此时最重要的命令是predict,可以使用help predict指令来了解它。predict命令主要的功能如下:拟合值相关predict yhat (yhat是任意指定的变量名,以下皆如此)predict new, stdp (standard errors of predicted mean y)回归残差相关predict e, resid (e是任意指定的变量名)predict e, rstandard (标准化的残差,e是任意指定的变量名)predict e, rstudent (学生化的残差,e是任意指定的变量名)predict new, stdr (回归残差的标准差, new是任意指定的变量名)观测相关predict new, cooksd (Cooks D influence measures)predict new, dfits (DFITS influence measures)predict new, welsch (welschs distance influence measures)这几个指令都给出每个观测对回归的影响程度。影响程度越大的观测,越有可能是异常的。在回归时,一般要去掉异常观测。在得到残差后,可以画残差关于某一解释变量,拟合值,时间的图象,以判断有没有异方差或自相关的存在。此时可以使用前一部分介绍的画图命令,但也有专门的命令可用。如果是画残差关于拟合值的图象,可以使用rvfplot命令。如果要画残差关于某一解释变量(设为x1)的图象,可以使用如下指令:rvfplot x1更精细的回归分析需要做假设检验:异方差检验hettest (Cook and Weisbergs test for heteroskedasticity)hettest x1 (同上,但此时我们有理由怀疑异方差可写成变量x1的函数)自相关检验dwstat (Durbin-Watson自相关检验)durbina (Durbin-Watson h统计量)bgodfrey (Breusch-Godfrey LM 统计量)共线性检验vif (variance inflation factors或方差膨胀因子。对每一个解释变量,都可以计算其方差膨胀因子。该因子越大,相应的变量越有可能是其它变量的线性组合。)Logistic回归命令的形式与线性回归十分相识:logit回归logit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量)probit回归probit y x1 x2 x3 (y取0或1,是被解释变量,x1-x3是被解释变量)tobit回归tobit y x1 x2 x3 (y取值在0和1之间,是被解释变量,x1-x3是被解释变量)Stata 序列相关性问题的检验与处理2011-04-05 05:23 P.M.列相关性问题的检验:首先,要保证所用的数据必须为时间序列数据。如果原数据不是时间序列数据,则需要进行必要的处理,最常用的方法就是: gen n=_n tsset n 这两个命令的意思是,首先要生成一个时间序列的标志变量n(或者t 也可以);然后通过tsset 命令将这个数据集定义为依据时间序列标志变量n定义的时间序列数据。 最直观的检验方式是通过观察残差分布,其基本步骤是在跑完回归之后,直接输入 Predict error, stdp /此处有疑问,predict r,residuals这样就得到了残差值;然后输入命令: plot error n 会得到一个error 随n 变化的一个散点图。 D-W检验对一阶自相关问题的检验: D-W检验是对一阶自相关问题的常用检验方法,但是如果实际问题中存在高阶序列相关性问题,则不能用这个检验方法。 D-W 检验的命令如下: 首先,输入回归命令, reg Variable1 Variable2 Variable3VariableM 输出一个简单的OLS估计结果。然后,再输入命令:dwstat 这时会输出一个DW 统计量。通过与临界值之间的比较,可以得出结论。也可以执行如下命令 estat durbinalt /可以有lags(p) 直接进行Durbin检验。 Breusch-GodfreyTest in STATA检验高阶序列相关性: 在得到一个基本回归结果和error 之后,我们假设这样一个关系: et = 0 + 1 et-1 + 2 et-2 + k et-p + 1 x1t + 2 x2t +k xkt +t BG 检验的原假设是:H0 : 1 = 2 = p =0。 其基本命令是: bgodfrey , lags(p) 其中p 是你自己设定的一个滞后项数量。如果输出的p-value 显著小于0.05,则可以拒绝原假设,这就意味着模型存在p 阶序列相关性;如果输出的p-value 显著大于0.05 甚至很大,则可以接受原假设,即不存在p 阶序列相关性。处理序列相关性问题的方法GLS: 常用的几种GLS 方法: (1) Cochrane-Orcutt estimator and Prais-Winsten estimatorSpecifically, the errors are assumed to follow a first-order autoregressive process-AR(1)。其基本命令是 prais var1 var2 var3, corc (2) Newey-West standard errors 其基本命令是 newey var1 var2 var3, lag(3) 其中,lag(3)意思是对三阶序列相关性问题进行处理;如果需要对p 阶序列相关性问题进行处理,则为lag(p) Stata predict中stdp和stdf的区别2011-04-05 04:55 P.M.转载自 人大经济论坛stdp standard error of the prediction 均值预测标准误,也称为置信标准误stdf standard error of the forecast 个别值预测标准误,也称为容许(最大容忍的)标准误个别值预测的标准误比均值预测的标准误多一个hat_sigma从词义上,prediction是比较有依据或有把握的预测,forecast把握较少的预测。 stdp calculates the standard error of the prediction, which can be thought of as the standard error of the predicted expected value or mean for the observations covariate pattern. The standard error of the prediction is also referred to as the standard error of the fitted value. stdf calculates the standard error of the forecast, which is the standard error of the point prediction for 1 observation. It is commonly referred to as the standard error of the future or forecast value. By construction, the standardStata Instrumental variables (2SLS)2011-04-04 07:50 P.M.sysuse auto/*Method1*/. regress mpg weight foreign (length foreign)Instrumental variables (2SLS) regression Source | SS df MS Number of obs = 74-+- F( 2, 71) = 66.83 Model | 1614.50062 2 807.250309 Prob F = 0.0000 Residual | 828.958841 71 11.6754766 R-squared = 0.6607-+- Adj R-squared = 0.6512 Total | 2443.45946 73 33.4720474 Root MSE = 3.4169- mpg | Coef. Std. Err. t P|t| 95% Conf. Interval-+- weight | -.006997 .0006953 -10.06 0.000 -.0083834 -.0056106 foreign | -2.059663 1.113479 -1.85 0.069 -4.279877 .1605519 _cons | 43.03687 2.354551 18.28 0.000 38.34203 47.73171-/*Method2*/. ivregress 2sls mpg foreign (weight=length)Instrumental variables (2SLS) regression Number of obs = 74 Wald chi2(2) = 139.31 Prob chi2 = 0.0000 R-squared = 0.6607 Root MSE = 3.347- mpg | Coef. Std. Err. z P|z| 95% Conf. Interval-+- weight | -.006997 .0006811 -10.27 0.000 -.0083319 -.0056622 foreign | -2.059663 1.090675 -1.89 0.059 -4.197347 .0780215 _cons | 43.03687 2.30633 18.66 0.000 38.51654 47.55719-Instrumented: weightInstruments: foreign length. esttab m1 m2- (1) (2) mpg mpg -weight -0.00700* -0.00700* (-10.06) (-10.27) foreign -2.060 -2.060 (-1.85) (-1.89) _cons 43.04* 43.04* (18.28) (18.66) -N 74 74 -t statistics in parentheses* p0.05, * p0.01, * p0.001Stata对面板数据模型的估计2011-04-01 12:57 P.M.转载自小丑鱼首先对面板数据进行声明:前面是截面单元,后面是时间标识:tsset company yeartsset industry year产生新的变量:gen newvar=human*lnrd产生滞后变量Gen fiscal(2)=L2.fiscal产生差分变量Gen fiscal(D)=D.fiscal描述性统计:xtdes :对Panel Data截面个数、时间跨度的整体描述Xtsum:分组内、组间和样本整体计算各个变量的基本统计量xttab 采用列表的方式显示某个变量的分布Stata中用于估计面板模型的主要命令:xtregxtreg depvar varlist if exp , model_type level(#) Model type 模型be Between-effects estimatorfe Fixed-effects estimatorre GLS Random-effects estimatorpa GEE population-averaged estimatormle Maximum-likelihood Random-effects estimator主要估计方法:xtreg: Fixed-, between- and random-effects, and population-averaged linear modelsxtregar:Fixed- and random-effects linear models with an AR(1) disturbancextpcse :OLS or Prais-Winsten models with panel-corrected standard errorsxtrchh :Hildreth-Houck random coefficients modelsxtivreg :Instrumental variables and two-stage least squares for panel-data modelsxtabond:Arellano-Bond linear, dynamic panel data estimatorxttobit :Random-effects tobit modelsxtlogit : Fixed-effects, random-effects, population-averaged logit modelsxtprobit :Random-effects and population-averaged probit modelsxtfrontier :Stochastic frontier models for panel-dataxtrc gdp invest culture edu sci health social admin,betaxtreg命令的应用:声明面板数据类型:tsset sheng t描述性统计:xtsum gdp invest sci admin1.固定效应模型估计:xtreg gdp invest culture sci health admin techno,fe固定效应模型中个体效应和随机干扰项的方差估计值(分别为sigma u 和sigma e),二者之间的相关关系(rho)最后一行给出了检验固定效应是否显著的F 统计量和相应的P 值2.随机效应模型估计:xtreg gdp invest culture sci health admin techno,re检验随机效应模型是否优于混合OLS 模型:在进行随机效应回归之后,使用xttest0检验得到的P 值为0.0000,表明随机效应模型优于混合OLS 模型3. 最大似然估计Ml:xtreg gdp invest culture sci health admin techno,mleHausman检验Hausman检验究竟选择固定效应模型还是随机效应模型:第一步:估计固定效应模型,存储结果xtreg gdp invest culture sci health admin techno,feest store fe第二步:估计随机效应模型,存储结果xtreg gdp invest culture sci health admin techno,reest store re第三步:进行hausman检验hausman feHausman检验量为:H=(b-B)Var(b)-Var(B)-1(b-B)x2(k)Hausman统计量服从自由度为k的2分布。当H大于一定显著水平的临界值时,我们就认为模型中存在固定效应,从而选用固定效应模型,否则选用随机效应模型如果hausman检验值为负,说明的模型设定有问题,导致Hausman 检验的基本假设得不到满足,遗漏变量的问题,或者某些变量是非平稳等等可以改用hausman检验的其他形式:hausman fe, sigmaless对于固定效应模型的异方差检验和序列相关检验:Xtserial gdp invest culture sci health admin techno异方差检验: xtreg gdp invest culture sci health admin techno,fexttest3 (Modified Wald statistic for groupwise heteroskedasticity in fixed effect model)随机效应模型的序列相关检验:xtreg gdp invest culture sci health admin techno,reXttest1Xttest1用于检验随机效应(单尾和双尾) 、一阶序列相关以及两者的联合显著检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著可以使用广义线性模型xtgls对异方差和序列相关进行修正:xtgls gdp invest culture sci health admin techno, panels(hetero),修正异方差xtgls gdp invest culture sci health admin techno, panels(correlated),修正依横截面而变化的异方差xtgls gdp invest culture sci health admin techno, panels(hetero) corr(ar1),修正异方差和一阶序列相关ar(1)System GMM2011-03-10 09:40 A.M.面板数据模型最常用的估计方法是固定效应模型和随机效应模型,当解释变量具有内生性时,这两种模型均不能保证得出无偏的参数估计,此时,工具变量法是更为合适的估计方法。本文的实证模型中由于出现了滞后被解释变量,模型的内生性问题不可避免地出现了。为了得出实证方程(1)无偏估计值,选择合适的工具变量是十分必要的。对于这个问题, Arellano和Bond ( 1991) 15提出了用一阶差分GMM ( first differenced GMM)估计方法来解决。但是, B lundell和Bond ( 1998) 16曾指出,一阶差分GMM估计方法容易受到弱工具变量的影响而得到有偏的估计结果。为了克服弱工具变量的影响, Arellano和Bover ( 1995) 17以及Blundell和Bond (1998)提出了另外一种更加有效的方法,即系统GMM ( System GMM)估计方法。其具体做法是将水平回归方程和差分回归方程结合起来进行估计,在这种估计方法中,滞后水平作为一阶差分的工具变量,而一阶差分又作为水平变量的工具变量。LNYRPOWLNEDUFIXPIRFIROPEN7.3502513997032450.13897438522619042.5131552275508410.36433035714285721.0692972375623241.9813746552291670.046571842398809547.2440887518722060.125984232.4844856392545370.331.0530192068601321.81453742550.016153204
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 桥梁支座更换施工技术
- 麦冬的药理活性研究
- 小区安全隐患协议书
- 建筑代理商合同范本
- 工作分工协议书范本
- 小区公共收益协议书
- 废渣土处理合同范本
- 小学门卫聘任协议书
- 工程推迟顺延协议书
- 工程延期申请协议书
- 建筑物区分所有权一郑晓俐课件
- 园区安全管理培训
- 2025年江西江铜华东铜箔有限公司招聘笔试参考题库含答案解析
- 2024年人教版四年级数学上册 第5单元《平行四边形和梯形》能力提升卷(含解析)
- 安踏集团零售管理培训手册
- 薄膜物理与技术-5薄膜的形成与生长
- 民居建筑-福建土楼课件
- 公司无贷户营销(兰云)
- 小学数学骨干教师专题讲座《如何有效培养小学生的数学阅读能力》
- DL∕T 2601-2023 火力发电厂尿素水解制氨系统调试导则
- DL∕T 1650-2016 小水电站并网运行规范
评论
0/150
提交评论