STATA的简单命令_第1页
STATA的简单命令_第2页
STATA的简单命令_第3页
STATA的简单命令_第4页
STATA的简单命令_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 5 STATA的简单命令的简单命令 Stata 中最重要的命令莫过于 help 和 search 了 help 用于查找精确的命令 而 search 是模糊查找 例如 help regress 又如 我们记不清 regress 命令的全名 只记得 regress 的前半部分 reg 那么可以输入 search reg 用户获得信息最有效的另一个途径是使用 Statalist 在线论坛 该论坛提供 Stata 用户交流的 一个良好的平台 要加入 Statalist 我们可以给以下地址发个邮件 majordomo hsphsun2 harvard edu 邮件的内容为 subscribe Statalist 变量的命名 1 变量名可达 32 个字符 2 字符组成部分为 A Z a z 0 9 与下划线 这些字符以外的其他符号不可以出现 在变量名中 3 变量名不能以数字开头 4 变量名区分大小写 5 倘若遵循以上原则依然无法正常命名变量 那么这个变量可能与 Stata 自身保留的供系 统使用的变量重复了 创建数据文件的方法 1 手动输入 2 从 excel 等文件中复制粘贴到 stata 数据表中 3 运用 stata 软件导入 查看数据的概貌 summarize x codebook x 如果上面两个命令后面不加内容 那么显示的结果是所有变量的概貌 对数据进行排序的命令 sort 标准 1 标准 2 标准 3 生成数据的命令 gen 1 如果要得到一阶差分 可以用以下命令 gen Difference invest 新变量的名称是任意 的 d invest d 是运算符号 不得改变 invest 是变量名称 2 要想产生一个新的变量 Lag invest 也就是 invest 的一阶滞后 那么我们可以采用如下 命令 gen Lag invest l invest 3 生成对数的命令 gen Ln invest ln invest 作散点图的命令 scatter 1 scatter x1 x2 scatter 后的第一个变量是纵轴的变量 第二个变量是横轴的变量 2 5 2 scatter x1 x2 connect 1 以直线的方式连接相邻的两个点 3 scatter x1 x2 connect 1 msymbol i 散点的显示方式为 看不见 相关性检验 回归方程的斜率系数在一定程度上也是反映两个变量之间关系的密切程度 斜率系数的平 方根就是相关系数 1 pwcorr 命令 用于计算 Pearson 相关系数 它的好处是尽可能使用两两变量中所有没 有缺失的数据 而不像 correlate 只采用没有任何缺失数据的完整的观测值 pwcorr varlist sig star 1 star 1 是为了对显著性超过 0 1 的相关系数打上星号 pwcorr varlist sig print 1 print 1 则是仅仅显示这些显著的相关系数 2 spearman 命令 用于计算 Spearman 相关系数 截面数据的估计命令截面数据的估计命令 如何创建一个截面数据文件 只需要从 excle 中拷贝相应的数据到 stata 中即可 不需要特 别的命令说明它是截面数据 截面数据的回归主要需要注意以下几点 多重共线性 当样本量较小时 例如小于 100 和异方差 而且需要考察 t 统计值 R2 adj R2 F 统计量 1 检验自变量的相关性 第 1 步也可以暂时不做 等到回归结束以后再做 pwcorr varlist sig print 05 2 对模型进行回归 一个普通的回归命令 reg y x1 x2 x3 x4 x5 robust 截面数据一律加上 robust 倘若回归结果的经济学含义不合理 包括系数的正负号和显著性水平 而且前面的相 关性检验中自变量的相关性十分高 那么有可能存在严重的多重共线性 为了精确起 见 可以用 vif 来判断多重共线性是否严重 当 vif 的最大值大于 10 同时各 vif 的平 均值大于 1 时 表明多重共线性比较严重 使用 vif 命令时一定要在回归命令执行以后 再用 如何处理多重共线性 剔除变量法 逐步回归法以及增加样本容量 3 运用剔除变量法进行回归 4 运用逐步回归法进行回归 逐步回归命令 sw reg y x1 x2 x3 x4 x5 pr 1 逐步回归 从最不显著的变量开始删除 直到所有变量 在设定水平下 0 1 显著 sw reg y x1 x2 x3 x4 x5 pr 1 lockterm1 逐步回归 从最不显著的变量开始删除 直到 所有变量在设定水平下 0 1 显著 而且加入 lockterm 项 为了保证第一项自变量不 被删除 sw reg y x1 x2 x3 x4 x5 pr 1 逐步回归 从最不显著的变量开始删除 直到所有变 量在设定水平下 0 1 显著 而且加入 项 为了保证 x4 和 x5 要么同时出现 要 么同时不出现 3 5 时间序列数据的估计命令时间序列数据的估计命令 如何创建一个截面数据文件 先把数据转移到 stata 中 然后用 tsset 命令 tsset time yearly 或者 weekly monthly quarterly 此时 一定要保证表示时间的那一列数据 即年份 的名称为 time 时间序列数据的回归主要需要注意以下几点 多重共线性 当样本量较小时 例如小于 100 和序列相关性 而且需要考察 t 统计值 R2 adj R2 F 统计量 D W 值 首先用 reg 命令进行回归 例如 reg y x1 x2 x3 x4 x5 并考察 D W 值 使用 estat dwatson 这一命令 如果 D W 值严重远离 2 那么要进行调整 调整方法如黄色底纹 直到调整 到 2 附近 然后考察回归结果是否符合经济学含义 倘若不符合 那么要注意是否受到多 重共线性的影响 通过相关系数和 vif 值来判断 在处理多重共线性时 可以用类似于处 理截面数据的方法 剔除变量法 同时还要看 D W 值 此外 还可以用差分法来处理多 重共线性 此方法用得不多 检验 DW 值的命令 estat dwatson 用广义差分法考虑序列相关性的命令 即调整 DW 值的命令 reg y x1 x2 x3 x4 x5 L y 后面还可以运用 L y L2 y 用序列相关稳健标准误法考虑序列相关性的命令 即调整 DW 值的命令 reg y x1 x2 x3 x4 x5 robust 考虑多重共线性的方法除了以上截面数据中用到的方法以外 还可以用差分法 然后再看 vif 值 reg D y D x1 D x2 D x3 D x4 D x5 面板数据的估计命令面板数据的估计命令 如何创建一个面板数据文件 录入数据 xtset id year 面板数据的回归主要需要注意 多重共线性 当样本量较小时 异方差和序列相关性在很 多研究中可以不必深究 而且需要考察 t 统计值 R2 adj R2 F 统计量 选择固定效应 fixed effect 或随机效应 random effect 多重共线性的处理方法可以参照截面数据和时间序列数据的处理方法 固定效应和随机效应的选择 xtreg 后面紧挨着的变量是被解释变量 然后接下来才是解 释变量 xtreg 被解释变量 解释变量 fe est store fe 4 5 xtreg 被解释变量 解释变量 re est store re hausman fe 如果 hausman 检验的结果 Prob chi2 小于 0 1 那么选择固定效应 如果 Prob chi2 大于 0 1 或者 chi2 的值小于 0 那么选择随机效应 其它命令其它命令 GMM 方法 xtabond depvar indepvars sargan 检验 estat sargan 自相关检验 estat abond 同时控制时间因素 year 和行业因素 industrycode 即自动加入虚拟变量的命令 xi 的 用法 xi i year i industrycode 加入自动生成的虚拟变量 并且运用稳健标准误进行固定效应回归的命令 xtreg lnex lngdpcn lngdppartner educationjob iprrd lawhi i year i industrycode fe robust 面板数据中 2sls 的命令 这可能是默认的命令 还可以根据具体情况更改 1 xtivreg lnex lk tfp rd size fdi i year i id finance l finance 此时怀疑解释变量 finance 是内生的 而且以 finance 的一阶滞后作为 IV 注意 括号前面必须有空格 2 xtivreg lnex lk tfp rd size fdi i year i id finance l finance l2 finance 此时怀疑解释变 量 finance 是内生的 而且以 finance 的一阶滞后和二阶滞后作为 IV 注意 括号前面必须 有空格 如果用 overid 需要安装 overid ssc install overid replace 如果用 xtoverid 需要安装 xtoverid ssc install xtoverid replace 如果用 ranktest 需要安装 ranktest ssc install ranktest replace 有时即使安装以后依然无法运用 可能是由于自变量太多导致的 例如控制行业固定效应 时间固定效应等固定效应时会增加几十个虚拟变量 这时可能由于模型无法运算而无法运 用这些命令 GMM 方法似乎也有类似情况 5 5 例如 xtivreg lnex lngdpcn lngdppartner distance language border fincountry l fincountry l2 fincountry findep financefin re 检验工具变量识别不足时用命令 ranktest 以上例子应该是 ranktest fincountry l fincountry l2 fincountry 理想的结果是 Kle

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论