




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、Stata 应 用 技 巧共三十六页1、界面(jimin)Stata有4个窗口:1 Stata Command(右下)用于向Stata输入命令;2 Stata Results(右上)用于显示运行结果(ji gu);3 Review(左上)记录使用过的命令;4 Variables(左下)显示当前memory中的所有变量。2共三十六页STATA的界面(jimin)STATA数据分析基础(jch)Result WindowCommand WindowReview WindowVariable WindowButtons共三十六页2、文件(wnjin)和数据Stata相关的文件有三类:数据文件,do-
2、file文件,log文件。1数据文件数据文件以后(yhu)缀“.dta”表示。数据文件是Stata处理和分析的对象。数据文件具有如下的逻辑结构:4共三十六页Variable 1Variable 2Variable n12n5其中每一行表示一个观测,每一列表示一个变量。每个观测都有一个编号(表1左起第1列),是系统自动加上去的。Stata对数据类型的区分不是很细致,分为(fn wi)数据型和字符型。缺失数据用“.”表示。共三十六页数据文件可以在Data Editor中生成,如图2所示。在方格中输入(shr)相应的变量名和数据后,点击Save按钮即可。如果数据是逗号分隔数值格式的文本文件 (.cs
3、v)insheet using “F:AEdataFees1.csv clear6共三十六页2do-file文件do-file文件以后缀“.do”表示(biosh)。在command窗口输入命令很不方便,而且也不利于保存对数据文件处理和分析的过程。替代的做法是使用工具栏中“New Do-file Editor”在Do-file中编写命令。可以在命令行输入doedit来编辑程序文件。7共三十六页在do-file文件中,用*表示注释内容,Stata在运行do-file文件时会跳过这些注释语句。加入(jir)注释语句能增强do-file文件的可读性。最好为每一个do-file文件写详细的注释内容。比
4、如文件名称,计量分析的目的,时间和结果存放位置。如果过程中生成并保存了数据文件,应写出相应数据文件的名称等。如果中途对do-file文件进行过修改,最好将修改过文件保存为另一个文件,以便于将来对比分析原文件和修改后的文件。8共三十六页3log文件log文件以后缀“.log”表示,用于记录Stata的运行结果。在开始运行Stata时,创建一个(y )log文件,并指定其路径和文件名,在结束运行时,再将其关掉,则可记录此间Stata的运行结果。9共三十六页例:(开始运行)log using D:Econometricslogfiles20091012.log.(Stata命令).log close
5、(结束运行)从而20091012.log就记录(jl)了从“log using”命令 到“log close”命令之间Stata运行的所有结果。10共三十六页3、语法(yf)和命令Stata的语法十分地简单和灵活。一个命令便构成了一条可执行的语句,在Stata Command中输入后,敲回车键就可以运行了。当然(dngrn)也可以将一组语句编成do-file文件。11共三十六页Stata命令可以大体上分成4类:help命令;针对memory的命令;处理和分析数据的命令;数学命令。现分述如下。help命令十分地简单。比如想了解“regress”的用法,可在Stata Command中输入如下语句
6、(yj)后回车:help regressStata会提供关于“regress”用法的详细说明,并配以例子。12共三十六页针对(zhndu)memory的命令有清空命令clear和设置memory大小的set memory命令。memory有一个默认的大小,但如果数据文件太大,必须重设memory的大小,例如:set memory 20m该命令将memory大小设为20兆。13共三十六页处理和分析数据(shj)的命令构成Stata命令的主体。它们可实现各种各样的功能,但大体具有如下的格式:by varlist1: command varlist2 if exp in range ,options
7、其中by varlist1:表示按一组变量(由varlist1指定)分组;command varlist2表示命令是针对由varlist2指定的变量;if exp表示命令只针对满足exp(一般是一个逻辑表达式)的观测;14共三十六页in range表示命令只针对处在range指定的范围内的观测,如in 5指执行(zhxng)的范围是第5个观测,in -5指执行的范围是倒数第5个观测,in 5/12指执行的范围是从第5到第12个观测;,options是命令特有的一些选项,根据情况和需要而定,Stata的强大功能主要就体现在这些选项上,选项的使用非常精细和讲究。15共三十六页if exp极大地体现
8、了Stata的灵活性。逻辑表达式exp一般由以下成分构成(guchng): 变量名 数字,字符,表示缺失值的“.” 关系运算符:=(等于),!=,(不等于),(大于),=(大于或等于),100000 & income=. (若income大于100000且不缺失,则新变量biginc为1,否则为0)。18共三十六页4.3对现有(xin yu)变量重新赋值replace oldvar = exp if exp in rangeoldvar为现有的变量。对满足if exp和in range的样本,oldvar将根据表达式exp重新赋值。比如,replace income=. if income=0
9、 (若income非正,令其取缺失值),replace age = 25 in 1007 (令第1007个观测中age为25)。19共三十六页4.4删除变量或观测drop varlist (去掉varlist指定的变量)drop _all (去掉全部(qunb)变量)drop if exp (去掉符合表达式exp的观测)drop in range (去掉处在range指定范围内的观测)20共三十六页4.5 保留变量(binling)或观测keep varlist (保留varlist指定的变量,其余变量去掉)keep if exp (保留符合表达式exp的观测,其余观测去掉)keep in r
10、ange (保留处在range指定范围内的观测)21共三十六页4.6观测重排sort varlist将全部观测按varlist指定的变量按升序排列。varlist中可以有不止一个变量,此时(c sh)排序与字典顺序相当。22共三十六页5、常用回归(hugu)分析回归是Stata最主要的功能之一。本部分主要介绍如何用Stata做线性回归,以及回归分析,并简单介绍用Stata做Logistic回归的方法。回归命令的选项也非常丰富(fngf),可以使用help regress / logit / probit / tobit 来了解。23共三十六页线性回归的命令有: regress y x1 x2
11、x3 (以y为被解释变量,x1,x2,x3为解释变量做回归;regress后第一个变量为被解释变量) regress y x1 x2 if exp in range (使用(shyng)满足if exp和in range的观测做回归)regress y x1 x2 x3, robust (regression with robust standard errors) regress y x1 x2 x3 aweight=w (WLS,以变量w为权重)24共三十六页线性回归的典型输出:Stata会报告(bogo)如下结果:方差分解,整体显著性检验的F统计量及相应的p值,R平方,调整后的R平方,M
12、SE的平方根(亦即对的估计),系数估计,系数估计的标准差,t值,显著性检验的p值,置信区间。25共三十六页回归后可以对系数做假设检验: 对单个参数的检验test labor (检验labor的系数是否(sh fu)显著)test labor = 1 (检验labor的系数是否为1) 对多个参数的检验test labor capital(零假设为labor和capital的系数都不显著)test labor=capital (检验labor和capital的系数是否相等)test labor+capital=1 (检验labor和capital的系数之和是否为1)26共三十六页回归后一般要做回归
13、分析,检验是否存在异常的观测,以及是否有异方差,自相关,共线性。回归分析一般依据(yj)回归残差进行。此时最重要的命令是predict,可以使用help predict指令来了解它。predict命令主要的功能如下: 拟合值相关predict yhat (yhat是任意指定的变量名,以下皆如此)predict e, resid (e是任意指定的变量名)27共三十六页对模型的检验:多重共线性检验:vif (variance inflation factors或方差膨胀因子。对每一个解释变量,都可以计算其方差膨胀因子。该因子越大,相应的变量越有可能是其它变量的线性组合。) 异方差检验hettest
14、 (test for heteroskedasticity)hettest x1 (同上,但此时我们(w men)有理由怀疑异方差可写成变量x1的函数) 自相关检验dwstat (Durbin-Watson自相关检验)durbina (Durbin-Watson h统计量)bgodfrey (Breusch-Godfrey LM 统计量)28共三十六页6、常用命令6.1 文件和系统管理insheet (导入外部数据)use (使用已有的数据文件)save (保存数据文件)log using / log close (log文件操作(cozu))cd (改变默认路径)set memory (设置
15、memory 大小)clear (清空memory)help / findit(查询帮助文档)29共三十六页6.2 数据管理list (展示数据)describe (数据文件的整体描述)rename(改变变量名)generate(生成新变量)replace(对现有变量重新赋值)drop(删除变量或观测)keep(保留(boli)变量或观测)sort(观测重排)merge / append(数据文件的合并)xi(生成虚拟变量)30共三十六页6.3 描述统计summarizetabstatsktest /swilk /ladder /gladder /qladder (正态性检验(jinyn)ta
16、bulatecorrelate、pwcorr(计算多个变量两两之间的相关系数)31共三十六页6.4 画图(hu t)histogram(直方图)graph box(box plot)graph pie(pie charts)kdensity(kernal density function)qnorm(QQ图)graph twoway scatter/line/connected(两个变量的散点图)graph matrix(多个变量的散点图)32共三十六页6.5 回归和回归分析(fnx)regress(线性回归)xi: regress(带虚拟变量的线性回归)test(假设检验)predictrv
17、fplot(与残差相关的图象)vif(共线性检验)hettest(异方差检验)dwstat /durbina /bgodfrey(自相关检验)33共三十六页347、 常用回归(hugu)模型Dependent variable (Y)ExamplesEstimation method(s)STATA command连续型Continuous(- Y +)汽车价格OLSregress二值变量Binary(Y = 0, 1)是否在劳动力市场上ProbitLogitprobitlogit离散不能排序Discrete and unordered(Y = 0, 1, 2,.)交通工具选择(train,
18、bus, car, bicycle)企业类型(private, public unquoted, quoted)Multinomial logitMultinomial probitmlogitmprobit离散可排序Discrete and ordered (Y = 0, 1, 2,.)对论文的意见 (adverse, modified, unmodified)Ordered probitOrdered logitoprobitologit共三十六页35Dependent variable (Y)ExamplesEstimation method(s)STATA commandDiscrete count data(Y = 0, 1, 2, )生育小孩的数量PoissonNegative binomialpoissonnbreg共三十六页内容摘要Stata 应 用 技 巧。其中每一行表示
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 信阳选调面试题库及答案
- 逐步提升系统分析师考试试题及答案
- 运营消保练习卷含答案
- 输气工(高级)理论复习测试附答案
- 面试指导系统分析师考试试题及答案
- 安全监管人员试题及答案
- 积累经验软件评测师试题及答案
- 2025贷款协议合同(民间借贷)
- 学生会组织面试题及答案
- 提高通过率的系统分析师试题及答案
- 浙江开放大学2025年《社区治理》终考测试答案
- 田亩转户协议书
- 资产委托购买协议书
- 2025-2030中国半导体行业市场现状供需分析及投资评估规划分析研究报告
- 庭院绿化养护合同协议书
- 退休返聘合同和协议书
- 2025年MySQL开发趋势试题及答案研究
- 山东省济宁市2025年高考模拟考试化学试题及答案(济宁三模)
- 胃癌护理个案护理
- 2025年汽车经销行业深度研究报告
- 河南2025年生态环境部黄河流域生态环境监督管理局生态环境监测与科学研究中心招聘笔试历年参考题库附带答案详解
评论
0/150
提交评论