Stata命令.docx_第1页
Stata命令.docx_第2页
Stata命令.docx_第3页
Stata命令.docx_第4页
Stata命令.docx_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Stata语句11.reg y x1 x2predict xxx 返回先前回归中因变量的拟合值,xxx随意变量名。predict newvar, stdp预测拟合值的标准差predict aaa,re 返回先前回归中因变量的残差, aaa为随意变量名。predict newvar, stdr预测残差的标准差predict newvar, xb 产生一个新变量其值为由上面回归方程计算的被解释变量的预测值。predict newvar, residual 产生一个新变量其值为由上面回归方程计算出的残差testx1检验变量x1的显著性,返回当X1系数为零时的F值,F值为回归报告中t值平方。test x1=x2检验x1 x2变量的系数是否相等。test x1*a=x2*ba,b为任意常数,检验变量x1与x2是否存在某种线性关系。2.tab x1,gen(x1)产生x1的虚拟变量。genfsize1=fize=1产生虚拟变量,如果family size为1,则令fsize1=1,否则为零。下同。genfsize2=fsize=2genfsize3=fsize=3genfsize4=fsize=4genfsize5=fsize=53.reg y x1 x2 x3,level(99) 返回回归报告中99%的置信区间。set level 97在以后的回归中都默认返回97的置信区间。reg y x1 x2 x3,noconstant无常数回归。4.display fprob(q, n-k-1, F)返回值为F,分子自由度为q,分母自由度为n-k-1的p值di tprob(n-k-1,t)返回值为t,自由度为n-k-1的p值5.stata中缺失值为无穷大值。regbwghtcigs parityfaminc iffatheduc. &motheduc,=逻辑运算符:&(与),|(或),(非)9.对现有变量重新赋值replace oldvar =exp if in , nopromote10.describe:报告样本容量、变量个数、变量名称等11.sortx1x2依次按升序排列gsort-x1按x1降序排列12.excle转为stata时日期变量的处理gen date(或任一新变量名)=date(原变量名,YMD/DMY/.)form date%td12. 删掉重复记录 duplicates drop13.独立样本均值差异检验ttestStata语句2* Introduction to Statalog using stata_fall.txt, text replace*使用日志(log)。它可以帮助我们记录stata的运行结果clear allset more off*关闭more选项。如果打开该选项,那么结果分屏输出,即一次只输出一屏结果。你按空格键后再输出下一屏,直到全部输完。如果关闭则中间不停,一次全部输出*cd D:/undergraECMT/data*进入数据所在的盘符和文件夹log using (文件名).log,replace *打开日志文件,并更新。日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果use /stat/data/hs0, clear*打开数据文件*insheet using intro_hs0.csv, clear*use intro_hs0, clear*Summarizing the datadescribe*可以告诉我们每一个变量的含义*具体了解每一个变量的特征,我们可以用 tabstat 命令。例如我们可以计算 wage 的均值,方差,中位数,范围,具体可以用 help tabstata 查询。tabstat wage, stats(mean)tabstat wage, stats (sd median range)*算 wage 的均值,方差,中位数,范围tabstat wage, by (educ) stats(mean)*不同教育水平的工资的均值summarize*总计全体,Summarize(Sum)将汇报数据的均值和方差等信息。summarize wage*有关工资的均值与方差*如果需要更详尽的信息,可以进一步使用后缀detailhistogram wage*画柱状图scatter wage educ*画出两个变量之间的分布关系graph twoway scatter wage educ*直观的看到教育水平变化时工资的变化,可以用 “scatter” 命令或者 “graph twoway scatter” 命令graph twoway line wage educ*“graph twoway”命令可以带别的后缀,例如 “graph twoway line” 则画的是线状图。graph matrix wage educ*了解更多的变量之间的关系graph matrix wage educ expergraph bar (mean) wage, over (educ)*了解y的平均值关于x分布的柱状图。list gender-read in 1/15*取1到15列数据列表summarize read math science write*read math science write的均值方差啊等信息summarize if read = 60*所有read大于60的均值方差summarize if prgtype = academic*所有prgty1pe = academic的均值,方差summarize read, detail*有关read的均值和方差,以及具体分布*Summarizing the data by grouptab prgtype*鎬荤粨prgtype鍐呭悇缁勬儏鍐?bysort prgtype: summarize read write*涓嶆噦.tabstat read write math, by(prgtype) stat(n mean sd)*Correlationscorrelate write read science*modifying the dataorder id genderlabel variable schtyp type of school *插入标签rename gender female *重命名gen score=read+write+math*在分析的过程中,有些变量并没有在数据中提供,需要我们用原始数据或者回归的结果构造。gen score2=score2gen pass=1 if score=150*生成pass=1,当成绩过150时*egen命令相对复杂一些,它能生成一些“gen”命令无法生成的变量。egen wagesum=sum(wage)*生成wagesum 为每个人的工资和egen wagemedian=median(wage)*生成 wagemedian 为工资的中位数(median)egen wagemax=max(wage)*生成wagemax 为工资的最大值egen wagemaxeduc=max (wage),by (educ)*产生一个变量“wagemax”为相同教育水平里的最高工资*replace*我们需要替换某一变量,我们可以用的命令是“replace”gen wagehigh=1 if wage=10replace wagehigh=0 if wagehigh =.*有时候我们在生成变量时可以加上一定条件,例如如果一个样本工资超过3,我们就定义它的变量wagehigh 的取值为1,否则为0。*注意是两个等号drop if read40drop schtyp*drop命令去掉过程中的暂用的变量,以方便我们浏览数据和重新定义变量count if wage100count if wage10*我们可以用“keep”或“drop”命令来删除一些样本,在删除之前,我们需要了解删除带来的影响,则可以用“count”命令来了解样本取值的情况。*Creating dummy variables*可以用“sort”和“list”命令来了解数据分布的细节sort prgtype*排序xi, prefix() i.prgtype*sort wagelist wage in 50/70*工资值从小到大排列在第50到70的样本的工资值。keep if wage=100*想保留工资小于100的样本,可以有上面两种命令*Generating variablesegen avgscore=mean(score)*生成avgscore为成绩的均值egen avggroupscore=mean(score), by(prgtype)*生成一个avggroupscore为在相同prgtype水平下的均值ttest y1=y2*检验变量y1和y2的平均值是否相等signtest y1=y2*秩检验,检验变量y1和y2的中值是否相等。检验y1的中值是否为5可用如下命令ttest write, by(female)*correlate wage educ exper tenure*报告变量之间的相关系数*Regressionreg write read female*进行 OLS 回归*表格中最后两行报告回归的斜率和截距的系数,相应的标准差、t值和P值,同时给出95%的置信区间。*在表格左上方,报告了回归的总变异、解释变异和残差变异。*表格右上方报告回归的R方和调整后的R方。*其中F是自变量所有的系数都为0(即自变量完全没有解释力)这样一个零假设对应的F分布值。*regression with dummy variablesxi: reg write read female i.prgtypereg write read femal IPTY1 IPTY2*Defining global variablesglobal ylist writeglobal xlist read female*using global variablesreg $ylist $xlist*using outreg2est store m1outreg2 m1 using test.doc, replace*生成word,文件名为test.docdisplay sqrt(5)*sin(0.5)*Stata 可以充当计算器用,使用 “display” 命令ssc install outreg2*从命令库下载命令,此处为下载outreg2 *using logoutlogout,save(test2) word replace: sum*将所有数据保存到word里*使用日志(log)。它可以帮助我们记录stata的运行结果log close*关闭日志文件exit,clear *退出并清空内存中的数据*补充1describe*describe命令可以描述数据文件的整体,包括观测总数,变量总数,生成日期,每个变量的存储类型(storage type),标签(label)等summarize varlist weight if exp in range ,detail*summarize可以提供varlist指定变量(可以不止一个)的如下统计量:Percentiles(分位数),四大最大的数和四个最小的数,Variance(方差),Std. Dev.(标准差),Skewness(偏度),Kurtosis(斜度)tabstat varlist weight if exp in range , stats(statname .) *tabstat提供, stats(statname .) 指定的统计量,*可供选择的有mean(均值),count(非缺失观测值个数),sum(总和),max(最大值)*range(最大值最小值),sd(标准差),var(方差),cv(变易系数标准差/均值),skewness(偏度),kurtosis(斜度),median(中位数),p1(1分位数,类似地有p5, p10, p25, p50, p75, p95, p99),iqr(interquantile range = p75 p25)。*t值是对单个变量显著性的检验,t值的绝对值大于临界值说明该变量是显著的,*要注意的是t检验是对总体当中变量是否是真正影响因变量的一个变量的检验,即检验总体中该变量的参数是否为零,*只不过总体中变量的参数永远未知,只能用其无偏估量(参数的样本估计量)来代替进行检验.*F值是对所有解释变量整体显著性的检验,其原假设是所有的解释变量的参数都为零,*而只要其中至少有一个解释变量的参数不为零就说明解释变量在整体上对因变量有显著性的影响,*但仅依靠F检验是无法判断究竟哪个自变量对因变量有显著性的影响,必须进一步对每一个变量进行t检验。*R平方值表明了模型对样本数据的拟合程度,其值越高说明模型对样本数据拟合得更好*要注意R平方值是样本依赖的,就是说R平方值判别模型的一个潜在的假设是你所抽取的样本是真正来自于你所研究的总体*而现实当中这一点往往难以做到。我们进行计量经济分析的最终目的是要依据样本数据来研究总体的规律性*那么相应的检验也是要对总体进行,而R平房值的高低仅代表模

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论