




已阅读5页,还剩28页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,Stata简介及基本操作,一、为什么使用Stata?Stata是目前在欧美最为流行的计量软件,具有操作简单、功能强大的特点。由于使用Stata的用户很多,对于最新的计量方法,常常可以下载由用户写的Stata命令程序,十分方便。而官方的Stata版本也经常更新,以适应计量经济学迅猛发展的需要。Stata11已于2009年出版,但由于在中国普遍使用的仍是Stata10,我们主要介绍Stata10。,.,1.面临的问题研究者经常地希望利用多种方法从不同角度对数据进行分析,但拥有绝对优势的软件是不存在的,不存在哪个软件能解决所有的问题。计量经济学发展迅速,新的方法层出不穷,而软件公司将这些新方法嵌入到软件中是存在滞后的。,2.解决方案Stata以其操作简单、运行快速而精确,全面的数据管理功能,精致的作图,强大的统计与计量分析功能,简练标准的程序与矩阵运算功能、丰富的网络资源,在统计学、经济学、金融学、心理学、计算机科学、物理、化学等多个学科领域得到广泛使用。请浏览:,.,3.STATA简介:发展历史,(1)Stata是一个用于数据管理和分析的统计软件,由Stata公司(StataCorp)研制开发。从1985开始,先后开发了1.1,1.2,等多个版本。目前Stata的最新版本为2009年7月份推出的Stata11.0。(2)Stata11包括四种版本:Small(小型版)、IC(标准版)、SE(特别版)和MP(多处理器版)。其中属MP版本最为强大。MP版与SE版的功能完全相同,但MP版的运算速度比SE版的要快很多。用户可以在命令栏输入about查看所安装的Stata所属的版本。,.,(3)不同版本对样本容量、变量个数、矩阵阶数、宏的字符长度等有着不同的限制。以SE版为例,其最大变量个数为32767,最大字符长度为244字节,最大矩阵阶数为11000(即1100011000)。Stata默认值为:最大变量个数为5000,最大矩阵阶数为400,最大内存为50兆(在Stata10中为10m)。如果用户需要更多的内存或者更多的变量,可以在命令栏输入如下命令进行扩展。.setmaxvar#(.setmaxvar5000).setmaxsize#(.setmaxsize1000).setmemory#m(.setmemory50m),.,4.STATA简介:主要特点与功能统计分析与计量分析的结合:,(1)单元统计:描述统计、假设检验(参数、非参数)、ANOVA、质量控制、统计作图。(2)多元统计:MANOVA、主成分、因子分析、典型相关、聚类、判别分析、对应分析、多维标度。(3)线性回归、非线性回归、工具变量回归、广义线性回归、分位数回归(稳健回归)、系统方程模型(SUR、联立方程)、离散选择模型(二项选择、排序选择、多项选择、条件Logit、嵌套Logit模型、二元选择模型等)、计数模型(泊松回归、负二项回归)、截断与归并模型、海克曼选择模型、逐步回归(stepwise)等。,.,(4)时间序列分析:时间序列的平滑、相关图、ARIMAX、GARCH、单位根检验、Johansen协整检验、VAR、VEC、滚动回归等。(5)面板数据(线性模型、工具变量回归、动态面板、分层混合效应、广义估计方程(GMM)、随机边界模型等)。(6)调查数据分析(7)生存分析(8)蒙特卡洛模拟、自举法(bootstrap)、刀切法(jackknife),.,丰富的网络资源:http:/www.stata-http:/www.stata-严谨、简练、灵活的程序语言:Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数,也可以制作自己的对话框和窗口菜单。强大的矩阵运算功能:MataMata是Stata的矩阵运算语言,实现各种运算。兼容性:在Stata中可以直接运行其它程序;其他语言编写的程序可以作为插件(Plugin)直接嵌入到Stata中。,.,二、Stata的窗口安装好Stata后,点击电脑桌面上的Stata图标,即可打开Stata。此时可以看到,在最上方有一排菜单,即“FileEditDataGraphicsStatisticsUserWindowHelp”。在此之下,有四个窗口,分别为:,左上“Review”(历史窗口):此窗口记录着自启动Stata以来执行过的命令。,左下“Variables”(变量窗口):此窗口记录着目前Stata内存中的所有变量。,右上“Results”(结果窗口):此窗口显示执行Stata命令后的输出结果。,右下“Command”(命令窗口):在此窗口输入想要执行的Stata命令。,.,为了使屏幕分割更美观实用,可以用鼠标将以上窗口拉到任意大小与位置。然后点击菜单Edit”“Preferences”“GeneralPreferences”“Windowing”“Locksplitter”,就可以锁定当前画面,而在以后重启Stata时自动显示这个画面设置。,.,Stata的主界面,.,三、Stata操作,1将数据导入Stata打开Stata软件后,点击DataDataEditor图标,即可打开一个类似Excel的空白表格。然后,用Excel打开文件“实验数据.xls”,复制文件中的相关数据,并粘贴到DataEditor中。导入数据的另一方法是,点击菜单“File”“Import”,然后导入各种格式的数据。但这种方法有时不如直接从Excel表中粘贴数据来得方便直观。,.,关闭DataEditor后,即会看到左下方的“Variables”窗口出现了8个变量,分别为year、gdp、index、index1978、gov、pop、deflator、gcons。,.,此时,可以点击Save图标(也可以点击菜单“File”“Save”),将数据存为Stata格式的文件(扩展名为dta),比如wanger_law.dta。这样,以后就可以用Stata直接打开这个数据集了(不需要再从Excel表中粘贴过来)。打开的方式有两种。可以点击Open图标(也可以点击菜单“File”“Open”),然后寻找要打开的dta文件的位置。另外一种方法是在命令窗口输入以下命令(假设文件在E盘的根目录)并回车(按Enter键),,useE:wagner_law.dta,clear,其中,选择项“clear”表示可以替代内存中的已有数据。,.,如果要关闭一个数据集(如果对数据集进行了改动,别忘了先存盘Save),以便使用另外一个数据集,可以在命令窗口输入:.clear这样,内存中所有的当前数据都被清空,然后可以再打开另外一个数据集。,.,2变量的标签在变量窗口,每个变量的“名字”(Name)旁边显示了其“标签”(label)。但目前的标签过于简略,缺乏变量的解释信息。如果想将变量“gov”的标签改为“governmentexpenditures”,可进行如下操作。以鼠标的右键点击变量名“gov”,然后选择“Editvariablelabel”,输入“governmentexpenditures”即可。此时,再去看变量“gov”的标签,就已经改为“governmentexpenditures”。另外,在右上角的结果窗口出现了以下一行命令:.labelvariabletcgovernmentexpenditures,这表明,直接在命令窗口输入上面这行命令,也能达到一样的效果,但不如直接在变量上点击右键操作方便。,注意:Stata中字母的大小写是严格区分的,因此Stata建议对于变量名一律使用小写字母。,.,3审视数据一个数据集可能很大,而我们常希望看到数据的概貌。想看数据集中的变量名单、标签等,可以在命令窗口输入:.describe,如果想给整个数据集加上一个标签,以说明这个数据集来自“WagnerLaw1978-2009”,可输入命令:.labeldataWagnerLaw1978-2009,如果再次使用命令“describe”,就会看到数据集的标签“WagnerLaw1978-2009”。,如果想看变量gov、gcons与gdp的具体数据,可使用命令:.listgovgconsgdp,注意:如果数据较长,可用Ctrl+Break终止显示。,.,有时我们想对数据集的一部分执行命令,比如只想看变量gov与gdp的前5个数据,则可输入命令:.listgovgdpin1/5,也可以通过逻辑关系来定义数据集的子集。如果要列出所有满足条件“year1995”的变量gov与gdp的数据,则可以使用以下命令:.listyeargovgdpifyear=1995,其中,“=”表示“大于等于”。其他表示关系的逻辑符号为“=”(等于),“”(大于),“=2001,.,5考察变量的统计特征如果想看变量gov、gcons和gdp的统计特征,可输入命令:.summarizegovgconsgdp,VariableObsMeanStd.Dev.MinMaxgov3214454.1319217.21122.0976299.93gcons3211441.7612730.4148044396.9gdp3280670.9194125.313645.218340506.9,满足条件的统计:.summarizegovgconsgdpifyear2000,如果不指明变量,则将显示数据集中所有变量的统计指标。summarize,如果要显示内存中某些变量之间的相关系数,可输入命令:.correlategovgconspopgdp,.,5画图Stata具有很强的画图功能。如果想看变量q的直方图(假定组宽为1000),可输入以下命令:.histogramq,width(8000)frequency,.,由于直方图不连续,如果想看连续的经验分布图,可使用以下命令:.kdensitygov,.,如果要画gov与gdp之间的散点图,则可输入以下命令:scattergovgdp,.,如果想在散点图上同时画出回归直线,可以使用如下命令:.twoway(scattergovgdp)(lfitgovgdp),其中,“lfit”表示“linearfit”(线性拟合)。,.,6生成新变量如果要估计以下方程:,为了估计这个方程,需要在Stata中对原变量取对数,可使用命令“generate”。.generatelngov=log(gov).generatelngdp=log(gdp).reglngovlngdp,如果要生成“虚拟变量”,定义为:,Stata命令为:generatedum=(ifyear=1995),.,删除变量:drop变量名如:dropdum修改变量值replace变量名=表达式条件如:replacedum=0ifyear=1990,.,在执行Stata命令时,有时需要调用许多变量,而某些变量名可能很长。此时,如果在命令窗口一一输入变量名,可能较费事。解决方法之一是:可以直接在左下角的“变量窗口”单击需要的变量,则该变量名就会显现在命令窗口。解决方法之二是,如果有以下变量lnq1,lnq2,lnq30,而只想使用其中的前15个变量,则可以用lnq1-lnq15来简略地表示这15个变量。解决方法之三是,用“*”号来节省变量名的书写。假设想将内存中所有以“ln”开头的变量都去掉,则可输入命令:.dropln*,.,7Stata的计算器功能Stata也可以作为计算器来使用。只要输入命令“displayexpression”即可。比如“displaylog(2)”将计算ln2。,.,8线性回归分析使用OLS对方程进行估计,可输入命令:reglngovlngdp,上表中的“_cons”表示常数项,“R-squared”显示R2=0.9676,“AdjR-squared”显示0.9665。检验整个方程显著性的F统计量之p值(ProbF)为0.0000,显示这个回归方程是高度显著的。残差平方和为1.77,方程标准差RootMSE为0.24。,.,如果要显示估计系数的协方差矩阵,可输入命令,.vce其中,“vce”表示“variancecovariancematrixestimated”。,在进行回归时,如果不要常数项,可以加上选择项“noconstant”reglngovlngdp,noconstant,.,如果要计算被解释变量的拟合值,并将其记为lntchat,可输入命令:.predictlntchat,如果要计算“残差”(residual),并将其记为e1,可输入命令:.predicte1,residual其中,选择项“residual”表示预测残差。,.,9Stata的日志如果希望在每次使用Stata时,储存其运行结果,可点击菜单“File”“Log”“Begin”,然后输入日志(log)的文件名,并存储在你指定的位置。从此以后,你在Stata中的所有操作及其输出结果,都将被记录在此日志中,直至你选择退出。如果要暂时关闭日志(不再记录输出结果),可输入命令“logoff”。如果要恢复使用日志,可输入命令“logon”。如果要彻底退出日志,只要输入命令“logclose”即可。如果要查看日志文件中的内容,只要点击存储位置上的日志文件图标即可。,.,四、Stata命令库的更新由于Stata版本的不同(即使同为Stata10),如果你发现某些命令无法运行,可在命令窗口输入,.updateall这将更新你的Stata命令库(包括Stata的“ado”程序文件与其他可执行文件)。,.,五、进一步学习Stata的资源更多有关Stata的知识,将在本课程以后的内容
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 金提取炉项目可行性研究报告
- 第四单元 多姿多彩的乐音世界 第8课时音乐知识《室内乐》教学设计-2025-2026学年湘艺版(2024)初中音乐八年级上册
- 废旧塑料家具再生项目可行性研究报告
- DB65T 4136-2018 多浪羊两年三产繁殖技术规程
- 人力资源管理竞业限制协议3篇
- 合同标准版3篇
- Gerstmann综合征护理查房
- 四川省绵阳市涪城区2025届九年级下学期中考一模生物试卷(含答案)
- 河南省九师联盟2025-2026学年高三上学期开学考试数学试题含答案
- 部门用车安全培训课件
- 人教版:生命生态安全六年级上册教案
- 抖音洗浴按摩足浴商家本地团购短视频直播运营策划方案【抖音本地生活运营】
- 深水井施工方案
- 培养专业技术骨干证明
- 《藻类植物》授课课件
- 《禁骑电动自行车》班会课件
- 遂溪北潭临港产业规划方案
- 2024中国大学生消费洞察白皮书
- 基于机器学习的异常检测与预警机制
- 植物对环境变化的适应性
- 肿瘤的治疗方法-介绍手术、放疗、化疗、免疫治疗和靶向治疗等
评论
0/150
提交评论